ChatGPT — GPT-5.5 Instant 上線,幻覺少了一半

GPT-5.5 Instant 成為預設模型

OpenAI 在 5 月初把 ChatGPT 的預設模型換成 GPT-5.5 Instant。數字上最值得注意的:比上一代 GPT-5.3 Instant 在高風險情境(醫療、法律、財務)的幻覺錯誤少了 52.5%,一般對話的不準確回答也少了 37%。回答變得更短、更直接,問廢話的頻率也降低了。

這對你的意義是:如果你上個月覺得 ChatGPT 回答變得比較清楚、不再長篇大論,就是這次更新的結果。不需要改任何設定,已經自動生效。

個人化記憶擴大範圍

Plus 和 Pro 用戶現在可以讓 ChatGPT 在回答時參考你過去的對話記錄、上傳的檔案,甚至 Gmail 內容。系統會標示「記憶來源」,你也可以刪除或修正它記錯的東西。

這對你的意義是:ChatGPT 開始愈來愈像一個「認識你」的助理,而不只是每次重新認識你的工具。對於長期使用的人,這個差距會愈來愈明顯。

Claude — 多代理人正式開放測試

Managed Agents 公開測試:Claude 可以自己跑流程了

Anthropic 在 5 月 6 日宣布 Multiagent Sessions 和 Outcomes 進入公開測試。簡單說:你可以設定一個目標,讓 Claude 自己規劃步驟、使用工具、跑完整個流程,不需要你一步一步下指令。同一天也開放了 Webhooks 支援,讓 Claude 完成任務後可以主動通知你的系統。

這對你的意義是:這是 AI 從「工具」變成「代理人」的實際一步。對開發者和企業來說,可以開始設計讓 Claude 自動執行的工作流程;對一般用戶,這類能力半年內就會出現在日常介面裡。

Agent 記憶功能開放

4 月 23 日,Claude Managed Agents 的記憶功能也進入公開測試。代理人可以在不同工作 Session 之間保留資訊,不需要每次重新說明背景。

這對你的意義是:AI 代理人的短板之一就是「沒有記憶」。這個功能補上了這個缺口,讓 Claude 在重複性任務上的表現更接近真正的助理。

Gemini — 圖像搜尋和 Webhooks 同步上線

File Search API 支援圖像

Gemini 的 File Search API 現在可以原生搜尋圖像,用的是 gemini-embedding-2 模型。你可以把圖片上傳進去,之後用文字描述來搜尋,系統會直接找到相關的視覺內容並標註來源。

這對你的意義是:對需要管理大量圖片素材的團隊(品牌、設計、電商)很實用。以後不需要靠檔案名稱或手動標籤,AI 直接看懂圖片內容。

⚠️ 重要:Gemini API 架構將在 5/20 變更

Google 宣布 Interactions API 的請求架構將在 5 月 20 日改為新版本預設,舊版架構預計 6 月 6 日移除。如果你有在用 Gemini API 串接服務,這週要確認一下。

這對你的意義是:如果你是開發者或用 Gemini API 做了任何整合,5/20 前要確認是否需要更新。一般用戶不受影響。

這週看下來

三個平台這週的方向很一致:都在往「代理人」靠攏。OpenAI 讓模型記得你是誰、Anthropic 讓 Claude 自己跑流程、Google 讓 Gemini 搜尋到圖像。這不是三家公司在做不同的事,是同一件事在同一個時間點推進。

六個月前大家還在討論 AI 能不能「幫你寫文案」。現在的問題已經變成 AI 能不能「幫你跑一整個行銷流程」。速度比大多數人預期的快。