[週報] 2026年5月7日 ChatGPT、Claude、Gemini 重要更新整理

ChatGPT — GPT-5.5 Instant 上線，幻覺少了一半

GPT-5.5 Instant 成為預設模型

OpenAI 在 5 月初把 ChatGPT 的預設模型換成 GPT-5.5 Instant。數字上最值得注意的：比上一代 GPT-5.3 Instant 在高風險情境（醫療、法律、財務）的幻覺錯誤少了 52.5%，一般對話的不準確回答也少了 37%。回答變得更短、更直接，問廢話的頻率也降低了。

這對你的意義是：如果你上個月覺得 ChatGPT 回答變得比較清楚、不再長篇大論，就是這次更新的結果。不需要改任何設定，已經自動生效。

個人化記憶擴大範圍

Plus 和 Pro 用戶現在可以讓 ChatGPT 在回答時參考你過去的對話記錄、上傳的檔案，甚至 Gmail 內容。系統會標示「記憶來源」，你也可以刪除或修正它記錯的東西。

這對你的意義是：ChatGPT 開始愈來愈像一個「認識你」的助理，而不只是每次重新認識你的工具。對於長期使用的人，這個差距會愈來愈明顯。

Claude — 多代理人正式開放測試

Managed Agents 公開測試：Claude 可以自己跑流程了

Anthropic 在 5 月 6 日宣布 Multiagent Sessions 和 Outcomes 進入公開測試。簡單說：你可以設定一個目標，讓 Claude 自己規劃步驟、使用工具、跑完整個流程，不需要你一步一步下指令。同一天也開放了 Webhooks 支援，讓 Claude 完成任務後可以主動通知你的系統。

這對你的意義是：這是 AI 從「工具」變成「代理人」的實際一步。對開發者和企業來說，可以開始設計讓 Claude 自動執行的工作流程；對一般用戶，這類能力半年內就會出現在日常介面裡。

Agent 記憶功能開放

4 月 23 日，Claude Managed Agents 的記憶功能也進入公開測試。代理人可以在不同工作 Session 之間保留資訊，不需要每次重新說明背景。

這對你的意義是：AI 代理人的短板之一就是「沒有記憶」。這個功能補上了這個缺口，讓 Claude 在重複性任務上的表現更接近真正的助理。

Gemini — 圖像搜尋和 Webhooks 同步上線

File Search API 支援圖像

Gemini 的 File Search API 現在可以原生搜尋圖像，用的是 gemini-embedding-2 模型。你可以把圖片上傳進去，之後用文字描述來搜尋，系統會直接找到相關的視覺內容並標註來源。

這對你的意義是：對需要管理大量圖片素材的團隊（品牌、設計、電商）很實用。以後不需要靠檔案名稱或手動標籤，AI 直接看懂圖片內容。

⚠️ 重要：Gemini API 架構將在 5/20 變更

Google 宣布 Interactions API 的請求架構將在 5 月 20 日改為新版本預設，舊版架構預計 6 月 6 日移除。如果你有在用 Gemini API 串接服務，這週要確認一下。

這對你的意義是：如果你是開發者或用 Gemini API 做了任何整合，5/20 前要確認是否需要更新。一般用戶不受影響。

這週看下來

三個平台這週的方向很一致：都在往「代理人」靠攏。OpenAI 讓模型記得你是誰、Anthropic 讓 Claude 自己跑流程、Google 讓 Gemini 搜尋到圖像。這不是三家公司在做不同的事，是同一件事在同一個時間點推進。

六個月前大家還在討論 AI 能不能「幫你寫文案」。現在的問題已經變成 AI 能不能「幫你跑一整個行銷流程」。速度比大多數人預期的快。

[週報] 2026年5月7日三個平台，這週發生了什麼