ChatGPT — 即時語音可以「看」你的螢幕了

Advanced Voice Mode 整合螢幕共享

OpenAI 本週更新了 Advanced Voice Mode,Plus 和 Pro 用戶現在可以在語音對話的同時分享螢幕畫面。你說「這個合約哪裡有問題」,ChatGPT 一邊看文件、一邊口頭跟你解釋。不需要截圖、不需要描述,就是直接給它看。

這對你的意義是:語音 + 視覺同步,讓 AI 助理的使用體驗往前跨了一大步。以前你要花時間把「狀況」轉換成文字描述,現在直接讓它看。對需要即時處理文件或畫面的工作場景,這個更新很實際。

Canvas 開放 API 整合

OpenAI 的 Canvas 功能(即時協作編輯介面)本週開放給開發者透過 API 串接。這意味著你可以把 Canvas 的「即時共編」能力嵌入自己的產品或工作流程,不限於 ChatGPT 的原生介面。

這對你的意義是:如果你的團隊有在用 ChatGPT Plus 共同編輯文件,未來可能有更多工具把這個體驗帶進來。對開發者來說,這是一個值得追蹤的 API。

Claude — Claude 4 Sonnet 正式發布

Claude 4 Sonnet:推理能力大幅提升

Anthropic 在本週正式宣布 Claude 4 Sonnet 上線。官方公布的數字顯示,在複雜推理任務(多步驟邏輯、數學、程式碼)上的表現比 Claude 3.7 Sonnet 提升約 40%。同時支援 200K 的脈絡視窗,上傳整本書、整份合約不是問題。

這對你的意義是:如果你之前用 Claude 處理長文件或複雜分析,現在可以更有信心。Claude 一直在「準確性」這條路上走得比較穩,這次升級延續了這個方向。

多代理人工作流程正式上線(脫離測試版)

上兩週還在公開測試的 Claude Multiagent Sessions,本週正式進入穩定版。企業帳號可以設定讓多個 Claude Agent 分工合作,一個負責收資料、一個負責分析、一個負責產出報告,整個流程自動跑完。

這對你的意義是:這是「AI 做事」而不是「AI 回答」的里程碑。對中小企業來說,短期內這個能力還要透過有技術能力的人來設定,但半年內會有更多無需寫程式的介面出現。

Google — Google I/O 2026:AI Search 重大改版

Google Search 加入 AI Mode,改寫搜尋邏輯

Google I/O 2026 最大的消息:Google Search 正式推出 AI Mode,預設開啟給美國用戶,其他地區陸續展開。輸入問題後,搜尋結果頁面上方會出現一段 AI 整合回答,下方才是傳統連結。Google 的說法是「搜尋不再只是找網頁,而是直接給你答案」。

這對你的意義是:如果你的生意靠 Google 搜尋帶流量,這是你現在最需要關注的事。傳統 SEO 邏輯(排第一頁)開始被「AI 有沒有提到你」取代。Google 我的商家的資料完整度、評論數量、官網說明的清晰度,會決定你出不出現在 AI 的回答裡。

NotebookLM 新功能:互動式音訊討論

Google 也在 I/O 宣布 NotebookLM 新功能「Interactive Audio」,讓原本的 AI 播客功能變成雙向對話。你可以在 AI 主持人講到一半時插話、追問,系統會即時調整討論方向。

這對你的意義是:對需要消化大量文件的工作者(研究員、顧問、老師),NotebookLM 的門檻又降低了一層。以前要打字問,現在直接說話,它回你。

這週看下來

這週是今年 AI 最密集的一週。OpenAI 加強語音與視覺整合,Anthropic 把多代理人推出測試版,Google I/O 宣布 Search 改版——三件事撞在一起,方向都指向同一個地方:AI 不再只是一個你去問問題的地方,而是主動參與你工作流程的角色。

對一般用戶來說,最值得本週就行動的一件事是:把你的 Google 商家資料更新完整。Google AI Mode 的到來不是六個月後的事,是正在展開的現在。你的資料準備好了,它才找得到你。