分享
想像一下,當你還在通勤的火車上,只要拿起手機下達指令,辦公桌上的電腦就會自動打開瀏覽器、整理數據,甚至幫你完成複雜的專案。Anthropic 於 2026 年 3 月在 Claude 模型推出的「Computer Use」(電腦操作)功能,讓彷彿科幻電影的場景成為現實,目前以 Beta 版開放給 macOS 用戶。
Computer Use 是什麼?
簡單來說,這項功能讓 Claude 模型,包含 Opus 4.6 與 Sonnet 4.6 等版本,能夠像人類一樣,自主地透過讀取螢幕截圖與控制滑鼠、鍵盤來進行多步驟的深度互動。為了滿足不同需求,官方將此技術分為「一般用戶端應用程式」與「開發者端 API」,兩者在運作機制與使用門檻上各有不同的規範。
同步推出 Dispatch 跨裝置連動新功能
對於一般使用者,官方同步在 Claude Cowork 與 Claude Code 這 2 款應用程式中,推出名為 Dispatch 的新功能。透過 Dispatch,使用者可以在手機上直接指派任務給 Claude,涵蓋 3 大生活情境:在搭車時讓電腦製作早晨簡報、在開發環境中修改程式碼並發起拉取請求(PR),或是讓它接手持續推進 3D 列印專案。
限定 macOS 作業系統與 Pro / Max 用戶使用
在安全性與硬體限制上,消費端應用程式擁有內建的防護機制,Claude 在存取新應用程式前,一定會尋求使用者的明確許可。此外,目前這項桌面連動功能僅開放給 Claude Pro 以及 Claude Max 的訂閱用戶,並且僅支援 macOS 作業系統;要順利執行跨裝置連動,使用者的桌面版應用程式必須保持在喚醒且執行中的狀態。
破除安全疑慮!揭密 Agent Loop 運作原理
對於想自己開發自動化工具的開發者,可以透過 Computer Use 的 API 來串接使用。
很多人擔心開放 API 會讓 AI 像駭客一樣為所欲為,但其實並非如此——AI 的每一個動作都需要經過開發者的授權才能執行。這套機制稱為 Agent Loop(代理迴圈):AI 做一步、回報一步,開發者確認後再繼續,整個過程是有來有往、受人控制的,而不是 AI 自行其是。
這個宛如幕後魔法的 Agent Loop 運作原理,在官方定義中可拆解為應用程式端的 4 大步驟:
- 接收請求:應用程式接收 Claude 發出的工具使用請求。
- 轉換動作:將請求轉換為虛擬環境中的實際操作,如控制滑鼠或鍵盤。
- 捕捉結果:執行後,應用程式會拍下螢幕截圖或擷取指令的輸出結果。
- 回傳模型:將這些最新狀態回傳給 Claude。
只要尚未達成用戶最初的目標,系統就會在沒有用戶介入的情況下,持續重複這 4 個步驟,不斷循環直到任務完成。
官方提醒:開發者務必在獨立的沙盒環境中執行
針對 API 開發者,官方文件明確列出了 8 大 Beta 版限制與潛在風險,包含:處理速度延遲較高、電腦視覺座標判斷偶有誤差、模型工具選擇的可靠性、頁面滾動問題、複雜試算表互動易出錯、在社群平台建立帳號或生成內容的能力受限,以及防範系統漏洞與非法行為。
在安全漏洞防範上,API 端內建了分類器防護層,若在截圖中偵測到潛在的「提示詞注入」(Prompt Injection)攻擊,會自動引導模型暫停並要求使用者授權同意。然而官方警告,即使有這層防護,網頁或圖片中的惡意文字仍有可能導致模型犯錯,因此開發者必須在獨立的沙盒、虛擬機或 Docker 容器中執行此功能以降低風險。此外,對於牽涉真實世界影響的操作,如金融交易等,開發者也必須在系統架構中設計人類審查機制,由真人把關最後一哩路。