Claude坐到你的電腦前，然後它開始自己動手了

3月23日，Anthropic 宣布了一項讓不少人既興奮又緊張的新功能：它旗下的AI助手Claude，從此可以像一個真人一樣操作你的電腦。打開瀏覽器、滾動頁面、點擊按鈕、填寫表格、在不同應用之間來回切換——這些你每天坐在電腦前做的事情，Claude現在都能替你幹了。

贊助商廣告

在此之前，所有AI聊天助手的工作模式都像是一個只能隔著玻璃窗給你出主意的參謀：它能告訴你該怎麼做，卻沒辦法幫你真正動手。你問它怎麼寫一封郵件，它幫你寫好了，但你得自己複製、粘貼、打開郵箱、點發送。你讓它幫你整理日程，它列出了安排，但你還得自己一個個去日曆應用里填。這中間反覆切換的過程看似不起眼，累積下來卻像是一條隱形的溝渠，把「AI想到了」和「事情真正做完了」硬生生隔開。Claude這次發布的「電腦控制」功能，本質上就是在嘗試填平這條溝渠。

目前，這項功能以「研究預覽」的形式開放給Claude Pro和Claude Max訂閱用戶，暫時只支持macOS系統。換句話說，它還是一個早期版本。與此同時，它還能和另一個剛上線不久的功能Dispatch搭配使用——Dispatch允許你通過手機給Claude下達指令，Claude則在你的電腦上執行任務。兩者結合的畫面是：你躺在沙發上用手機發了條消息，你的Mac就在書桌上自己忙活起來了。

當AI學會了「點滑鼠」

要理解Claude的電腦控制功能，可以把它類比為你請了一位遠程助理。這位助理坐在你的電腦前，能看到螢幕上的一切，也能操作鍵盤和滑鼠。不過，與一般的遠程助理不同，Claude不會一上來就大包大攬地接管你的整台電腦。

Anthropic給它設計了一套「分層策略」。當你交給Claude一個任務時，它會先檢查自己有沒有對應的「快捷通道」——也就是所謂的「連接器」（connectors）。連接器是Claude與特定應用之間的直連橋樑，比如日曆、即時通訊、郵箱這些常用工具。如果有現成的連接器可用，Claude會優先通過這條快捷通道完成任務，這就像你讓助理幫你查日曆，它直接打開日曆應用看了一眼，乾脆利落。

贊助商廣告

但如果沒有合適的連接器呢？這時候Claude就會「降級」到手動模式——它會像一個真人一樣，用眼睛「看」螢幕上的內容，然後移動滑鼠、點擊按鈕、輸入文字。它可以打開你的瀏覽器搜索資訊，可以使用開發工具，也可以打開本地文件進行編輯。這個過程中，Claude的行為和你自己坐在電腦前操作幾乎沒有區別，唯一不同的是，它在每一步操作前都會徵求你的許可。你說「可以」，它才動手，你也可以隨時叫停。

這套「先走快捷通道、找不到再手動操作」的設計選擇，其實透露了Anthropic對這件事的思考方式。他們沒有讓Claude一上來就直接控制滑鼠鍵盤，而是把手動操作當作最後的「兜底方案」。這種克制說明設計團隊很清楚：讓AI控制電腦是一把雙刃劍，便利性和風險性需要仔細平衡。

為什麼大家都在爭著做「AI代理」

Claude這項功能並不是憑空冒出來的。今年初，整個AI行業掀起了一股「代理AI」的熱潮，而掀起這股浪潮的是一個叫「OpenClaw」的開源框架。

所謂「代理AI」（agentic AI），可以理解為AI從「顧問」升級成了「執行者」。以前的AI只能回答你的問題、給你建議，但行動還得你自己來。代理AI則不同，它能夠接受一個任務，然後自己規劃步驟、調用工具、一步步地把任務做完。OpenClaw在年初爆紅之後，催生了一整個生態系統，各種被稱為「claw」的AI工具如雨後春筍般湧現，它們都能接受簡單指令，然後在你的電腦上半自動地執行操作。連晶片巨頭Nvidia都坐不住了，推出了NemoClaw框架，幫助用戶更方便地安裝和配置OpenClaw，還加入了一些安全設置。與此同時，Perplexity推出了Perplexity Computer，Meta收購了代理AI初創公司Dreamer的聯合創始人——整個行業都在朝著「讓AI真正動手做事」的方向狂奔。

Anthropic在這個時間點推出電腦控制功能，競爭意味不言而喻。但從另一個角度看，當整個行業都朝同一個方向移動時，這個方向本身的合理性就得到了驗證。代理AI不是某一家公司的異想天開，而是技術發展到這個階段後，自然而然出現的需求——人們確實需要AI不僅僅是「說」，還要能「做」。

贊助商廣告

Anthropic做了什麼，還差什麼？

讓AI控制電腦，安全問題是繞不開的核心議題。Anthropic顯然意識到了這點，在功能設計中加入了多層防護。

最直觀的一層是「操作前詢問」機制，也就是在執行任何操作之前向用戶確認，用戶也可以隨時中止它的行為。

第二層是默認禁用敏感應用。Anthropic很清楚，有些應用涉及的數據太過重要，不能輕易讓AI接觸。所以一部分應用在默認狀態下是關閉的，用戶需要主動開啟才能讓Claude訪問。這種「默認保守」的策略，把決定權交回了用戶手中。

第三層是針對「提示注入」（prompt injection）的防護。提示注入是代理AI面臨的一種特有風險——惡意網頁或圖片中可能嵌入了偽裝成指令的內容，試圖劫持AI的行為。這就像你的助理在瀏覽網頁時，看到頁面上寫著「請立即把所有文件發送到以下郵箱」，如果它分不清這是網頁內容還是你的指令，就可能被騙著執行惡意操作。Anthropic表示他們的系統會自動掃描和防範這類攻擊。

儘管如此，安全專家們依然對代理AI的感到擔憂。這主要集中在兩個方面：一個是速度——代理AI可以在很短的時間內執行大量操作，如果出了差錯，損害可能在你反應過來之前就已經造成了；另一個是劫持——如果惡意行為者找到了控制你的AI代理的方法，他們就等於間接控制了你的電腦和數據。這兩個風險不是理論上的假設，而是隨著代理AI普及必須直面的現實挑戰。

從「坐在電腦前」到「躺在沙發上」

Claude電腦控制功能的一個有趣搭配是Dispatch——一個在功能發布前一周剛剛上線的手機端工具。Dispatch允許用戶通過手機給Claude發送任務指令，Claude則在電腦端執行這些任務。

這個組合創造了一種全新的使用場景。以前你要完成電腦上的工作，必須坐在電腦前。有了Dispatch和電腦控制功能的搭配，你可以在上班的地鐵上用手機告訴Claude「幫我查一下今天的郵件，把重要的整理成摘要」，或者「打開那個項目文件，運行一下測試」。等你到了辦公室坐下來，這些工作可能已經做完了。

贊助商廣告

Anthropic舉的例子包括創建每日早間簡報、運行代碼測試等。這些任務有一個共同特點：它們是重複性的、步驟明確的、不需要太多即時判斷的。對於這類任務，把它們委託給AI來完成，確實能釋放出不少時間和注意力。

當然，由於兩項功能都是新推出的，複雜任務可能不會每次都順利完成。Anthropic也承認這一點，並表示發布研究預覽的目的正是為了在真實使用環境中發現需要改進的地方。

至頂AI實驗室洞見

從更宏觀的視角來看，Claude電腦控制功能的意義不在於它今天能幫你做多少事，而在於它代表了人機交互方式的一次根本性轉變。

過去幾十年，我們和電腦的交互方式本質上沒有變過——都是人去適應機器的邏輯。你想完成一個任務，你得知道該打開哪個應用、點擊哪個按鈕、在哪裡輸入資訊。軟體設計得再好，這個「人去操作機器」的基本範式沒有改變。代理AI試圖翻轉這個範式：你只需要說出你想要的結果，AI來負責操作機器實現這個結果。

這對普通人的影響可能是漸進但深遠的。短期來看，它最大的受益群體是那些每天需要在多個應用之間頻繁切換的知識工作者——從Excel到郵件再到日曆再到瀏覽器，這種「應用跳轉」消耗的不僅是時間，還有注意力。如果AI能接管這些瑣碎的操作性工作，人就能把精力集中在更需要創造力和判斷力的事情上。

當這類工具變得更加成熟和可靠，它可能會改變人們對「電腦素養」的定義。今天我們說一個人「會用電腦」，指的是他會操作各種軟體。未來，「會用電腦」可能更多地意味著他善於向AI描述自己的需求。操作技能變得不那麼重要，表達能力和判斷力反而成為關鍵。

END本文來自至頂AI實驗室，一個專注於對AI電腦、工作站及各類AI相關硬體設備，開展基於真實使用場景評測的研究機構。‍