宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

ChatGPT 的「Operator」模式賦予 AI 真正的自主性 - 既令人興奮又令人恐懼

2025年01月29日 首頁 » 熱門科技

 

ChatGPT 的「Operator」模式賦予 AI 真正的自主性 - 既令人興奮又令人恐懼

 

 

OpenAI 的全球知名 AI 聊天機器人 ChatGPT 正在快速疊代更新,而最新的更新可能是迄今為止最重大的進步。

ChatGPT 在兩年多前剛推出時,與今天相比還很"簡陋"。自那時起,它已經進化出瀏覽網頁、理解圖像、記憶資訊、更有效推理,甚至可以在離線狀態下工作的能力。

然而,與即將到來的更新相比,這些進展可能都會相形見絀。

ChatGPT 的最新升級版本 - 被稱為 Operator 的功能,使其能夠完成比以往更複雜的任務,包括與其他網頁和服務進行交互。

最重要的是,它能夠自主完成這些任務 - 無需人類手把手地指導每一步操作。

簡而言之,Operator 是 ChatGPT 首次嘗試成為真正的 AI 代理 - 一種具備遠超簡單聊天機器人能力的新型 AI 工具。

那麼,什麼是 AI 代理?為什麼它們被認為是 AI 發展的下一個重要飛躍?Operator 是否標誌著一個全新智能應用、工具和服務時代的到來?

什麼是 AI 代理?

首先,當我們談論 AI 代理時,我們指的是什麼?為什麼這麼多人認為它們如此重要?

OpenAI 將代理定義為"能夠為你完成工作"的 AI 工具。

常規的生成式 AI 工具(如 ChatGPT)難道不能做到這一點嗎?它們確實可以起草郵件、總結文檔和翻譯語言。但代理能夠執行涉及多階段指令的更複雜任務。

區別在於:常規 ChatGPT 通常只執行單個指令(稱為"提示"),然後將控制權交回給人類用戶,等待下一步指示。

相比之下,自主代理可以執行提示,然後利用結果自行判斷下一步該做什麼,無需人類干預。

它始終致力於實現人類最初給定的目標,但會運用自身的知識、邏輯和推理能力來確定實現目標所需的各個步驟。

Microsoft - 另一個堅信 AI 代理力量的公司 - 描繪了一個未來願景:AI 代理最終將成為我們的 AI 同事,全天候為我們工作,使我們能夠將時間用於需要人類參與的任務。

Operator 是如何工作的?

這些都很令人興奮,但 ChatGPT 的 Operator 實際上是如何實現這些功能的呢?

本質上,它是通過將 ChatGPT 已經聞名的自然語言和視覺能力與通過網路界面與第三方工具和插件交互的能力相結合來實現的。

根據 OpenAI 的公告,它建立在一個被稱為電腦使用代理 (Computer-Using Agent, CUA) 的新 AI 模型基礎上。CUA 經過訓練,能夠使用圖形用戶界面 - 在這種情況下是網路瀏覽器 - 配合其基於 GPT4 的視覺能力,使其能夠導航按鈕和菜單,以及解釋文本。

這意味著,例如,它可以瀏覽和在線購物、研究旅行計劃、搜索最便宜的航班並進行預訂,或者規劃膳食計劃,然後安排所有食材的配送。

從本質上說,Operator 使 ChatGPT 從簡單地響應用戶提示,躍升到能夠主動確定並部署完成任務所需的指令。

邁向通用人工智慧?

對我來說,Operator 真正令人興奮的地方在於,它代表著朝著當前 AI 發展的"聖杯" - 通用人工智慧 (AGI) 邁出的又一步,儘管可能只是一小步。

通常被稱為 AGI 的通用人工智慧指的是能夠學習完成幾乎任何任務的 AI。這與目前大多數被認為是"狹義"的 AI 形成對比,因為後者只能在其設計的任務領域內工作。

需要明確的是,代理型 AI 與通用 AI 並不相同。但是,賦予機器自行完成複雜任務的能力顯然是最終創造 AGI 所必需的。

OpenAI 已經明確表示,推進通向 AGI 的最終目標是其首要任務。因此,在這種背景下,其目前對代理型 AI 的關注當然不足為奇,這也是我們可以預期未來 AI 發展方向的良好指標。

那麼,這對我們當前意味著什麼?

Operator 目前作為研究預覽版向美國的 ChatGPT Pro 訂閱用戶開放。

OpenAI 希望企業能夠利用它創建自己的代理,使代理型 AI 成為每個人日常工作流程的一部分。

它已經在與 Doordash、Instacart、OpenTable 等多家公司合作開發面向公眾的應用。但是,除了這些知名企業外,許多小型企業也完全可以為自己的內部使用創建代理,就像他們在過去兩年使用 OpenAI 的 GPT API 一樣。

Operator 當然不是第一個推出的 AI 代理。開源代碼庫 Hugging Face 上已經有大量在過去兩年開發的模型。

然而,通過將它們集成到其廣受歡迎的 ChatGPT 平台中,OpenAI 將使代理型 AI 對可能缺乏技術技能來構建開源技術的數百萬個人和企業變得可訪問。

需要注意的是,截至撰寫本文時,這一切都處於非常早期的階段,初步印象是在代理型 AI 真正準備好進入主流之前,還有許多bug需要解決。

更不用說讓 AI 自主行動所帶來的安全隱患了 - 它們可能會進行購買並以可能出錯的方式與世界互動!

儘管如此,ChatGPT 的這一最新版本無疑是我們近期在公開可用的 AI 領域看到的最令人興奮的發展之一,很可能會為更多創新打開大門。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新