宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

DeepMind公布集成2種思維模式的Talker-Reasoner AI代理人框架

2024年10月27日 首頁 » 熱門科技

DeepMind公布集成2種思維模式的Talker-Reasoner AI代理人框架


Google DeepMind上周公布具備2種思維模式的系統框架,可讓AI代理人(agent)能兼具快、慢思考的效益。

現有大型語言模型能以自然語言和用戶互動,具有二種能力,包括對話和規劃/思考。DeepMind團隊設計的一種由雙系統組成的Talker-Reasoner代理人框架,能同時執行對話及多步驟推理任務,一如由以色列諾貝爾經濟學家Daniel Kahneman提倡的「快思慢想」(之後也被翻譯成多國語言版本,包括繁中版)的人類一樣。

DeepMind設計的雙系統代理人框架中,系統1 Talker LLM能執行快速、直覺及合成語言回應,負責感知觀察外界、獲得用戶回應,並且以自然對話和用戶互動。系統2 Reasoner LLM負責解決複雜的問題,這涉及從外界取得資訊增強其知識,像是調用工具、從外部資料庫獲取資訊。相較Talker LLM的快速回應,Reasoner的運行更為緩慢、深刻及具邏輯性,包含多階段推理和規劃、調用、執行行為等動作。Talker和Reasoner之間經由共同內存互動。Reasoner獲得知識後,除了執行行為,也更新其(內存中的)知識信仰,並提供Talker產生新的說話內容。在接獲用戶互動輸入問題時,Talker可以以現有知識為基礎、提供直覺回應,也可以等待Reasoner代理人產出知識,延遲回應用戶。

DeepMind團隊利用Gemini 1.5 Flash設計出錯含雙系統AI代理人,在測試中,讓該系統扮演用戶睡眠指導顧問,在聽取用戶說明後,提供改善睡眠的建議。研究團隊發現,系統在「理解」用戶問題階段,其代理人(Talker)直覺化、流暢回應用戶,但當Reasoner未能理解其指導是哪個階段時,會提供較直覺化而無用的建議。例如使用降噪窗簾及隔音板。為解決此問題,研究團隊加入「指導」階段說明,Talker一旦讀取到指導階段時,就會等待Reasoner提供的資訊,而非直覺回應用戶。這時系統2就取得主導,而非只給系統1產出的回應,例如為房間換顏色柔和的壁紙。

研究人員指出,本研究是首個使用雙系統的代理人,欲改善其效用,未來可以讓Talker-Reasoner框架中的Talker自動判斷是否加入System 2的資訊作為回應,或是System 2加入更多Reasoner,以多樣化其輸入的記憶資訊。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新