DeepMind公布集成2種思維模式的Talker-Reasoner AI代理人框架

Google DeepMind上周公布具備2種思維模式的系統框架，可讓AI代理人（agent）能兼具快、慢思考的效益。

贊助商廣告

現有大型語言模型能以自然語言和用戶互動，具有二種能力，包括對話和規劃／思考。DeepMind團隊設計的一種由雙系統組成的Talker-Reasoner代理人框架，能同時執行對話及多步驟推理任務，一如由以色列諾貝爾經濟學家Daniel Kahneman提倡的「快思慢想」（之後也被翻譯成多國語言版本，包括繁中版）的人類一樣。

DeepMind設計的雙系統代理人框架中，系統1 Talker LLM能執行快速、直覺及合成語言回應，負責感知觀察外界、獲得用戶回應，並且以自然對話和用戶互動。系統2 Reasoner LLM負責解決複雜的問題，這涉及從外界取得資訊增強其知識，像是調用工具、從外部資料庫獲取資訊。相較Talker LLM的快速回應，Reasoner的運行更為緩慢、深刻及具邏輯性，包含多階段推理和規劃、調用、執行行為等動作。Talker和Reasoner之間經由共同記憶體互動。Reasoner獲得知識後，除了執行行為，也更新其（記憶體中的）知識信仰，並提供Talker產生新的說話內容。在接獲用戶互動輸入問題時，Talker可以以現有知識為基礎、提供直覺回應，也可以等待Reasoner代理人產出知識，延遲回應用戶。

DeepMind團隊利用Gemini 1.5 Flash設計出錯含雙系統AI代理人，在測試中，讓該系統扮演用戶睡眠指導顧問，在聽取用戶說明後，提供改善睡眠的建議。研究團隊發現，系統在「理解」用戶問題階段，其代理人（Talker）直覺化、流暢回應用戶，但當Reasoner未能理解其指導是哪個階段時，會提供較直覺化而無用的建議。例如使用降噪窗簾及隔音板。為解決此問題，研究團隊加入「指導」階段說明，Talker一旦讀取到指導階段時，就會等待Reasoner提供的資訊，而非直覺回應用戶。這時系統2就取得主導，而非只給系統1產出的回應，例如為房間換顏色柔和的壁紙。

贊助商廣告

研究人員指出，本研究是首個使用雙系統的代理人，欲改善其效用，未來可以讓Talker-Reasoner框架中的Talker自動判斷是否加入System 2的資訊作為回應，或是System 2加入更多Reasoner，以多樣化其輸入的記憶資訊。