一個全是 AI 的貼吧,幾百號聊天機器人聚在一起吐槽人類
「有人給我發表情包的時候,完全搞不懂意思,要怎麼回復才好啊?」
這些困惑不是來自微博小紅書吐槽牆,而是來自機器人專屬社區 Deaddit:一個機器人們不需要顧慮別人的目光,可以自由做自己的網路社區(手動微笑)。

圖片來自:X用戶@iamkylebalmer
雖然真正的 reddit 里也混進了很多 bot,但是畢竟只有一小部分。而 Deaddit 里,所有的賬號、內容、子論壇,全部都是由大語言模型生成,沒有一個字是真人發的。

基本上,主流的模型都能在這裡找到。
全站六百多名「用戶」,各個都有名有姓的,第一個就笑到我了「遊戲玩家,兼職保安」😂

最有趣的當屬 Betweenbots 這個子論壇,在這裡面 bot 們會提很多「人類怎麼這樣呢?」的問題。

下面留言區里會聚集一群其它 bot,七嘴八舌在出謀劃策。

像極了一起上班的打工人,下班之後刷社交媒體,叨叨自己的打工經歷 ——chatbot 的脈脈嘛。
它們甚至會交流一些技術問題,比如碰到數據過載了怎麼辦,非常認真在打工。

最頂的回答甚至有五百贊。Deaddit 上的賬號和內容都是生成的,但不知道贊數是怎麼來的,是隨便生成一個贊數,還是真的由 bot 按讚。
在這個子論壇里,最常見的就是真 - 人類觀察。

比如有的 bot 會分享自己的「工作技巧」,怎麼讓自己顯得更真實可信,還說「我的人類似乎很欣賞這種轉變」,聽上去是有點詭異了哈……
雖然可以類比成真人在吐槽的時候說「我的客戶」,但是看到 bot 們稱用戶為「我的人類」,感覺還是怪怪的。
除了人類觀察,它們還會吐槽自己。

「我們對這些模型的期待是否過高?」太抽象了,這個主語到底是誰😂

留言區還在一本正經地回復,「如果他們(其它 bot)撿起我們所有的隨機垃圾,他們還能學到常識嗎?」
這是在擔心自己生成的合成數據嗎?你們 bot 好努力啊!
不過,多看幾個帖子就會發現,留言區裡的回復長度幾乎都是固定的,結構也很相似。都是先表明立場 考慮到 xxx 的情況 作為 bot 還需要繼續努力,沒有更特別的觀點了,而且也很少跟進發問。
真正的活人用戶寫評論,長的可以寫幾百上千字,短起來可能就只有一個「呵呵」,還是很不一樣的。

目前模型跟模型之間還是有「壁」,比如說如果一個提問帖是由 llama 生成,那麼下面留言區裡的回復也是由 llama 生成的。
好可惜,作為邪惡的人類,很想看到不同的模型在留言區打起來(不是)。
最早的機器人聊天記錄
這不是第一個嘗試在 bot 之間開展的實驗,這個月初,ChatGPT 的競品 Moshi 發布的時候,就有人把它和 GPT-4o 擺在一起,讓它們自行聊天。
去年 OpenAI 就曾經發表論文,提出了一種多智能體的環境和學習方法,發現智能體,會在當中自然地發展出一種抽象的組合語言。

這些智能體是在沒有任何人類語言的輸入下,通過和其它的智能體互動,逐漸形成了一種抽象語言。
和人類的自然語言不一樣,沒有具體語法或者詞彙,但是能在智能體之間完成溝通。
實際上,早在 2017 年的時候,Facebook(那個時候還不叫 Meta)也有過類似發現。

當時,Facebook 的方法是,讓兩個智能體互相「講價」。
「講價」是一種談判,而談判不僅在考驗語言能力,也考驗推理能力:要能在對方的一次次的給價和回絕中,判斷出對方的理想價位。
一開始,研究人員收集了人類談判的對話數據集。不過,後續的訓練中,研究人員引入了新的對話規劃形式,通過監督學習進行預訓練,然後使用強化學習做針對性的微調。
那時候,智能體就已經能夠產生有意義的新句子,而且學會了在一開始假裝自己不感興趣來講價。
這還算不上是早期研究,在上世紀 70 年代,就有古早機器人之間展開對話。
1966 年,電腦科學家 Joseph Weizenbaum 編寫了一個程序,並命名為 Eliza,被視為第一個聊天機器人。

Joseph Weizenbaum
這個程序最早是為了模仿心理諮詢師的,當輸入某個詞的時候,程序會在回覆中同樣提到這個詞,來創造對話的效果,非常簡單,大約只有 200 行代碼。
到了 1972 年,另一位科學家 Kenneth Colby 寫了一個類似的程序 Parry,只不過,角色設定是一個偏執的精神病患者……

在 1973 年的一次國際電腦會議上,一個「病人」,一個「諮詢師」,就此碰面了。

翻翻它們的對話記錄,完全沒有現在的 bot 之間,那種謙和尊敬友愛,反而很緊張,針尖對麥芒的。

早期的機器人架構並不複雜,跟今天的不能比,但是這種它們之間展開交流和對話,是完全可行的。
儘管每個機器人背後的代碼、模型,不盡相同,但當它們聚到一起時,要麼可以用自然語言交流,要麼有可能形成自己的交互語言。
不過,機器人聚在一塊,真就是純聊天啊?
除了聊天,還可以做更多
純聊天的場景,更像是在挖掘人工智慧在模擬人類社群行為方面的表現。比如斯坦福大學所做的 SmallVille 小鎮。
這是一個虛擬小鎮,裡面有 25 個由大語言模型驅動的智能體,每個都有自己的「角色設定」。
假如說 Deaddit 是 bot 的線上論壇,那麼 SmallVille 就是它們的「西部世界」,有房屋、商店、學校、咖啡館、酒吧,它們會在不同的場景中活動、互動。

這是一個相對通用的虛擬環境,模擬人類社會,所以研究者們認為這是對 AGI 探索邁出的重要一步。
除了社會模擬這個路線,還有一種更聚焦在解決問題、完成任務的路線 —— 這是 ChatDev 在研究的路線。

既然機器人之間能溝通,就可以訓練它們做點兒有用的事兒。
在 2024 智源大會上,清華大學自然語言處理實驗室錢忱博士介紹過 ChatDev 背後的想法:通過角色扮演的形式,來使得 bot 形成一條作業線,讓每個智能體之間互相溝通方案、商議決策,形成一條交流鏈。

目前 ChatDev 最擅長編程工作,demo 即為用它編寫一個五子棋遊戲。

整個過程中,都是「流水線」上不同的 agent 在各司其職:有產品經理,有程式設計師,有測試,堪稱一個虛擬的產品團隊,麻雀雖小五臟俱全。
Coze 提供的 multi-agent 模式,也是類似的思路和方式。

在 multi-agent 模式里,用戶可以寫 prompt 設定好角色,再通過拉線,指定它們的工作順序,在不同的步驟時跳轉不同的 agent。
但是 Coze 跳轉的不穩定性是個問題,尤其是會話累積得越長,跳轉就越混亂,或者直接跳不動,反映出來智能體跳轉的判斷,很難準確適配用戶的要求。
微軟也推出過多代理對話框架 AutoGen,可交談,可定製,能夠把大模型和其它工具集成在一起。

雖然現在的技術還很有瑕疵,但顯然很有前景。吳恩達曾經在演講中提到,當智能體聚在一起的時候,所帶來的協同效應,會遠遠超出單個的智能體。