宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

OpenAI 罕見開源!低調發布的新研究,一出來就被碰瓷

2024年10月15日 首頁 » 熱門科技

或許是前段時間風頭太盛,周末時,OpenAI 靜悄悄發布了新的研究作品:Swarm。一反之前的架勢,這個新作只在官網的 Cookbook 和 Github 發布,官推都沒有多講。

OpenAI 罕見開源!低調發布的新研究,一出來就被碰瓷

除了非常安靜和低調,開發人員還反覆給自己疊甲:這只是一個實驗性質的框架,只作為分享和教育用途。官方不質保,實用需謹慎!

OpenAI 罕見開源!低調發布的新研究,一出來就被碰瓷

明明已經這麼低調,一出來還是被碰瓷了。

關注 AI 第一新媒體,率先獲取 AI 前沿資訊和洞察

什麼是 Swarm?

Swarm 旨在探索輕量級、可擴展、可定製的多代理協作模式。OpenAI 的研究人員,提出了「routine」和「handoffs」概念,用來表達 agent 之間的任務傳遞。

然而 Swarm 才發布一天,麻煩就找上門來:一個二十多歲的開發者 Kye Gomez 發推稱,這個新作從名字到框架,全都是抄襲他的創業項目 Swarms。

OpenAI 罕見開源!低調發布的新研究,一出來就被碰瓷

這條控訴吸引了超過 20 萬的圍觀,不過,圍觀群眾都很冷靜,要求 Kye 提供更明確的證據,並且質疑他提出的訴求:「除非 OpenAI 投資我們」,這什麼東西啊?

很快就有網友翻出他的碰瓷前科。而且,從兩邊在 Github 上發布的 README 文檔來看,顯然也是 OpenAI 更靠譜一點。

OpenAI 罕見開源!低調發布的新研究,一出來就被碰瓷

我把文檔送進了 ChatGPT,用最新的 o1 做了一下分析,OpenAI 提出了更詳實和具體的想法。

至於說項目重名和一些常用指令重合,比如.run()——這就像是有人說自己的數學考卷被抄襲了,因為兩邊的答題框裡都有個「解」字 🙂。

OpenAI 的 Swarm 框架里,重點梳理了在多代理模式里的各種成分,並且提出了兩個關鍵概念:例程 (routines) 和交接 (handoffs),還提供了很多便於理解的例子。

例程可以把它理解為由不同步驟組成起來的一套「基本操作」,比如,你搭建了一個購物助理,那麼你就可以規定一套流程作為例程。

OpenAI 罕見開源!低調發布的新研究,一出來就被碰瓷

但是一個 agent 能做的事,再多也是有限的。更何況大語言模型本身,多多少少會出幻覺。所以需要不同的 agent、不同的 routine 之間有所交接。

OpenAI 罕見開源!低調發布的新研究,一出來就被碰瓷

就像一場接力跑,一個選手跑完一段,就要交接到下一個選手手上,而且要保證平穩,不能掉在地上。

這些才是本次發布里 OpenAI 重點關注的部分。或許說不上是什麼驚為天人的大發現,但硬說抄襲,也是有點碰瓷了——非要追根溯源,那得倒回幾十年前。

多智能體最擅長的,竟然是打遊戲

OpenAI 並不是才開始對多智能體協作發生興趣的,早在 2018 年,就有過不錯的表現——在 Dota 2 職業比賽上,擊敗了資深的人類玩家。

OpenAI 罕見開源!低調發布的新研究,一出來就被碰瓷

遊戲是一個天然適合用來測試多智能體的土壤,不同的角色,有不同的技能;面對不同的對手,要有不同的策略,總之,想要贏下一局遊戲,勢必要協調各個角色,並且組織好它們之間的協作能力。

想想你打王者碰到豬隊友時有多氣,就知道這個難度了。

OpenAI 罕見開源!低調發布的新研究,一出來就被碰瓷

當時 OpenAI Five 涉及到的技術構件包括神經網路、自訓練、強化學習等,沒有時下流行的大語言模型,主要是用來試驗多智能體協作。

甚至,那個時候每個英雄各自背後的神經網路,並不互相溝通,而是有一個負責總控的超參數,來協調每一個英雄(主要是背後的神經網路)的表現。

再往深了講就有點太深了,總之,那幾年的經歷,讓 OpenAI 連續三年打贏了幾個 Dota2 的大賽,也在多智能體協作方面頗有收穫。

到了 2019 年,DeepMind 開發的 AlphaStar 在《星際爭霸 2》中,水平超過了 99.8%的人類玩家。

OpenAI 罕見開源!低調發布的新研究,一出來就被碰瓷

在星際里,有人族、神族和蟲族三個派系,每個派系都有多個可供操作的建築、兵種,每局遊戲也都需要經歷資源採集、科技發展和實時戰鬥等幾個流程。

當時 DeepMind 發表論文時就提到,遊戲是一個多智能體協作的任務,每個玩家需要控制許多單位,共同實現目標。

DeepMind 所設計的 agent,每分鐘操作數約為 180 次,大概等同於中級玩家。當時他們的想法是:智能體要儘可能地學習人類玩家的遊戲操作,然後超越人類。

這樣的「類人」思路,甚至可以追溯到更久之前:早在 1972 年,卡爾·休伊特(Carl Hewitt)就提出了 Actor Model(行動者模型),這是並發計算的概念模型。演員模型提出了獨立計算實體(agent)可以通過消息傳遞進行通信的概念,為智能體之間的交互奠定了理論基礎。

OpenAI 罕見開源!低調發布的新研究,一出來就被碰瓷

到了九十年代和千禧年初,agent 就更加明確的,被視為能夠自主行動、決策的「賽博實體」,並且有了基於智能體信念、意圖進行決策和規劃的研究,BDI 模型。

等到了大語言模型橫空出世之後,多智能體的交互、決策溝通,從原來的黑盒,變得更容易轉化成自然語言。

智能體之間,也可以通過語言來討論、協作,特別是在決策情境中,不同的智能體之間能夠「有商有量」。

之前我們介紹過,也是在 Minecraft,一款沙盒遊戲裡——不得不說,多智能體實在是太擅長打遊戲了。

在遊戲裡,不同的智能體可以直接對話來完成分工、資源互通和任務傳遞。大語言模型的推理和記憶能力,都能更有效地為多智能體的行動提供支援。

而 OpenAI 不就在於有厲害的模型嗎——年初時,他們藉由 ChatGPT 灰度測試過,在對話框內,可以召喚其他 GPT 插件,也算是一種多智能體協作的「平替版」。

OpenAI 罕見開源!低調發布的新研究,一出來就被碰瓷

只是效果著實不咋地,嘗試了一下 Capcut 的插件,一直鬼打牆的跳轉不成功(註:Capcut 是剪映的海外版)。

OpenAI 罕見開源!低調發布的新研究,一出來就被碰瓷

可以說,這一次的 Swarm 是 OpenAI 探索充分調動自己的優勢——強大的基座模型——再進一步摸索出一個多智能體的工作流程框架。

好消息是,在從 OpenAI 變得越來越「吝嗇」之後。這次 Swarm 倒是開源出來了。大語言模型讓多智能體系統能夠以更加自然的方式與人類互動。相信在未來,這種交互絕不僅限於簡單的對話,而是會更多的提高生產力。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新