Physical Intelligence是一家成立兩年、總部位於舊金山的機器人初創公司,已悄然成為灣區最受矚目的AI企業之一。該公司於近日發布了最新研究成果,表明其新模型能夠引導機器人完成從未經過專項訓練的任務——這一能力甚至讓公司自己的研究人員感到意外。
這款名為π0.7的新模型,代表著該公司朝著通用機器人"大腦"這一長期目標邁出的早期但重要一步:機器人面對陌生任務時,只需通過自然語言指引便能真正完成操作。如果研究結論經得起推敲,則意味著機器人AI或正在逼近一個類似大語言模型當年的關鍵拐點——能力開始以超出訓練數據預期的速度複合增長。
組合泛化能力:打破"死記硬背"的訓練範式
這項研究的核心主張是"組合泛化"——即將在不同情境中習得的技能進行組合,從而解決模型從未遇到過的新問題。長期以來,機器人訓練的標準做法本質上是死記硬背:針對某項特定任務收集數據,訓練專用模型,然後對每項新任務重複此流程。Physical Intelligence表示,π0.7打破了這一模式。
公司聯合創始人、加州大學伯克利分校機器人AI教授謝爾蓋·萊文(Sergey Levine)表示:"一旦模型跨越那個臨界點——從只會執行已收集數據對應的任務,到真正以新方式重新組合運用這些技能——其能力提升將超越與數據量成線性增長的速度。這種更為優越的擴展特性,我們在語言和視覺等其他領域也曾觀察到過。"
空氣炸鍋實驗:令研究人員驚嘆的意外能力
論文中最引人注目的演示,涉及一台模型在訓練中幾乎從未接觸過的空氣炸鍋。研究團隊調查後發現,整個訓練數據集中僅有兩段相關記錄:一段是另一台機器人將空氣炸鍋蓋推上,另一段來自開源數據集,記錄了某台機器人按照指令將塑料瓶放入空氣炸鍋。而該模型竟能將這些零散片段與更廣泛的網路預訓練數據融合,形成對這台電器工作原理的實用性理解。
Physical Intelligence研究科學家、斯坦福大學電腦科學博士阿什溫·巴拉克里希納(Ashwin Balakrishna)坦言:"很難追溯知識究竟從何而來,也難以預判模型在哪些地方會成功或失敗。"儘管如此,在零引導的情況下,該模型嘗試用空氣炸鍋烹飪紅薯,結果尚算過得去;而在逐步口頭指導下——就像向新員工解釋操作步驟那樣——機器人則順利完成了任務。
這種語言指導能力之所以重要,在於它意味著機器人可以在全新環境中部署,並通過實時指令改善表現,無需重新收集數據或重新訓練模型。
局限性與失敗案例:研究團隊坦誠自我批評
研究人員並不迴避模型的局限性,也未過度渲染研究成果。在至少一個案例中,他們將矛頭直接指向了自身團隊。
巴拉克里希納說:"有時候失敗不在於機器人或模型本身,而在於我們——我們不擅長提示詞工程。"他描述了一次早期空氣炸鍋實驗,成功率僅為5%。在花了大約半小時優化任務描述方式之後,成功率一躍升至95%。
該模型目前也尚不具備從單一高層指令出發、自主執行複雜多步驟任務的能力。萊文表示:"你不能直接告訴它'幫我做片吐司'。但如果逐步引導它——'對於烤麵包機,先打開這個部分,按下那個按鈕,再做這一步'——它通常就能順利完成。"
研究團隊同時承認,機器人領域目前缺乏標準化的評測基準,這使得外部驗證其研究結論頗為困難。對此,公司轉而將π0.7與自身此前的專用模型進行比較——這些專用模型是針對單一任務訓練的專項系統——結果顯示,通用模型在製作咖啡、摺疊衣物、組裝紙箱等一系列複雜任務中均能與之媲美。
超出預期的能力:研究者眼中最珍貴的驚喜
如果說這項研究有什麼最值得關注之處,那或許不是某個具體的演示,而是結果令研究人員——那些對訓練數據了如指掌的專業人士——感到真正意外的程度。
"我以前的經驗一向是:只要深入了解數據內容,就能大致判斷模型能做什麼,"巴拉克里希納說,"我幾乎從不會感到驚訝。但過去幾個月是我第一次真正感到震驚。我隨手買了一套齒輪,問機器人'你能轉動這個齒輪嗎?'它就直接做到了。"
萊文回憶起研究人員第一次看到GPT-2生成一篇關於安第斯山脈獨角獸故事時的情景:"它到底是從哪裡學來秘魯獨角獸的?這種組合太奇特了。我認為,在機器人領域看到類似現象,真的意義非凡。"
當然,批評者會指出一個顯而易見的不對等之處:大語言模型可以從整個網際網路中汲取知識,而機器人沒有這種條件,再聰明的提示詞也無法完全彌補這一差距。但面對質疑,萊文的回應卻指向另一個方向。
"對任何機器人泛化演示,人們總能提出一個批評:任務太無聊了,機器人又沒在做後空翻。"他反駁了這種邏輯框架,認為令人眼前一亮的機器人演示與真正具備泛化能力的機器人系統之間的區別,恰恰就是問題的核心所在。他認為,泛化能力看起來永遠不如精心編排的技巧性表演那樣震撼,但其實用價值要高得多。
論文本身在措辭上保持審慎,將π0.7描述為展現出泛化能力的"初步跡象"與新能力的"初步演示"。這些是研究成果,而非已上市產品。Physical Intelligence從一開始便對商業化時間表保持克制態度。當被直接問及基於這些研究成果的系統何時能夠準備好實際部署時,萊文拒絕猜測:"我認為有充分理由保持樂觀,進展速度也確實比我幾年前預期的要快。但這個問題真的很難回答。"
融資規模持續擴大:估值或將突破百億美元
Physical Intelligence迄今已累計融資超過10億美元,最新估值達56億美元。投資者熱情的重要來源之一,是聯合創始人拉奇·格魯姆(Lachy Groom)。他曾是矽谷最受認可的天使投資人之一,投資過Figma、Notion、Ramp等知名企業,之後認定Physical Intelligence正是他一直在尋找的公司。這一背景幫助該初創公司吸引了大量機構資本,儘管它拒絕向投資者提供商業化時間表。目前,該公司據悉正在洽談新一輪融資,若成功完成,估值將接近翻倍,達到110億美元。公司團隊對此拒絕置評。
Q&A
Q1:π0.7模型的"組合泛化"能力是什麼意思?
A:組合泛化是指模型能夠將在不同場景中分別學到的技能進行重新組合,從而解決從未在訓練數據中出現過的新任務。過去機器人訓練是"一事一練"的專項模式,而π0.7可以融合零散知識片段,配合語言指令完成陌生任務,這標誌著機器人AI從專用走向通用的重要轉變。
Q2:π0.7目前有哪些明顯的局限性?
A:目前π0.7還不能從單一高層指令出發自主完成複雜多步驟任務,比如無法直接聽懂"幫我做吐司"這類命令。此外,模型的成功率高度依賴提示詞的質量,研究人員曾通過優化任務描述將成功率從5%提升到95%。機器人領域也缺乏統一的評測基準,外部驗證較為困難。
Q3:Physical Intelligence目前的融資和估值情況如何?
A:Physical Intelligence迄今已累計融資超過10億美元,最新估值為56億美元。目前公司正在洽談新一輪融資,若完成,估值將接近翻倍至約110億美元。儘管公司拒絕提供明確的商業化時間表,聯合創始人格魯姆的天使投資背景仍為其吸引了大量機構資本。






