宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

物理世界如何實現AGI?前空中客車CTO紅杉訪談:我們的願景是讓AI設計人類無法設計的系統,從星際飛船到戴森球

2025年06月03日 首頁 » 熱門科技

今天本來計劃刊發一期黃仁勛的內容,因為昨天英偉達財報,照例黃仁勛也接受了一些採訪,談到了中國市場戰略等話題。不過後來看到紅杉資本的Training Data播客前天的一期節目,覺得更值得報道一下。因為談的是目前較少談及的話題:物理世界的AI。而且嘉賓比較特殊,紅杉資本合伙人Sonya Huang和Pat Grady請的是P1.AI創始人兼CEO保羅·埃雷門科(Paul Eremenko)。

物理世界如何實現AGI?前空中客車CTO紅杉訪談:我們的願景是讓AI設計人類無法設計的系統,從星際飛船到戴森球

埃雷門科的履歷也傳奇:曾任美國國防部高級研究計劃局(DARPA)項目主管,35歲時成為空客集團最年輕的首席技術官,現在則致力於將科幻小說中的夢想變為現實。他創立的公司P1.AI有一個雄心勃勃的目標:構建面向物理世界的工程AGI。

為什麼說雄心勃勃,因為P1.AI的目標是讓模型能夠設計人類無法設計的系統,從星際飛船到戴森球。保羅·埃雷門科之所以選擇在這個時機創業,是因為看到Anthropic、Cursor和Devon等公司已經在軟體開發領域取得了突破性進展,但物理世界的硬體工程——無論是數據中心冷卻系統還是飛機設計——尚未被AI從根本上改變。埃雷門科認為,現狀能夠改變,而且即將改變。

在對話中,他也講了物理工程領域面臨的核心挑戰:訓練數據稀缺。與軟體領域擁有海量代碼數據不同,物理產品的設計數據極其有限。以飛機為例,自萊特兄弟以來,全世界也許只有幾千個飛機設計,遠不足以訓練大型模型。P1.AI的解決方案大家可能也聽說過,即合成數據,基於物理學的合成數據生成:創建數百萬個假想的但符合物理規律的設計,為AI提供學習素材。聽到這裡的時候,我感覺和黃仁勛去年開始談的物理AI理念接近,英偉達在通過Omniverse和Cosmos兩個平台做這件事情。

當然,埃雷門科也不只是說說,在節目中他介紹了公司第一個產品——AI工程師Archie。這個智能體被設計為能夠加入工程團隊,像初級工程師一樣處理任務。從住宅冷卻系統的概念驗證開始,P1.AI計劃逐步攀升複雜度階梯:數據中心冷卻系統(約1000個零部件)、工業系統、移動設備,最終達到航空航天級別(約100萬個零部件)。

埃雷門科的理念也和紅杉資本的AI創業方法論很接近,主張AI的商業價值在於替代工作產出而非工具,與其開發更好的軟體,不如直接提供數字員工。

在講埃雷門科的理念之前,我們還是插播一下黃仁勛財報採訪的五個主要觀點吧,畢竟是今天的大事件,而且也提到了機器人:

1. "四年前,英偉達在中國的市場份額大約是95%,而今天大約是50%,這都是因為我們所銷售產品的限制。在接下來的四年總統任期內,我們談論的可能是數千億美元的英偉達收入損失。"

2. "中國市場不僅規模龐大,更關鍵的是它是全球50%的AI研究人員的家園。成功的平台是擁有最多開發者的平台,就像iPhone因為有很多開發者而成功,Windows因為有很多開發者而成功一樣。我們希望世界上每一個開發者都更偏愛我們的技術棧。"

4."自動駕駛汽車已經就位,機器人技術絕對在接下來的三到四或五年內會實現。技術今天就能工作,一旦技術變得可行,工程師只需要幾個開發周期就能將其轉化為可以大規模生產的產品。"

14. "我們曾經是一家晶片公司,然後成為了系統公司,現在我們是一家完整的基礎設施公司。當你有一個500億美元的AI基礎設施時,保持其高效運行所需的軟體是無價的——如果利用率下降10%,那就損失50億美元。軟體現在是我們業務的巨大組成部分。"

接下來就是埃雷門科的觀點記錄。

一、物理世界工程AI的根本挑戰:數據稀缺困境

在紅杉資本的Pat Grady詢問物理工程領域的AI發展現狀時,埃雷門科的回答很乾脆:"答案是幾乎沒有進展。"這個回答背後,是他對這一領域長期觀察的結果。

物理世界如何實現AGI?前空中客車CTO紅杉訪談:我們的願景是讓AI設計人類無法設計的系統,從星際飛船到戴森球

埃雷門科坦言,作為一個在硬科幻小說中長大的孩子,他曾被承諾AI將幫助人類建設物理世界,最終實現星際飛船和戴森球的夢想。"當深度學習革命真正開始起飛時,我問了一個問題:誰在構建這些東西?誰在開發那種能幫助我們建設物理世界的AI?答案是沒有人在做這件事。"

這種現狀的根源在於一個基本問題:訓練數據的極度稀缺。埃雷門科用飛機設計舉例說明了這個困境的嚴重性。他解釋道:"如果你想要一個AI工程師能夠幫你設計飛機或修改飛機,當你問'如果我把A320的機翼面積增加10%會發生什麼'時,為了能夠回答這個問題,你的模型理想情況下需要在數百萬個飛機設計上進行訓練。"

然而現實是殘酷的。"自萊特兄弟以來,根本沒有數百萬架飛機被設計出來,即使你神奇地獲得了所有這些設計的訪問權限——實際上你沒有——即使它們都以連貫的、語義集成的方式建模——實際上它們也沒有——但即使在假設情況下,自航空誕生以來,你可能也只有大約一千個設計。這遠遠不足以訓練一個大型模型。"

這個數據稀缺問題不僅存在於航空領域,而是物理產品設計的普遍困境。與軟體工程不同,軟體代碼可以在網際網路上找到數以億計的樣本,物理產品的設計歷史數據極其有限。每個新的物理產品都需要大量的工程投入,而且由於成本和時間限制,實際被製造出來的變體數量遠少於理論上的設計空間。

這種數據稀缺性還帶來了另一個問題:設計空間的複雜性。埃雷門科指出,大多數物理產品的設計空間幾乎是無限大的。"你不能隨機採樣它,你不能均勻採樣它,你必須非常巧妙地採樣它。你想要在主導設計周圍密集採樣,但你想要在設計空間的角落和邊緣稀疏採樣。"

即使是設計空間邊緣那些永遠不會被採用的設計,也具有教育價值。"因為這教會了你一些東西,即使設計空間的那個角落邊緣不是你想要去的地方,它也教會你的模型為什麼會這樣。"

埃雷門科認為,正是這個基礎性的數據問題阻礙了物理世界AI工程的發展。而P1.AI的核心創新,就是要解決這個看似無解的困境。

二、合成數據革命:用物理學法則生成訓練素材

面對傳統訓練數據稀缺的困境,P1.AI提出了一個創新解決方案:基於物理學的合成訓練數據生成。這個方法的核心思想是,既然現實中的設計數據不夠,那就創造出符合物理規律的假想設計。

埃雷門科詳細解釋了這個方法的工作原理:"最基礎的技術積木就是創建這些訓練數據集。它是合成的,是基於物理學的,是供應鏈資訊化的假想設計,無論在什麼物理產品領域——可能是飛機,也可能是其他東西。"

這種合成數據生成並非簡單的隨機組合。埃雷門科強調,必須讓數據集"足夠大且足夠有趣"。由於大多數物理產品的設計空間幾乎無限大,採樣策略至關重要。"你想要在主導設計周圍密集採樣,但你想要在設計空間的角落和邊緣稀疏採樣,因為這教會了你一些東西。"

供應鏈資訊化是這個方法的另一個關鍵要素。埃雷門科解釋:"理論上,你的目錄中的所有組件要麼反映供應鏈中的真實組件,要麼你可以引入假想組件。因為有時創新不僅僅是組裝現有的東西,而是說,'嘿,我需要一個新電機,或者我需要一個新壓縮機。'"

生成合成數據的過程包含幾個關鍵步驟。首先需要創建一個組件目錄,這個目錄需要比典型系統設計大幾個數量級。"如果你有一個包含100萬個獨特零件的系統,你的組件目錄可能需要1億或10億個零件。"

接下來是智能組裝過程。埃雷門科用一個生動的比喻來說明:"這不是龍捲風穿過廢料場然後組裝出一架747,而是你實際上有一些創建它的方法。"

最後一步是仿真和性能評估。每個生成的設計都必須經過仿真,獲得性能向量,這樣才能構成有效的訓練數據集。

這種方法的優勢在於可以大規模生成符合物理規律的設計樣本,為AI模型提供足夠豐富的學習材料。同時,通過控制採樣策略,可以確保模型學習到設計空間中的關鍵模式和約束。

埃雷門科特別強調了物理基礎的重要性:"基於物理學意味著組合這些組件的規則建模了你關心的所有相關交互模態、它們交互的現象學,並且產生的設計實際上是可實現的設計。"

這種合成數據方法不僅解決了數據稀缺問題,還為AI工程師的訓練提供了前所未有的可能性。通過系統性地探索設計空間,AI模型可以學習到人類工程師可能需要數十年才能積累的經驗和直覺。

三、Archie智能體:重新定義工程認知自動化

P1.AI的第一個產品是名為Archie的AI工程師智能體。這個名字的選擇頗有深意——既代表了阿基米德(Archimedes)的智慧,也暗示了建築師(Architect)的設計能力,同時以字母A開頭也為未來的Bob、Charlotte、Daniel等智能體留下了擴展空間。

埃雷門科強調,Archie的設計理念是認知自動化,而不是工具替代。"我們專注於人類工程師在設計物理系統時所做工作的認知自動化,這是非常狹窄的關注點。"

人類工程師的工作可以分解為幾個核心環節:首先是需求分析,從一堆需求中提煉出關鍵的設計驅動因素;然後是方案構思,提出一個或多個滿足這些設計驅動因素的可能解決方案;接著是初步設計,進行一階規模估算,確定答案大致的樣子,以及相關的現象學分析;最後是詳細分析,知道有哪些工具可用於詳細設計和分析,了解這些工具的適用範圍以及如何使用它們。

這些複雜的工程任務可以簡化為幾個基本操作:設計評估(給定一個特定設計,其性能如何)、設計合成(給定性能要求或需求向量,設計應該是什麼樣的)、以及錯誤查找和填充(在設計中發現錯誤並進行修正)。

Archie採用了聯邦式架構,由多個專門的模型組成。埃雷門科解釋:"我們使用一種聯邦方法,包含一堆不同的模型,它們執行工程推理的不同部分,然後它們都由一種編排推理器LLM來協調,該LLP也充當用戶的界面。"

這個架構包含了多種專門的模型:一個圖神經網路充當基於物理學的性能空間代理模型;一個幾何推理模型用於回答相對位置、打包和干擾等問題;還有一個"被閹割的LLM"——這是埃雷門科的幽默說法,指的是一個不再擅長英語但非常擅長物理系統設計的程序化表示和推理的模型。

與現有工具的協作是Archie設計的另一個關鍵特點。"我們不試圖在工具層面競爭。存在現有的詳細設計、分析和仿真工具,我們希望Archie知道如何使用這些工具,就像人類知道如何使用它們一樣。但我們不試圖替換工具,不試圖讓它更好,不試圖與之競爭,不試圖以任何方式取代它。"

這種定位使得Archie能夠無縫集成到現有工程環境中。埃雷門科強調:"Archie被設計為加入團隊並成為遠程工程師。雖然沒有實體化,但他會出現在Slack或Teams或您使用的任何協作工具上。您可以像對待初級工程師一樣給他分配任務。"

目前,Archie已經在住宅冷卻系統領域完成了概念驗證。這個選擇很有策略性:既足夠複雜以展示多物理場能力(流體流動、氣流、熱交互、電氣系統),又不會因為組件數量過多而陷入數據生成的泥潭。

從住宅冷卻系統開始,P1.AI計劃逐步向更複雜的系統進發。首個商業應用目標是數據中心冷卻系統,這個市場面臨著巨大的需求壓力和工程師短缺問題。埃雷門科指出:"冷卻系統就像長期交付項目,是數據中心開發的節拍器,這很瘋狂。"

四、工程智能的評估體系:從布魯姆分類法到工程AGI

如何衡量一個AI工程師的能力水平?這是P1.AI面臨的關鍵挑戰之一。埃雷門科和他的團隊採用了一個創新的評估框架——基於布魯姆分類法的工程智能評估體系。

布魯姆分類法(Bloom's Taxonomy)是上世紀50年代開發的認知知識分類體系,近年來已被應用於LLM評估。P1.AI將其改造為適合工程任務的評估框架,構建了一個六層金字塔結構。

最底層是資訊回憶能力,這相對簡單直接。第二層是語義理解,除了回憶之外,還要理解"這個部件是做什麼的"。第三層是設計評估能力,即能夠評估設計或設計變更的影響,比如"改變這個組件的性能影響是什麼"。

第四層是錯誤發現能力,即在設計中找到錯誤的能力。第五層是設計合成,能夠合成全新設計或對現有設計進行重大更改。

最高層被稱為工程AGI(E-AGI),其核心是反思能力。埃雷門科解釋:"這是某種程度的自我意識——我剛才用什麼過程來完成前面五個層次?我用了什麼過程?這個過程的局限性是什麼?有替代過程嗎?我可能在哪裡出錯?"

這種反思能力"實際上大多數現場工程師都做得不太好,只有高級層次、專家或大型工業公司的技術研究員才具備"。對P1.AI來說,這代表了人類工程智能的巔峰——對工程過程自身局限性的自我意識。

除了這個垂直的能力層次外,還有一個水平的泛化維度:AI是否能夠在沒有專門訓練的情況下跨領域泛化?埃雷門科認為,可以在一個軸上實現AGI,在另一個軸上實現AGI,或者在兩個軸上都實現AGI。"選擇你的毒藥吧,我們希望兩者都做到。"

為了實現這個評估框架,P1.AI開發了一套名為"Archie IQ"的評估系統。這套系統的目標是對不同水平的人類工程師——入門級、平均水平、專家級——以及Archie進行相同的測試,從而建立一個閉環改進過程,推動Archie沿著IQ量表向上發展。

這種評估方法的創新性在於,它不僅關注技術能力,更重視元認知能力——對自己思維過程的思考。這種能力往往是區分優秀工程師和普通工程師的關鍵因素。通過將這種高階認知能力量化並納入AI訓練目標,P1.AI為工程AI的發展提供了一個清晰的路線圖。

埃雷門科預計,到這期節目播出時,他們將發布一篇描述這套評估方法的學術論文,為整個行業提供工程AI評估的標準化框架。

五、複雜度階梯:從千個零件到百萬組件的征程

P1.AI的發展戰略遵循一個清晰的複雜度遞增路徑,這個路徑的設計基於對物理系統複雜性的深刻理解。埃雷門科將這個進程描述為"主要基於合成訓練數據、基於物理學的合成訓練數據複雜性"的遞進。

公司的預期是每年向上攀升大約一個數量級的產品複雜性。這個時間表基於他們當前的技術發展軌跡和計算資源的增長預期。

具體的發展路徑已經規劃得相當清晰。第一站是數據中心冷卻系統,這類系統大約包含1000個獨特零件。這個選擇不是偶然的——數據中心冷卻系統仍然是熱力學引擎,與住宅HVAC系統本質相似,但複雜度高出一個數量級,規模也大得多。

更重要的是,這個市場存在急迫的痛點。埃雷門科指出:"他們很難應對數據中心客戶的需求。我們正處於這樣一個時點:冷卻系統成為了長期交付項目,成為數據中心開發的節拍器,這很瘋狂。"這種市場需求為P1.AI提供了"非常熱情的客戶群體"用於早期部署。

第二個垂直領域是工業系統,包括進入工廠的設備——物料搬運設備、工業機器人、銑床、車床等。這些系統的複雜性又上升了一個數量級。

接下來是移動性領域,可能包括汽車、農業設備、採礦設備等。這些汽車和重型機械設備代表了更高的複雜性層次。

最終目標是航空航天和國防領域。埃雷門科用具體數字說明了這個複雜性階梯:"數據中心冷卻系統大約有1000個獨特零件,飛機大約有100萬個獨特零件——它們之間有三個數量級的差異。"

這種遞進式發展策略不僅是技術上的必然,也是商業上的明智選擇。每個階段都有相對應的計算資源需求。埃雷門科坦承:"今天我們無法為100萬零件系統做到這一點,因為如果你想像一下,也許要回到Pat關於供應鏈部分的問題——我們如何創建這些合成數據集?"

創建合成數據集的挑戰是巨大的。對於包含100萬個獨特零件的系統,"你的組件目錄可能需要1億或10億個零件"。目前,P1.AI手工創建這些目錄,但正在"構建大量自動化和大量實際AI工具"來幫助構建組件模型目錄。

每個階段的進展都需要克服特定的技術障礙。需要CPU計算來生成合成數據(大量仿真和採樣),需要GPU計算來訓練模型,還需要GPU計算來推理。"所有這些今天我們都無法為100萬零件系統做到,但隨著計算能力的增長和技術的改進,這個限制會逐步解除。"

埃雷門科強調,這種發展路徑不需要根本性的研究突破:"不需要研究突破。我認為我們完全在應用研究領域內操作,我們採用前沿實驗室正在進行的現有研究,並將其應用於我們的特定問題。"

這種工程化而非研究化的發展策略,使得P1.AI能夠更可預測地執行其路線圖,同時為客戶提供實實在在的價值。

六、商業模式創新:賣工作而非軟體

P1.AI的商業策略體現了對傳統企業軟體銷售模式的深刻反思。埃雷門科明確表示,他們的目標是"向這些公司銷售工作,而不是軟體"。

這個策略背後有深層的商業邏輯。埃雷門科解釋道:"向像空客這樣的公司銷售工程軟體是非常困難的。生態系統中有數百個,如果不是數千個工程工具,它們以各種方式連接——客氣地說是複雜的,有時是不優雅的,某種膠水軟體的方式。將新工具引入該生態系統非常複雜。"

更重要的是,這些公司的預算結構偏向人力而非工具。"這些公司的勞動預算比方法和工具軟體預算大得多。所以你想要解決勞動問題,而不是工具問題。"

因此,Archie被設計為數字員工而非軟體工具。"Archie真正被設計為出現在團隊中並成為遠程工程師。顯然沒有實體化,但他出現在Slack或Teams或您使用的任何協作工具上。您像對待初級工程師一樣給他分配任務,他恰好可能在海外工程中心。"

這種定位帶來了幾個關鍵優勢。首先是部署摩擦最小:"將Archie引入組織的摩擦真的很小。您不需要做任何不同的事情。您不需要改變您的流程。您只是有這個成本更低的實體出現。"

其次是能力的差異化定位:"Archie可能在某些事情上更好,在其他事情上可能更差。但目標是將他定位為工人。"這種定位避免了與現有工具的直接競爭,而是補充現有工作流程。

P1.AI的初始市場策略也體現了這種思路。他們計劃首先讓"Archie被僱傭為入門級工程師",基於他們生產的非專有合成數據,達到"受過大學教育但在特定公司產品或一些深入流程和實踐方面不是特別精明"的水平。

一旦建立了客戶關係,就可以進入數據共享和定製化階段:"然後我們與客戶建立關係。我們有數據共享協議,所有這些都得到了整理。然後Archie可以開始學習防火牆後面的東西。"

這包括攝取客戶的PLM系統、基於模型的工具和模型,以及"大量該系統的真實世界性能、質量逃逸"等數據。通過這種方式,"Archie可以相當快速地從入門級提升到平均水平再到專家級工程師的專業水平"。

公司的長遠願景是"世界上每個主要工業公司的每個團隊都有一個Archie"。這種規模化的願景反映了他們對市場潛力的信心,也暗示了未來可能的網路效應。

埃雷門科提到了一個有趣的可能性:如果每個團隊都有一個Archie,"Archies能否在團隊之間比人類更好地協調,並使用某種他們自己的速記"?這種AI間協作的可能性可能會帶來比單純人力替代更大的價值。

這種商業模式的創新性在於,它不是簡單地用AI替代人類工具,而是重新定義了AI在企業中的角色——從工具變成了同事。

七、應對隨機性挑戰:工程安全的平衡藝術

當討論到AI在物理工程中的應用時,一個核心擔憂是隨機性問題。紅杉資本合伙人提出了一個尖銳的對比:"我可以隨意編寫一個網路應用,如果它壞了也沒關係。但如果我隨意編寫一架飛機代碼而它壞了,那就太糟糕了。"

埃雷門科的回應體現了工程師的實用主義思維:"人類也是相當隨機的。如果你有一個初級工程師在處理任務,他們會犯錯誤。他們可能不會做正確的事情。他們可能不可重複。"

關鍵問題不是消除隨機性,而是量化和管理錯誤率。"我們需要量化的問題,我們期望在今年晚些時候的試點中量化的是,Archie的錯誤率是多少?如果該錯誤率與人類工程師相當,那麼現有工程組織中內置了很多檢查和平衡,以確保初級工程師犯的錯誤不會導致飛機墜毀。"

這些多層保護機制包括審查層次、里程碑檢查、測試環節等。埃雷門科強調:"有很多這樣的層次。所以如果Archie的錯誤率相當或更好,那麼它應該能夠相當無縫地融入現有流程。"

這種方法的智慧在於利用現有的質量保證體系,而不是試圖創造一個完美無缺的AI系統。在航空、汽車等安全關鍵行業,已經有成熟的工程實踐來處理人為錯誤。只要AI的錯誤率在可接受範圍內,現有的安全網就能發揮作用。

埃雷門科還提到了漸進式信任建立的策略。從數據中心冷卻系統這樣的非安全關鍵應用開始,逐步建立對AI工程師可靠性的信心,然後才進入航空航天等高風險領域。

這種處理隨機性的方法也反映了P1.AI對AI能力邊界的清醒認識。他們不是在承諾完美,而是在提供一個可控的概率改進。在工程領域,這種務實的態度往往比過度的技術樂觀主義更有價值。

同時,這種方法也為未來的發展留下了空間。隨著AI技術的改進和更多實際數據的積累,Archie的可靠性有望繼續提升,逐步在更關鍵的應用中承擔更重要的角色。

八、未來願景:從工程效率到設計突破

在訪談的最後階段,埃雷門科描繪了一個從近期實用主義到長遠科幻夢想的完整圖景。他坦言:"我對預測三年以上的任何事情都很謹慎,特別是在這些急劇指數式增長的時代。"

近期目標相對務實:每個團隊都有一個Archie,占勞動力的10%。"他們做人類可能覺得無聊、沉悶、重複的工作。"可能還有額外的價值,比如"Archies之間的協調"等功能。

但埃雷門科的終極願景遠不止於此。"然後我可以想像一個超級智能,你告訴它'我想讓你開始建造戴森球',它就開始建造戴森球。"中間的過程"很難預測"。

當被問及普通人如何感受到工程AGI的影響時,埃雷門科首先提到了成本降低:"對普通人來說,影響是更低成本的商品和產品。"當主持人開玩笑問"所以你是說我可以買一架飛機?"時,埃雷門科回答:"也許吧。"

真正激動人心的可能性在於超越人類能力的設計:"我認為真正有趣的事情開始於Archie能夠設計我們無法設計的東西。這就是超級智能部分,不僅僅是關於現有組織的效率,或增加現有組織的帶寬,而是真正設計科幻書籍中承諾給我們的東西。"

這些包括"星際飛船和戴森球和麥特里奧什卡大腦"等概念。埃雷門科坦言:"所以最終,我是個夢想家。這就是我創辦這家公司的原因。這就是我想要的未來。這正是指導我們的北極星。"

在技術發展的具體預測上,埃雷門科看好物理AI——不是P1.AI意義上的工程設計,而是機器人技術和"用於攝取真實世界傳感器數據的基礎模型"。他認為這兩者都是P1.AI正在構建的重要組成部分,並且"非常接近"突破。

關於人形機器人,埃雷門科持樂觀態度:"基於我們正在嘗試構建能夠融入現有團隊的智能體的相同基礎,我認為人形機器人能夠更容易地融入現有環境,即使它們不是最優配置。"

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新