宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

馬斯克的Macrohard不是玩笑:xAI工程師超長訪談首次揭秘真相,這是一個數字版的Optimus!

2026年03月11日 首頁 » 熱門科技
馬斯克的Macrohard不是玩笑:xAI工程師超長訪談首次揭秘真相,這是一個數字版的Optimus!

2021年,Elon Musk在推特上發了一條推文:"Macrohard >> Microsoft"。Macro對Micro,hard對soft,巨硬對微軟,一個針對Bill Gates的文字遊戲,一開始幾乎沒人當真。

四年後,2025年8月1日,xAI悄悄向美國專利商標局提交了Macrohard的商標申請。8月22日,Musk正式宣布:"Join @xAI and help build a purely AI software company called Macrohard. It's a tongue-in-cheek name, but the project is very real!"(加入xAI,幫我們建一家純AI驅動的軟體公司,叫Macrohard。名字是開玩笑的,但項目是真的!)

12月30日,Musk宣布xAI購買的第三棟數據中心建築命名為"MACROHARDRR"——三個R,加強語氣。

從段子到商標註冊到實體建築,這就是Elon的風格。但Macrohard到底在做什麼,外界幾乎一無所知——直到2026年1月16日,YouTube頻道Relentless發布了一期訪談"WTF is happening at xAI"。

受訪者是Sulaiman Ghori,xAI的Member of Technical Staff(技術骨幹)。他在牛津讀過國際管理,創業做過AI產品,還搞過航天項目——加入xAI前不久,他剛在車庫用乙醇和液氧點燃了一台自製火箭發動機,夾克被噴出的未燃盡燃料點著了火。這種人大概是Elon最喜歡的類型。

Sulaiman從公司約100人時期加入,親歷了Grok 3發布、Colossus數據中心從無到有,過去四個月一直在Macrohard的"war room"里工作。這期訪談時長超過一小時,是xAI內部工程師罕見的公開發聲,也是Macrohard項目迄今最詳細的內部視角。

1. 122天建成Colossus:嘉年華許可證和80台移動發電機

"我們沒有截止日期,永遠是昨天。"

Colossus是xAI位于田納西州孟菲斯的超級電腦,目前是全球最大的AI訓練集群。2024年9月正式運行時配備10萬塊Nvidia H100 GPU,92天後翻倍到20萬塊。截至2025年底,xAI又收購了第三棟建築,總算力規模將達到近2GW(吉瓦),相當於150萬戶美國家庭一年的用電量。

行業標準流程需要18到24個月。xAI用了122天。

Sulaiman透露了幾個外界不知道的細節。首先是土地問題。正常的數據中心建設需要漫長的規劃審批,但xAI找到了一個漏洞——申請臨時用地許可。這種許可本來是給嘉年華、馬戲團這類臨時活動用的,審批流程極短。

"我們的土地租約技術上是臨時的,"Sulaiman說,"是最快能拿到許可的方式。所以我們現在技術上還是個嘉年華公司。"

然後是電力。孟菲斯當地電網接入只有8MW,遠遠不夠。xAI的解決方案是拉來80多台移動柴油發電機,總功率超過400MW。但這帶來一個新問題:當地電網負載升高時,整個數據中心需要無縫切換到發電機供電,同時不能中斷任何正在進行的訓練任務——而GPU的功耗以毫秒為單位在幾兆瓦之間劇烈波動。

"發電機是物理旋轉的東西,加速減速需要時間,"Sulaiman解釋,"所以我們加裝了電池組,Tesla Megapack。電池響應速度比發電機快得多,可以在毫秒級別平衡負載。"

整個電力系統形成了多層結構:本地電容器、數據中心側電容器、電池組、發電機、最後才是市政電網。每一層都是為了應對不同時間尺度的功率波動。

這套基礎設施後來還惹上了麻煩。美國環保署(EPA)認為xAI在沒有許可證的情況下運行燃氣輪機違反了規定,而xAI的立場是他們走的是臨時設備的豁免條款。截至2026年1月,這場爭議仍在繼續。

但對xAI來說,先干再說的邏輯貫穿始終。"我們被告知建數據中心需要24個月,"xAI官網上寫道,"所以我們自己動手,質疑一切,刪除所有不必要的東西,四個月完成了目標。"

2. 新GPU上架當天就能訓練:xAI的速度從何而來

122天建成Colossus已經夠瘋狂,但真正讓這家公司與眾不同的是軟體層面的疊代速度。

"我們的模型疊代可以做到每天一次,有時候一天多次,"Sulaiman說,"這在業內幾乎看不到。"

傳統AI實驗室的模型疊代周期以周計算,有時以月計算。原因很簡單:訓練基礎設施的準備工作極其繁瑣。新的GPU機架需要布線、配置、調試、集成到現有集群,然後才能開始訓練。這個過程通常需要幾天到幾周。

xAI把這個時間壓縮到了幾小時,有時甚至當天。

"我們的超算團隊消除了大部分典型的訓練障礙,"Sulaiman說。"機架上電後,有時候當天就能開始訓練,有時候只要幾小時。"

這種速度帶來的直接結果是實驗數量的爆炸式增長。當別的實驗室在等待基礎設施就緒時,xAI可以同時並行運行20個以上的實驗。更重要的是,他們可以在實驗中快速試錯、快速調整方向,而不是押注在單一路線上。

Sulaiman提到了一個具體的例子。xAI正在開發的一種新架構需要全新的預訓練語料庫和數據集,但在基礎設施層面,他們有能力每天甚至每天多次推出新的模型疊代。"這是從預訓練開始的,"他強調,"不是微調,是從頭預訓練。"

這種速度優勢的來源是xAI最大的護城河。其他實驗室在AWS或Oracle上租算力,容量就是上限;xAI自己建數據中心,自己定義上限。

3. Macrohard:數字世界的Optimus

訪談中最有資訊差的部分來了。Musk公開宣布時只說Macrohard要做"純AI軟體公司",但具體怎麼做、做什麼,外界完全不知道。

Sulaiman揭開了謎底。Macrohard的核心邏輯可以用一句話概括:Optimus機器人要替代人類的物理任務,Macrohard要替代人類的數字任務。

但xAI選擇的路徑和其他AI實驗室完全不同。他們不打算讓企業改造軟體來適配AI,而是讓AI直接模擬人類操作電腦的方式——鍵盤輸入、鼠標點擊、看螢幕、做決策,完全複製人類的工作流程。

"任何軟體都不需要改造,"Sulaiman說。"我們可以部署到任何人類目前能工作的場景。"

這個項目最關鍵的早期決策是速度。整個行業都在堆大模型、做更深的推理,xAI反其道行之,選擇了小模型追求速度。目標是比人快至少1.5倍,實際進展已經達到8倍甚至更多。

"沒人願意等10分鐘讓電腦做自己5分鐘就能完成的事,"Sulaiman解釋邏輯,"但如果10秒就能搞定,用戶願意為此付任何價格。"

這和Tesla全自動駕駛(Full Self-Driving,簡稱FSD)的路徑高度一致。Tesla也選擇了更小、更快的模型,而不是堆疊參數追求推理深度。Elon曾公開表示,Tesla的AI5晶片在特定推理任務上比當前的AI4快40倍,同時功耗只有250瓦——這對Optimus機器人來說是生死攸關的指標,因為機器人的電池容量遠小於汽車。

選擇小模型還有個副產品:疊代周期大幅壓縮。如果用大模型,訓練周期可能是4周;小模型可以壓縮到1周,實驗數量可以並行到20個以上。這讓xAI在技術路線的試錯效率上遠超同行。

但最讓人意外的是部署方案。

"部署100萬個人類模擬器需要100萬台電腦,"Sulaiman說。"傳統方案是租AWS或買Nvidia硬體,成本極高。"

答案來自Tesla。

北美有超過400萬輛Tesla,其中一半以上配備了Hardware 4,這是Tesla為自動駕駛設計的車載計算晶片。這些車70%到80%的時間在充電或停著,自帶網路、散熱、供電。理論上,xAI可以付費租用車主的閒置算力,讓車載電腦運行人類模擬器。

"這是純軟體實現,不需要任何基礎設施建設,"Sulaiman說。"車主拿到租金,相當於車貸被付掉了;我們獲得零基建的算力網路。"

如果這個方案落地,xAI從1000個虛擬員工擴展到100萬個的邊際成本幾乎可以忽略不計。

4. 虛擬員工已經在xAI內部運行

Macrohard聽起來像是遠期願景,但Sulaiman透露,這套系統已經在xAI內部作為"虛擬員工"測試了。

"我們沒有告訴公司里的人,"他說。"有時候有人在做什麼事情,問某個'同事':'你能幫我一下嗎?'虛擬員工說:'好啊,來我工位找我。'他們走過去,發現那裡什麼都沒有。"

這種情況發生了不止一次。Sulaiman收到過消息問他:"組織架構圖上這個人是你的下屬嗎?他今天不在嗎?"不是不在,是根本不存在。

更有意思的是泛化能力。"就在今天,我們給Elon展示了幾個案例,這些任務我們完全沒有訓練過,但它做得非常完美,比預期好很多,"Sulaiman說。

這和FSD的發展軌跡類似。Tesla的自動駕駛系統經常能正確應對訓練數據中從未出現過的場景,比如從未見過的路障、非標準交通標誌、異常天氣條件。這種"泛化"能力是深度學習系統最難預測、也最有價值的特性。

xAI的Macrohard項目已經在內部運行了4個月的"war room"(作戰室)模式。他們把原來的作戰室擠滿了,搬到了公司的健身房,把器械清空,全部換成工位。

"Elon有一次走進原來的作戰室,發現空無一人,'人都去哪了?'然後走到健身房這邊,開始他的即興問答,"Sulaiman回憶。"那是個漫長的夜晚。"

5. 只有三層管理:xAI的組織方式

xAI的組織結構可以用三層概括:IC(Individual Contributor,個人貢獻者)、聯合創始人和新晉經理、Elon。沒有中間層。

"我本來以為會有更多自上而下的指令,"Sulaiman說,"實際上比預期少很多。"

因為每個經理現在可能有100多人直接匯報,自上而下布置任務幾乎不可能。大多數方案都是底層提出,上面點頭或者給反饋,然後執行。

xAI的團隊邊界也是模糊的。如果Sulaiman需要修復VM(Virtual Machine,虛擬機)基礎設施的問題,他可以直接改代碼,給負責人看一眼,合併,部署。沒有嚴格的權限邊界,所有人默認被信任能做正確的事。

"這是我從沒在任何規模相近的公司見過的,"他說。

iOS團隊在推送某個大版本時只有3個人。"用戶量和團隊規模完全不成比例,但每個人都極其優秀。"

另一個例子是銷售團隊。Sulaiman入職第一周,和一個做企業銷售的人坐在一起吃飯,本以為對方是銷售背景,結果對方開始聊自己正在訓練的模型。銷售團隊也是工程師。當時整個公司可能只有不到8個人不是工程師。

Elon在招聘討論時反覆強調一個詞:engineers。不用區分AI researchers還是AI engineers,就是engineers——能解決問題的人。

"這保持了招聘的廣度,"Sulaiman解釋。"意味著人可以從非常不同的背景進來。SpaceX有很多這樣的故事,有人從完全意想不到的領域加入,最後在工程上做出巨大貢獻。"

6. 幾乎不存在的文檔系統

xAI幾乎不寫文檔。

"事情變化太快,來不及寫,"Sulaiman說。想了解某個系統,要麼讀代碼,一路go to definition(跳轉到函數定義)追下去,要麼直接問人。所有人都在同一棟樓,走過去問就行。

他對此最驚訝的是:所有人都很願意幫忙。

"我以為聰明人會很傲慢,但這裡的人既聰明又友善。大家都在同一條船上,都在互相支持。"

目前xAI正在嘗試用Grok自動生成文檔。因為他們有無限訪問自家AI的權限,可以嘗試很多在外部公司成本過高的實驗。"在創業公司,這種實驗可能要花10萬或100萬美元的API調用費。我們免費做。"

7. 提案後的兩種回應

在xAI提一個想法,得到的反應只有兩種:"這很蠢",或者**"為什麼還沒做好?"**

"如果是後者,當天就可以實現,當天就能展示給Elon或任何人看,當天就有結論,"Sulaiman說。"沒有等待,沒有流程。"

"沒有人對我說不。這是在這裡工作最有趣的事情。如果我有好主意,當天就能實現。"

他以為從極小的創業公司跳到一個更大的組織會犧牲一些這種自由度。"xAI在我加入時有大概100人,對我來說已經是之前任何地方的10倍了。但它感覺還是很小。沒有太多overhead(管理開銷)。"

更讓他意外的是,在xAI工作比自己單幹還快。

"我本來以為自己做XYZ實驗會更快,但在xAI通常更快,因為有一個團隊已經把很多基礎工作做好了,而且沒有人說不。"

8. Elon的存在感:打電話就能讓供應商第二天出補丁

Sulaiman描述了Elon在日常工作中的存在感。

新GPU上架後經常有兼容性問題。傳統流程是和供應商來回溝通幾周。在xAI的做法是:開會時把問題告訴Elon,他打一個電話,Nvidia的軟體團隊第二天就推送補丁,然後雙方工程師並肩調試到問題解決。

"那種原本要拖幾周的阻礙,一個電話就清除了。"

Elon的反饋很少落在中間層。高層面是產品方向,比如"只專注這個客戶群"或"完全不要做這件事"。底層面是具體的計算效率或延遲問題,他會提出非常具體的嘗試建議。

"但他願意被證明是錯的——前提是有實驗數據,不是誰的觀點。有時候實驗結果出人意料,他就接受然後調整方向。"

Sulaiman還提到了一個關於Elon時間線預估的觀察。

"他自己也在不斷校準。現在他的預估準確得多了,而且更新頻率更高,有時候每天都在根據新資訊調整。"

早期的Elon以激進的時間線著稱——SpaceX的火箭、Tesla的自動駕駛都經歷過反覆延期。但Sulaiman認為,經過這麼多年部署大規模硬體的經驗,Elon對時間的判斷越來越精確。

"他確實部署過極大規模、極多種類的硬體,這讓他的感覺越來越准。"

9. 24小時贏得一輛Cybertruck

訪談中有一個讓人印象深刻的小故事。

xAI有個工程師叫Tyler,負責新GPU機架的部署。某天晚上,Elon說:"如果你能在24小時內讓這些GPU開始訓練,今晚就送你一輛Cybertruck。"

"那天晚上我們就開始訓練了,"Sulaiman說。"他拿到了Cybertruck。現在還停在我們午餐窗戶能看到的地方。"

這個故事聽起來像矽谷傳奇,但它反映的是xAI的運作邏輯:高強度、高回報、極短的反饋周期。

xAI內部算過一筆賬:把公司估值除以代碼庫的commit(代碼提交)次數,平均每次commit大約貢獻250萬美元價值。

"我今天commit了5次,"Sulaiman開玩笑說,"相當於創造了1250萬美元價值。輕鬆的一天。"

這個算法粗糙,但邏輯清晰:一個好工程師隨手改幾行代碼的期望回報極高。所以公司願意投入大量資源招聘,願意用Cybertruck激勵24小時衝刺,願意容忍那麼高強度的工作節奏。

Sulaiman有幾周每周做20場以上的面試,短的15分鐘,長的1小時技術面。

10. 招聘:尋找能找到10行解決方案的人

xAI的招聘標準很獨特。

Macrohard要部署在跨越30到40年的各種硬體上,從30年前的老顯示器到最新的5K Apple顯示器,都要在同一套代碼上跑。複雜方案會讓代碼庫爆炸。AI寫代碼很樂意輸出200行,但10行方案往往更好。

"我要找的是能一眼看穿簡單解法的人,"Sulaiman說。

面試時他會給一個自己之前創業解決過的電腦視覺問題。解法其實非常簡單,但大多數人會過度設計。他不會公開這個問題的細節,因為一旦公開就失去了篩選效果。

另一個技巧來自xAI聯合創始人Igor Babuschkin。Igor曾是Google DeepMind的AlphaStar項目技術負責人——這個AI系統在2019年達到了《星際爭霸II》的宗師級水平,是深度強化學習(Deep Reinforcement Learning)的里程碑成就。

Igor的面試技巧是在題目里故意埋入一個不可能的要求或者明顯錯誤的條件,看候選人會不會回來質疑。如果悶頭做完不吭聲,不錄用。

"我要的是會挑戰需求、挑戰我的人,"Sulaiman說。

(註:Igor Babuschkin於2025年8月離開xAI,創辦了專注AI安全投資的Babuschkin Ventures。他在離職聲明中提到,與Future of Life Institute創始人Max Tegmark的一次晚餐對他影響深遠——Tegmark展示了兩個兒子的照片,問他:"我們怎樣才能讓AI足夠安全,讓下一代人能在安全的環境中成長?")

11. 倒推思維:從收入目標到物理約束

xAI的規劃邏輯永遠是倒推。

"如果要在某個時間點達到100億美元收入,最高槓桿的事情是什麼?需要什麼系統?然後才是物理和軟體層面怎麼實現,"Sulaiman解釋。"物理需求是最後一步,不是起點。"

一個典型例子:Grok 4或5的規模和預期,在Grok 3時期就已經規劃好了,比Sulaiman入職還早。因為團隊足夠可靠,長期規劃的假設基本都能兌現。

"這讓你可以更長遠地思考,"他說。"你可以假設那些估算會被完成,因為每個人都很優秀、很可靠。"

反過來,當有人提出某個時間線的估算時,Elon會追問到底:這個估算基於什麼假設?每個假設對時間線的影響有多大?哪些假設是人為的、可以被打破的?

"你花兩分鐘想一想,可能抱怨一下,然後剩下的時間全部用來在那個時間內完成它,"Sulaiman描述這個過程。"經常發現,原來估算的時間基於一些假設,而這些假設一旦被打破,時間線就可以縮短2倍。做幾次這樣的操作,你就能滿足任何看起來不可能的要求。"

"當然,最終你會觸及物理限制。但你從來不是從物理限制開始的。"

12. 數據中心的"surge"文化

SpaceX和Tesla歷史上都有"surge"(衝刺)的傳統——Elon會在某個關鍵時刻發出全員郵件,要求所有能來的人連夜工作。

xAI也有類似的文化,尤其是在大模型發布前後。

"對Macrohard來說,我們已經在war room里連續運作了4個月,"Sulaiman說。"所以我們一直處於那種push的狀態。"

公司有睡眠艙(sleeping pods),後來又加了雙層床。當那張著名的"帳篷照片"流出時——xAI員工在數據中心旁邊搭帳篷——Sulaiman收到很多人轉發給他。他的反應是:"確實有帳篷,但我從沒見過那麼多帳篷同時出現。"

xAI聯合創始人Igor在離職前發過一條推文,大意是:**"有些月份只過了幾天,有些夜晚卻過了幾個月。"**Sulaiman說那完全是真的。

"技術上的結果,我們可能幾周內就能達到。但一個晚上做完是個巨大的push,那是個漫長的夜晚。"

13. 理解"什麼是真相":Grokipedia的挑戰

訪談後半段,主持人問到了一個敏感話題:如何讓AI模型更"truthful"(追求真相)?

Elon多次公開批評維基百科存在偏見,xAI一直在探索創建某種替代版本。但Sulaiman坦言這是個極難的問題。

"網際網路不是真相的來源,"他說。"我們儘可能追溯到基本原理——但什麼是憲法的物理學基礎?這不是一個任何人都能真正回答好的問題。"

他提到了一個參考:英國科普作家James Burke的《Connections》系列。Burke的方法是把兩個看似毫無關聯的概念,通過物理學和發明史連接起來。xAI在嘗試類似的思路,但這幾乎沒有現成的文獻可以依賴。

"數據不是唯一影響結果的因素,"Sulaiman說。"你怎麼訓練那些數據,怎麼評估,怎麼更新權重,這些都很重要。你可以試著忠實地復現輸入輸出,但那樣你只是做了一個糟糕的複製粘貼機器。有一定的藝術成分在裡面。"

當Elon在X上看到Grok輸出了明顯錯誤的內容,他會怎麼做?

"他給我們看出了什麼問題,然後當時醒著的人會開一個thread(討論串)去解決,"Sulaiman說。"通常單獨拉幾個人進來,然後做一個事後復盤,說明發生了什麼、怎麼避免下次再犯。"

"犯一次錯可以,犯同樣的錯兩次是大問題。"

14. 13歲的3D列印創業和被燒著的夾克

訪談最後幾分鐘,主持人問到了Sulaiman的個人經歷。

他在11歲時開始學編程,契機是發現可以靠給遊戲寫外掛腳本賺錢。他在網上找到一些做這個的人,學會了技術,開始在PayPal賬戶里看到零星的幾百美元入賬。

"那感覺太瘋狂了。"

他用這筆錢買了一台RepRap 3D印表機的零件——那時候3D列印還沒有成品機,只能自己組裝。零件從中國寄來,他花了一整個通宵組裝,結果解開電源銅線時一根銅絲扎進了拇指2英寸深。

"那是個上學日,凌晨3點,13歲的我不太會組裝東西。我在浴室里花了一個小時用鑷子拔,拔不出來,就剪掉了。接下來幾周它慢慢長出來,我每天早上剪掉一點。"

印表機組裝好後,正好趕上指尖陀螺(fidget spinner)熱潮。他從中國買了1000個滑板軸承,每兩小時清空一次列印床,噴漆,組裝,然後跑到其他學校的公交站賣給"經銷商"——其他學校的孩子。

"兩個月後被學區叫停了。官方理由是給學校供餐的公司有在學校地產上的獨家銷售權。但我覺得他們只是不喜歡我分散大家注意力還賺錢。"

"這教會了我對權威保持一種健康的不敬。"

加入xAI之前不久,他在感恩節前一天決定:要麼今晚把那台液體燃料火箭發動機點燃,要麼兩周後再做。他選擇了當晚。

"我設計了遠程點火系統,但給車載電腦供電的電源線還沒到,只有一根6英尺的USB線,所以我必須站在旁邊點火。"

火箭發動機使用乙醇和液態氧。噴射器設計不夠完美,產生了過壓,一些未燃盡的乙醇噴出來落在他夾克上,著火了。

"那件夾克現在還是戰利品。"

Q1: xAI為什麼能比其他AI實驗室更快?

核心是自建基礎設施。其他實驗室受限於雲服務商的容量,xAI自己建數據中心,從機架通電到訓練開始最快只要幾小時。這讓模型疊代可以做到每天甚至一天多次,實驗並行數量遠超同行。組織層面只有三層管理,幾乎沒有文檔和流程審批,團隊邊界模糊,所有人默認被信任可以改動任何代碼。

Q2: Macrohard項目的核心邏輯是什麼?

不改造企業軟體,而是讓AI直接模擬人類操作電腦的方式(鍵盤、鼠標、看螢幕)。關鍵決策是選擇小模型追求速度而非大模型追求推理深度,目標是比人快8倍以上。部署可能利用Tesla車載電腦的閒置算力——北美400多萬輛Tesla大部分時間閒置,自帶算力、網路、散熱、供電,可以付費租用車主的閒置時間。這套系統已經在xAI內部作為"虛擬員工"測試運行。

Q3: xAI的招聘和工作方式有什麼特別之處?

尋找能找到簡單解決方案的人,會在面試中故意埋入錯誤要求測試候選人是否敢於質疑。公司內部每次代碼提交的期望價值約250萬美元,所以願意投入巨大資源招聘。工作強度極高,有睡眠艙和雙層床,項目可以連續在"war room"模式下運作數月。但自由度也極高——提案後的反饋只有兩種:"這很蠢"或"為什麼還沒做好",沒有中間的流程和等待。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2026 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新