李想放話「今天的智能車都不算真智能」，於是理想宣布要造「具身智能汽車」

15日下午，理想汽車李想放話今天的智能車都不算真智能於是理想宣布要造具身智能汽車開了一場資訊量極大的發布會。理想汽車董事長兼CEO李想走上台，拋出了一個激進觀點：「今天的智慧型手機和智能汽車，談不上真正的智能。」

贊助商廣告

但真正讓這場發布會有戲劇性的，還不只是李想的這句話，而是理想汽車基座模型負責人詹錕提到的一次經歷。

一個月前，詹錕去了一趟矽谷。他把特斯拉李想放話今天的智能車都不算真智能於是理想宣布要造具身智能汽車最新的FSD V14.3連開了兩個星期。回國之後，他給團隊留下兩句話：「第一，特斯拉真的太強大了。第二，壓力也真的太大了。」他回國緊急召集了核心算法團隊復盤，也直接催生了這次的馬赫VLA更新。

近兩個小時的會議，理想汽車同時發布多個產品：一顆自研車規晶片馬赫M100、一套自研作業系統星環OS、兩個自研模型馬赫Mind-Pro和馬赫Mind-Edge、還有升級的馬赫VLA、一組現場跑通的Livis Agent 李想放話今天的智能車都不算真智能於是理想宣布要造具身智能汽車演示、一份2026年OTA計劃表、以及一個新概念——具身智能汽車。這四樣產品，被裝在同一台量產車上，從底層硬體到頂層產品體驗，全棧自研。

理想正在試圖用「具身智能」的標準，重做一遍「智能汽車」這個品類。

/01/ 用三個新維度，重新定義智能汽車

敢於全盤否定過去，李想的邏輯是什麼？

他指出，過去十幾年，行業公認的「智能汽車」普遍遵循三要素：軟體定義硬體、聯網且實時在線、系統可以持續升級。智能汽車是這樣，智慧型手機也是這樣。

李想在台上明確指出，這三要素已經不夠用了。「雖然名字上掛著智能，但今天的智慧型手機和智能汽車，都不是真正的智能，它們本質上還是功能驅動的，而不是一個有生命力的智能體。」

判斷一輛車是否真正智能，李想給出三個維度：安全、能力、效率。

先說安全。李想說，傳統智能汽車對安全的定義，是「功能安全、免責優先」，在簡單道路上表現很好，一旦遇到複雜路況、極端天氣、從未見過的場景，它最常見的做法是退出，把方向盤交還給駕駛員。這種處理「從法規上講合規，但對於人類，恰恰是最危險的瞬間」。李想提到一個數據，接近一半的智駕事故，發生在系統把方向盤丟給駕駛員的那一瞬間。

贊助商廣告

再說能力。李想指出，傳統智能汽車是「特定功能、特定場景」，有很多功能，開導航、開冷氣、放音樂、輔助駕駛，但它只是在「調用一個個功能」，但它並不真正掌握人類司機在複雜場景下的倒車、騰挪、靠邊停車、禮讓能力。

最後說效率。李想說，傳統智能汽車是「人機共駕、人機協同」。他在現場問觀眾，「你們通常什麼時候「不用」智駕？」台下有人答：趕時間、要遲到了、胡同窄路。這個答案很真實，這也從側面說明，關鍵時刻，人類其實並不相信智駕，所以智駕要做的工作還有很多。

這三個維度結合，就是李想給智能汽車定下的標準：保護人類安全、獨立完成任務、比人效率更高。

李想自己也很清楚，從舊定義跳到新定義，不是修修補補能解決的。「它比從大語言模型到今天的Agent要難得多，我們必須重構整個系統。」

那麼這次重構，從哪裡開始？理想正式提出一個新概念：具身智能汽車。

「我們要用具身智能，打造一輛能夠保護人類安全、獨立完成任務、比人類更高效的具身智能汽車。」李想如是說。

/02/一個新定義：具身智能汽車

理想汽車將具身智能汽車定義為「四位一體」：

它是一輛電動車。具身智能汽車要服務真實世界，需要有身體，能移動，能達到目的地。

它是一位職業司機。理解道路、風險、交通規則，能完全可靠完成出行以及生活任務。

它是一台AI電腦。比旗艦智慧型手機和電腦有更強的AI算力，更大的內存，內存和顯存一體化，專為大模型設計。

它是一個生活助手。不需要研究怎麼操作各種軟體，只需要把任務告訴它，它來幫你完成。

李想強調，「這不是四個產品，這應該是一個產品」。過去新勢力車企做的事，大多是把這四樣東西分別做好：智駕團隊做智駕、座艙團隊做座艙、底盤團隊做底盤、車機系統做應用。理想這次要做的，是讓這四樣東西同時長在一個底層架構上。

贊助商廣告

李想給出了一個類比：「在iPhone出現以前，沒人知道自己需要觸摸的螢幕。在特斯拉Model S 李想放話今天的智能車都不算真智能於是理想宣布要造具身智能汽車出現之前，沒人相信電動車這麼讓人心動。所有沒有被展示出來的可能性，往往會被誤以為是不存在的需求。」

把這套定義落到工程上，意味著理想汽車至少要重做三件底層的事：一顆自研晶片、一套自研作業系統、一組自研模型。

/03/大腦：三個自研模型

具身智能的大腦，被理想汽車拆成了兩支：語言智能負責「聽得懂任務」，機器智能負責「開得到目的地」——前者由兩個自研大模型馬赫Mind-Pro和馬赫Mind-Edge承擔，後者由自研馬赫VLA承擔。兩支共享同一套底層認知，共同構成一個完整的大腦。

先看語言智能這一支。

這一次，理想正式推出兩個全新模型——馬赫Mind-Pro與馬赫Mind-Edge，分別走雲端和端側兩條路徑。根據理想汽車基座模型負責人詹錕介紹：

馬赫Mind-Pro走雲端，定位是Agent智能體模型。在IFEval指令跟隨、LongBench-v2超長文本理解、AIME26高階數學推理、BFCL-v4工具調用等行業基準上，穩居第一梯隊；放到Agent專項領域，Claw系列榜單、PinchBench-v2實景實測，綜合性能超越大多數主流Agent模型。

贊助商廣告

詹錕強調「實驗室跑分終究只是紙面數據」。理想拿出來的實戰數據是，依託Livis Agent全場景體系，在Token生成速度、任務完成質量、Token使用成本、端到端響應時延四個商業核心維度，實現全面領先。通過Token壓縮技術，任務完成率零衰減的前提下，Token平均消耗降低38%，工具調用冗餘輪次減少47%；TPS峰值達到208 Token/s，推理效率是主流Agent模型的2倍以上。

這背後是一套「混合強化學習並行訓練體系」。理想搭建了數百套真實業務沙箱環境，高精度模擬工具調用環境；同時並行運行三套差異化訓練環境，覆蓋單步強化學習、長鏈路多步強化學習、在線環境強化學習。

馬赫Mind-Edge走端側，主打端側原生具身智能體。現場播放了一個演示影片，用戶問「我的耳機找不到了，你能幫我找一下嗎?」系統答：「找到了，你的耳機在扶手箱上。」

詹錕解釋，馬赫Mind-Edge採用多模態流式時序建模，能夠連續理解動態的物理世界，具備因果推理和自主決策能力。再加上大量車載專屬的行為特化訓練，讓模型擺脫傳統AI「只回答不行動」的模式，它可以直接輸出動作，實時調用車輛硬體。

它的一系列能力，包括Always On全天候主動感知、人車交互、自主控車、多模態問答，全部在車端本地實現，低時延、高可靠，數據完全不上傳。「這不是雲端模型的閹割版本，而是從底層就為車載場景原生打造的模型。」詹錕強調。

以上，雲端馬赫Mind-Pro負責複雜Agent任務調度，端側馬赫Mind-Edge負責實時人車交互。兩個模型，共同構成了具身智能的語言智能層。

接下來，機器智能這一支是「馬赫VLA」。

贊助商廣告

在講VLA的時候，詹錕就講了文章開篇所提到的體驗特斯拉FSD V14.3的事跡，他隨後補了一句說：「真正感受到壓力，才證明我們是在平視這個星球上最強大的對手，而沒有在國內的內卷中自我麻痹。」

這種壓力，直接催生了馬赫VLA系統的全面升級。它的三個維度，正好對應李想前面立下的智能汽車三條標準：保護人類安全、獨立完成任務、比人效率更高。

安全維度。理想給了一組背書數據：截至2026年6月14日，理想全系智能駕駛主動避險總次數17273307萬次，其中重大避險55671次。從2022年至今1400餘天，平均每日主動避險1.2萬次。「用戶出行每遇到100次道路險情，就有一次會直接釀成車禍。我們硬生生把災禍從命運邊緣拉了回來。」

AEB和AES的疊代路線也鋪了出來：2022年雷射雷達首次落地主動安全；2023年AEB完成全速度段覆蓋；2024年行業首發AES，同時實現360度低速全方位防禦；2025年AES升級支持多車連續避讓和防硬躲避被撞；2026年新增懸空障礙物識別,夜間剎停上限提升到130公里。

效率維度。普通人從發現危險到踩下剎車的反應時間是0.45秒(權威論文數據)。如果在查看導航或回復消息，反應時間會到秒級。地表最強F1車手的極限反應是0.25秒。「我們全新一代馬赫VLA系統的反應耗時是0.28秒，無限逼近人類的生理極限。」

多出來的0.17秒意味著什麼？在120公里時速下能提前6米完成剎停。6米是一台幻影李想放話今天的智能車都不算真智能於是理想宣布要造具身智能汽車勞斯萊斯的整車長度，也是「剎停到相撞、生存到毀滅」的全部距離。

這0.28秒不是單一模組快出來的。視覺輸入時延降低47%，模型推理鏈路縮短43%，線控底盤響應降低38%，作業系統調度編排降低28%，端到端總時延降低40%。「不是哪個模組變快了，是整個鏈路從頭到尾都變短了。」

能力維度，理想拿了幾段真實場景影片做證據：施工區域繞行、挖掘機爪臂動態避讓、對向窄路主動切倒擋禮讓、識別穿黃馬甲保安的手勢、低矮異形物體識別、廣州傍晚雨夜的城中村小路。最後那段廣州城中村的影片最關鍵。路寬不到3米，沒有車道線，沒有交通標識，路邊打傘行人、外賣騎手、占道小販混雜。「很多廣州老司機開起來都頭皮發麻。但馬赫VLA開得極其從容，根據對向來車、行人、電動車的位置主動輾轉騰挪，給每一個參與者都留足空間。」

贊助商廣告

馬赫 VLA 這一代的能力從哪裡來？詹錕把它歸納成三個變量的同時躍升：「這背後是數據、算力、模型規模同時暴增下，Scaling Law帶來的能力湧現。」

算力方面，雙馬赫M100讓車端算力達到2560TOPS。數據規模方面，模仿學習數據量增加50%，強化學習數據量增加15倍，訓練算力增加5倍。模型規模方面，行泊一體模型徹底統一，參數量提升10倍，每秒Token計算量提升15倍。

但比湧現更關鍵的，是架構層的重構。理想直接把感知、預測、規劃三個模組統一成「原生多模態MoE大模型」。「過去模組化的模型結構有一個致命缺陷，感知、預測、規劃三個模組各玩各的，就像一家公司，市場部說這事能幹，研發說我壓根沒收到消息，財務說我還不知道有這個項目。功能都沒錯，但整體意圖完全不一致。」

圍繞這個統一的大模型，理想還做了兩件配套的事：一件是馬赫 World Model，一個能模擬真實物理世界的世界模型，給馬赫 VLA 提供訓練所需的虛擬環境；另一件是 RL Infra，強化學習的訓練基礎設施，讓 VLA 能在世界模型里持續試錯、疊代。如此一來，馬赫 VLA、馬赫 World Model、RL Infra 三位一體，構成一套完整的具身智能模型訓練體系。「看見、理解、思考、行動，從一開始就在同一個框架里徹底對齊。我們從第一天起就是為具身智能而生。」詹錕說。

新架構搞定了，但具身智能還需要真正「看懂」世界，這就涉及視覺方案的選擇，業界有的在卷雷射雷達，有的在卷視覺方案，詹錕在這裡強調：

「行業都在瘋狂卷雷射雷達的線數。128線、256線、512線，越卷越離譜。但雷射雷達的線數再高，它能告訴你紅綠燈現在是什麼顏色嗎？能讀懂路牌上『前方施工禁止通行』這幾個字嗎？能看懂穿黃馬甲的保安手勢是讓你停還是讓你走？都不可能。」詹錕說，「雷射雷達只能理解世界的骨架，根本不能理解這個世界。」

贊助商廣告

理想這次讓3D ViT首次上車，現場把鏡頭切到觀眾席，3D ViT瞬間重建了整個三維世界，觀眾姿態、場館細節、後排文字全部被記錄下來。

模型層面的進展，理想給了兩個明確的OTA節點：第三季度，為搭載 Orin 和 Thor 晶片的 AD Max 用戶推送全新馬赫 VLA 模型；第四季度，馬赫 VLA 模型能力對齊全球頂尖水平。後一句「對齊全球頂尖水平」，指的就是特斯拉的FSD V14。「這是我們對自己的要求，更是對用戶的承諾。」詹錕說。

/04/心臟：發布馬赫 M100，5nm 車規級晶片，1280TOPS 單晶片算力

具身智能汽車的大腦跑在哪裡？

於是，理想正式發布馬赫 M100。「馬赫 M100是一顆用完全不同思路造出來的晶片。」理想汽車CTO謝炎說道。

這顆晶片從2022 年立項，歷經三年半打磨，於2026年5月實現量產上車。

謝炎在台上把晶片高高舉起，講起它的參數。5納米車規級工藝，單晶片算力1280 TOPS，「是目前全世界量產最強大的車規級算力晶片」；實際運行效率超過 82%，主流基於 SMT 架構的 GP GPU；超過一半的晶圓面積留給神經網路處理器，由56個計算單元和1個數據處理模組構成，採用網格總線加數據環形總線雙互聯架構；CPU 部分，24 核 ARM A78AE，主頻 2.3GHz，車載旗艦級大核，負責安全和系統控制；內存部分，8 通道 LPDDR5X 子系統，273 GB/秒超高頻寬，提供片外大容量內存高速通道。

贊助商廣告

但參數本身只是數字。理想拿馬赫M100做了兩組對比，信號量都很強。

第一組對比，跟全球公認智駕領域最主流的晶片ThorU直接對比CNN Based、UniAD、馬赫VLA模型。每一項每一個測試，馬赫M100全部超越ThorU，是數倍的性能差距。

第二組對比更有意思。謝炎在馬赫M100上部署了Qwen3.5-35B，跟NVIDIA的DGX Spark桌面超算對比。結果是Qwen3.5-35B-A3B prefill速度，馬赫M100是DGX Spark的2.7倍；Qwen3.5-35B-A3B decode速度是1.5倍。一個裝在車裡的晶片，跑通用大模型比一台4萬塊的桌面超算還快。

贊助商廣告

馬赫M100號稱"全球首款量產的動態數據流AI晶片"。這裡面不一樣的，是「數據流」三個字。

傳統晶片是怎麼幹活的？可能是一步一步走的員工，它有一張待辦清單(行話叫「指令隊列」)，從清單第一項開始，做完一項做下一項，順序嚴格不能亂。這種方式的問題是，清單本身要寫、要管、要排序，晶片很大一部分電晶體不是在算東西，是在管理這張清單。算AI模型這種海量並行的任務時，管理成本越來越高，效率上不去。

但謝炎說，AI計算其實根本不需要這張清單。「AI計算天然是並行的，數據是確定的、關係是清晰的、流動路徑是固定的。」翻譯一下：AI 模型在做什麼、下一步要處理什麼數據、這些數據要流向哪個計算單元，在模型設計的時候就已經寫好了。既然路徑是固定的，就不需要一個中央調度員去現場指揮。

所以理想汽車做了一件顛覆傳統的事：把那張待辦清單和清單管理員全砍掉，讓數據自己驅動計算的發生。數據流到哪裡，計算就在哪裡發生。

「馬赫M100的能力遠不止於智能駕駛，它今天已經跑通了車上所有的智能化場景。它能運行語言大模型，它能支撐Agent，它將驅動具身智能，它還會支持更多我們今天還沒有想到的AI場景。」謝炎說。

這套架構也拿到了一個學術層面的背書。謝炎在台上宣布，今年馬赫 M100架構的論文被ISCA 2026工業分區收錄。同期入選的是谷歌、美光、Meta、安培、MegaBlast。「理想汽車是汽車行業中第一家，歷史上第一家在ISCA工業分區獲得論文錄取的企業。」

謝炎特意申明：「我們入選 ISCA 從來不是因為造了一顆晶片，是因為提出並實踐了一種創新的架構思路。」馬赫 M100 架構團隊將於6月30日在ISCA 2026會議現場進行主題分享。

「馮·諾依曼架構用七十年推動了通用計算的輝煌。今天我們以馬赫 M100 為起點，希望用數據流架構，接過歷史的這一棒，繼續推動 AI 計算再輝煌七十年。」謝炎最後立下宏願。

贊助商廣告

/05/神經系統：星環OS與晶片到算法的全棧自研

光有晶片不夠。具身智能需要一套完整的系統，把心臟、大腦、眼睛、手腳組織起來協同工作，這套系統的「神經系統」，叫做「星環OS」。

「星環OS是理想汽車為具身智能專門設計的神經系統，從設計的第一天起，它就是為 AI 原生而生。」謝炎介紹，「感知、決策、執行全鏈路深度融合，結合全線控底盤的極速響應，我們把端到端的延時壓縮到了0.28秒，反應速度比人類快40%。這就是系統協同的力量，它不是晶片快，也不是軟體快，是整個系統一起快。」

這套系統里，馬赫M100晶片是心臟，全車感知系統是眼睛，自研馬赫模型是大腦，全線控主動底盤系統和能源系統是手腳，星環OS是神經系統，把它們串成一個整體。

為什麼連作業系統也要自己做？謝炎向台下問了一個問題：「蘋果和安卓哪一個更安全？」台下答「蘋果」。「為什麼？因為蘋果把晶片和作業系統放在一起設計。安全，不是系統啟動之後才開始，安全是從晶片上電那一刻就已經開始了。手機晶片被攻擊，泄露的是隱私；車的晶片被攻擊，威脅的是生命。」謝炎講出背後邏輯。

理想汽車把密鑰保護、設備身份、可信啟動鏈、關鍵權限管控全部前置到晶片設計中，再通過全棧自研軟體實現統一調度。讓晶片、編譯器、作業系統、AI 算法在同一套可信的基礎上協同運行。

贊助商廣告

到這裡，理想汽車完成了一個少有車企能完成的動作：晶片、編譯器、作業系統、AI算法、域控制器，全棧自研。

/06/量產路徑：讓具身智能成為日常，Livis Agent現場實操

底層架構講完，真正的問題來了，這一切到底能不能落到一台普通用戶開的車上?

現場，理想直接做了一場真實的Livis Agent演示，展現了它的多項車載智能體能力。「請相信我，這些展示都是真正運行在模型上的Agent，絕不是提前寫好的程序。」謝炎強調。

演示中，這個Agent可以根據一句自然語言指令，完成接機、餐廳推薦、路線規劃等連續任務。甚至，可以根據「孩子困了」等場景需求，聯動車內音樂、燈光、冷氣、懸架等系統，完成座艙環境調整，隨後汽車輕微搖晃，化身一個搖籃。現場實際來看，整體體驗確實比較絲滑，沒有翻車。

最後，理想公布了今年下半年完整的OTA路線圖，分三個節點：7月份、9月份、12月份。

贊助商廣告

理想汽車2026年7月OTA計劃

理想汽車2026年9月OTA計劃

理想汽車2026年12月OTA計劃

發布會最後，李想留了兩句話作為收尾。

一句關於產品：「過去10年，我們創造了一個移動的家。在第二個10年，我們會給車和家賦予生命」。

另一句關於姿態：「理想汽車堅持做最好的自己，不要期望我們變成別人」。