15日下午,理想汽車
開了一場資訊量極大的發布會。理想汽車董事長兼CEO李想走上台,拋出了一個激進觀點:「今天的智慧型手機和智能汽車,談不上真正的智能。」

但真正讓這場發布會有戲劇性的,還不只是李想的這句話,而是理想汽車基座模型負責人詹錕提到的一次經歷。
一個月前,詹錕去了一趟矽谷。他把特斯拉
最新的FSD V14.3連開了兩個星期。回國之後,他給團隊留下兩句話:「第一,特斯拉真的太強大了。第二,壓力也真的太大了。」他回國緊急召集了核心算法團隊復盤,也直接催生了這次的馬赫VLA更新。
近兩個小時的會議,理想汽車同時發布多個產品:一顆自研車規晶片馬赫M100、一套自研作業系統星環OS、兩個自研模型馬赫Mind-Pro和馬赫Mind-Edge、還有升級的馬赫VLA、一組現場跑通的Livis Agent
演示、一份2026年OTA計劃表、以及一個新概念——具身智能
汽車。這四樣產品,被裝在同一台量產車上,從底層硬體到頂層產品體驗,全棧自研。
理想正在試圖用「具身智能」的標準,重做一遍「智能汽車」這個品類。

/01/ 用三個新維度,重新定義智能汽車
敢於全盤否定過去,李想的邏輯是什麼?
他指出,過去十幾年,行業公認的「智能汽車」普遍遵循三要素:軟體定義硬體、聯網且實時在線、系統可以持續升級。智能汽車是這樣,智慧型手機也是這樣。
李想在台上明確指出,這三要素已經不夠用了。「雖然名字上掛著智能,但今天的智慧型手機和智能汽車,都不是真正的智能,它們本質上還是功能驅動的,而不是一個有生命力的智能體。」
判斷一輛車是否真正智能,李想給出三個維度:安全、能力、效率。
先說安全。李想說,傳統智能汽車對安全的定義,是「功能安全、免責優先」,在簡單道路上表現很好,一旦遇到複雜路況、極端天氣、從未見過的場景,它最常見的做法是退出,把方向盤交還給駕駛員。這種處理「從法規上講合規,但對於人類,恰恰是最危險的瞬間」。李想提到一個數據,接近一半的智駕事故,發生在系統把方向盤丟給駕駛員的那一瞬間。
再說能力。李想指出,傳統智能汽車是「特定功能、特定場景」,有很多功能,開導航、開冷氣、放音樂、輔助駕駛,但它只是在「調用一個個功能」,但它並不真正掌握人類司機在複雜場景下的倒車、騰挪、靠邊停車、禮讓能力。
最後說效率。李想說,傳統智能汽車是「人機共駕、人機協同」。他在現場問觀眾,「你們通常什麼時候「不用」智駕?」台下有人答:趕時間、要遲到了、胡同窄路。這個答案很真實,這也從側面說明,關鍵時刻,人類其實並不相信智駕,所以智駕要做的工作還有很多。
這三個維度結合,就是李想給智能汽車定下的標準:保護人類安全、獨立完成任務、比人效率更高。
李想自己也很清楚,從舊定義跳到新定義,不是修修補補能解決的。「它比從大語言模型到今天的Agent要難得多,我們必須重構整個系統。」
那麼這次重構,從哪裡開始?理想正式提出一個新概念:具身智能汽車。
「我們要用具身智能,打造一輛能夠保護人類安全、獨立完成任務、比人類更高效的具身智能汽車。」李想如是說。

/02/一個新定義:具身智能汽車
理想汽車將具身智能汽車定義為「四位一體」:
它是一輛電動車。具身智能汽車要服務真實世界,需要有身體,能移動,能達到目的地。
它是一位職業司機。理解道路、風險、交通規則,能完全可靠完成出行以及生活任務。
它是一台AI電腦。比旗艦智慧型手機和電腦有更強的AI算力,更大的內存,內存和顯存一體化,專為大模型設計。
它是一個生活助手。不需要研究怎麼操作各種軟體,只需要把任務告訴它,它來幫你完成。
李想強調,「這不是四個產品,這應該是一個產品」。過去新勢力車企做的事,大多是把這四樣東西分別做好:智駕團隊做智駕、座艙團隊做座艙、底盤團隊做底盤、車機系統做應用。理想這次要做的,是讓這四樣東西同時長在一個底層架構上。

李想給出了一個類比:「在iPhone出現以前,沒人知道自己需要觸摸的螢幕。在特斯拉Model S
出現之前,沒人相信電動車這麼讓人心動。所有沒有被展示出來的可能性,往往會被誤以為是不存在的需求。」
把這套定義落到工程上,意味著理想汽車至少要重做三件底層的事:一顆自研晶片、一套自研作業系統、一組自研模型。
/03/大腦:三個自研模型
具身智能的大腦,被理想汽車拆成了兩支:語言智能負責「聽得懂任務」,機器智能負責「開得到目的地」——前者由兩個自研大模型馬赫Mind-Pro和馬赫Mind-Edge承擔,後者由自研馬赫VLA承擔。兩支共享同一套底層認知,共同構成一個完整的大腦。

先看語言智能這一支。
這一次,理想正式推出兩個全新模型——馬赫Mind-Pro與馬赫Mind-Edge,分別走雲端和端側兩條路徑。根據理想汽車基座模型負責人詹錕介紹:
馬赫Mind-Pro走雲端,定位是Agent智能體模型。在IFEval指令跟隨、LongBench-v2超長文本理解、AIME26高階數學推理、BFCL-v4工具調用等行業基準上,穩居第一梯隊;放到Agent專項領域,Claw系列榜單、PinchBench-v2實景實測,綜合性能超越大多數主流Agent模型。

詹錕強調「實驗室跑分終究只是紙面數據」。理想拿出來的實戰數據是,依託Livis Agent全場景體系,在Token生成速度、任務完成質量、Token使用成本、端到端響應時延四個商業核心維度,實現全面領先。通過Token壓縮技術,任務完成率零衰減的前提下,Token平均消耗降低38%,工具調用冗餘輪次減少47%;TPS峰值達到208 Token/s,推理效率是主流Agent模型的2倍以上。

這背後是一套「混合強化學習並行訓練體系」。理想搭建了數百套真實業務沙箱環境,高精度模擬工具調用環境;同時並行運行三套差異化訓練環境,覆蓋單步強化學習、長鏈路多步強化學習、在線環境強化學習。

馬赫Mind-Edge走端側,主打端側原生具身智能體。現場播放了一個演示影片,用戶問「我的耳機找不到了,你能幫我找一下嗎?」系統答:「找到了,你的耳機在扶手箱上。」
詹錕解釋,馬赫Mind-Edge採用多模態流式時序建模,能夠連續理解動態的物理世界,具備因果推理和自主決策能力。再加上大量車載專屬的行為特化訓練,讓模型擺脫傳統AI「只回答不行動」的模式,它可以直接輸出動作,實時調用車輛硬體。
它的一系列能力,包括Always On全天候主動感知、人車交互、自主控車、多模態問答,全部在車端本地實現,低時延、高可靠,數據完全不上傳。「這不是雲端模型的閹割版本,而是從底層就為車載場景原生打造的模型。」詹錕強調。
以上,雲端馬赫Mind-Pro負責複雜Agent任務調度,端側馬赫Mind-Edge負責實時人車交互。兩個模型,共同構成了具身智能的語言智能層。
接下來,機器智能這一支是「馬赫VLA」。

在講VLA的時候,詹錕就講了文章開篇所提到的體驗特斯拉FSD V14.3的事跡,他隨後補了一句說:「真正感受到壓力,才證明我們是在平視這個星球上最強大的對手,而沒有在國內的內卷中自我麻痹。」
這種壓力,直接催生了馬赫VLA系統的全面升級。它的三個維度,正好對應李想前面立下的智能汽車三條標準:保護人類安全、獨立完成任務、比人效率更高。

安全維度。理想給了一組背書數據:截至2026年6月14日,理想全系智能駕駛主動避險總次數17273307萬次,其中重大避險55671次。從2022年至今1400餘天,平均每日主動避險1.2萬次。「用戶出行每遇到100次道路險情,就有一次會直接釀成車禍。我們硬生生把災禍從命運邊緣拉了回來。」
AEB和AES的疊代路線也鋪了出來:2022年雷射雷達首次落地主動安全;2023年AEB完成全速度段覆蓋;2024年行業首發AES,同時實現360度低速全方位防禦;2025年AES升級支持多車連續避讓和防硬躲避被撞;2026年新增懸空障礙物識別,夜間剎停上限提升到130公里。

效率維度。普通人從發現危險到踩下剎車的反應時間是0.45秒(權威論文數據)。如果在查看導航或回復消息,反應時間會到秒級。地表最強F1車手的極限反應是0.25秒。「我們全新一代馬赫VLA系統的反應耗時是0.28秒,無限逼近人類的生理極限。」
多出來的0.17秒意味著什麼?在120公里時速下能提前6米完成剎停。6米是一台幻影
勞斯萊斯
的整車長度,也是「剎停到相撞、生存到毀滅」的全部距離。
這0.28秒不是單一模組快出來的。視覺輸入時延降低47%,模型推理鏈路縮短43%,線控底盤響應降低38%,作業系統調度編排降低28%,端到端總時延降低40%。「不是哪個模組變快了,是整個鏈路從頭到尾都變短了。」
能力維度,理想拿了幾段真實場景影片做證據:施工區域繞行、挖掘機爪臂動態避讓、對向窄路主動切倒擋禮讓、識別穿黃馬甲保安的手勢、低矮異形物體識別、廣州傍晚雨夜的城中村小路。最後那段廣州城中村的影片最關鍵。路寬不到3米,沒有車道線,沒有交通標識,路邊打傘行人、外賣騎手、占道小販混雜。「很多廣州老司機開起來都頭皮發麻。但馬赫VLA開得極其從容,根據對向來車、行人、電動車的位置主動輾轉騰挪,給每一個參與者都留足空間。」
馬赫 VLA 這一代的能力從哪裡來?詹錕把它歸納成三個變量的同時躍升:「這背後是數據、算力、模型規模同時暴增下,Scaling Law帶來的能力湧現。」
算力方面,雙馬赫M100讓車端算力達到2560TOPS。數據規模方面,模仿學習數據量增加50%,強化學習數據量增加15倍,訓練算力增加5倍。模型規模方面,行泊一體模型徹底統一,參數量提升10倍,每秒Token計算量提升15倍。

但比湧現更關鍵的,是架構層的重構。理想直接把感知、預測、規劃三個模組統一成「原生多模態MoE大模型」。「過去模組化的模型結構有一個致命缺陷,感知、預測、規劃三個模組各玩各的,就像一家公司,市場部說這事能幹,研發說我壓根沒收到消息,財務說我還不知道有這個項目。功能都沒錯,但整體意圖完全不一致。」
圍繞這個統一的大模型,理想還做了兩件配套的事:一件是馬赫 World Model,一個能模擬真實物理世界的世界模型,給馬赫 VLA 提供訓練所需的虛擬環境;另一件是 RL Infra,強化學習的訓練基礎設施,讓 VLA 能在世界模型里持續試錯、疊代。如此一來,馬赫 VLA、馬赫 World Model、RL Infra 三位一體,構成一套完整的具身智能模型訓練體系。「看見、理解、思考、行動,從一開始就在同一個框架里徹底對齊。我們從第一天起就是為具身智能而生。」詹錕說。

新架構搞定了,但具身智能還需要真正「看懂」世界,這就涉及視覺方案的選擇,業界有的在卷雷射雷達,有的在卷視覺方案,詹錕在這裡強調:
「行業都在瘋狂卷雷射雷達的線數。128線、256線、512線,越卷越離譜。但雷射雷達的線數再高,它能告訴你紅綠燈現在是什麼顏色嗎?能讀懂路牌上『前方施工禁止通行』這幾個字嗎?能看懂穿黃馬甲的保安手勢是讓你停還是讓你走?都不可能。」詹錕說,「雷射雷達只能理解世界的骨架,根本不能理解這個世界。」
理想這次讓3D ViT首次上車,現場把鏡頭切到觀眾席,3D ViT瞬間重建了整個三維世界,觀眾姿態、場館細節、後排文字全部被記錄下來。

模型層面的進展,理想給了兩個明確的OTA節點:第三季度,為搭載 Orin 和 Thor 晶片的 AD Max 用戶推送全新馬赫 VLA 模型;第四季度,馬赫 VLA 模型能力對齊全球頂尖水平。後一句「對齊全球頂尖水平」,指的就是特斯拉的FSD V14。「這是我們對自己的要求,更是對用戶的承諾。」詹錕說。
/04/心臟:發布馬赫 M100,5nm 車規級晶片,1280TOPS 單晶片算力
具身智能汽車的大腦跑在哪裡?
於是,理想正式發布馬赫 M100。「馬赫 M100是一顆用完全不同思路造出來的晶片。」理想汽車CTO謝炎說道。
這顆晶片從2022 年立項,歷經三年半打磨,於2026年5月實現量產上車。

謝炎在台上把晶片高高舉起,講起它的參數。5納米車規級工藝,單晶片算力1280 TOPS,「是目前全世界量產最強大的車規級算力晶片」;實際運行效率超過 82%,主流基於 SMT 架構的 GP GPU;超過一半的晶圓面積留給神經網路處理器,由56個計算單元和1個數據處理模組構成,採用網格總線加數據環形總線雙互聯架構;CPU 部分,24 核 ARM A78AE,主頻 2.3GHz,車載旗艦級大核,負責安全和系統控制;內存部分,8 通道 LPDDR5X 子系統,273 GB/秒超高頻寬,提供片外大容量內存高速通道。


但參數本身只是數字。理想拿馬赫M100做了兩組對比,信號量都很強。
第一組對比,跟全球公認智駕領域最主流的晶片ThorU直接對比CNN Based、UniAD、馬赫VLA模型。每一項每一個測試,馬赫M100全部超越ThorU,是數倍的性能差距。

第二組對比更有意思。謝炎在馬赫M100上部署了Qwen3.5-35B,跟NVIDIA的DGX Spark桌面超算對比。結果是Qwen3.5-35B-A3B prefill速度,馬赫M100是DGX Spark的2.7倍;Qwen3.5-35B-A3B decode速度是1.5倍。一個裝在車裡的晶片,跑通用大模型比一台4萬塊的桌面超算還快。

馬赫M100號稱"全球首款量產的動態數據流AI晶片"。這裡面不一樣的,是「數據流」三個字。
傳統晶片是怎麼幹活的?可能是一步一步走的員工,它有一張待辦清單(行話叫「指令隊列」),從清單第一項開始,做完一項做下一項,順序嚴格不能亂。這種方式的問題是,清單本身要寫、要管、要排序,晶片很大一部分電晶體不是在算東西,是在管理這張清單。算AI模型這種海量並行的任務時,管理成本越來越高,效率上不去。
但謝炎說,AI計算其實根本不需要這張清單。「AI計算天然是並行的,數據是確定的、關係是清晰的、流動路徑是固定的。」翻譯一下:AI 模型在做什麼、下一步要處理什麼數據、這些數據要流向哪個計算單元,在模型設計的時候就已經寫好了。既然路徑是固定的,就不需要一個中央調度員去現場指揮。
所以理想汽車做了一件顛覆傳統的事:把那張待辦清單和清單管理員全砍掉,讓數據自己驅動計算的發生。數據流到哪裡,計算就在哪裡發生。
「馬赫M100的能力遠不止於智能駕駛,它今天已經跑通了車上所有的智能化場景。它能運行語言大模型,它能支撐Agent,它將驅動具身智能,它還會支持更多我們今天還沒有想到的AI場景。」謝炎說。
這套架構也拿到了一個學術層面的背書。謝炎在台上宣布,今年馬赫 M100架構的論文被ISCA 2026工業分區收錄。同期入選的是谷歌、美光、Meta、安培、MegaBlast。「理想汽車是汽車行業中第一家,歷史上第一家在ISCA工業分區獲得論文錄取的企業。」

謝炎特意申明:「我們入選 ISCA 從來不是因為造了一顆晶片,是因為提出並實踐了一種創新的架構思路。」馬赫 M100 架構團隊將於6月30日在ISCA 2026會議現場進行主題分享。
「馮·諾依曼架構用七十年推動了通用計算的輝煌。今天我們以馬赫 M100 為起點,希望用數據流架構,接過歷史的這一棒,繼續推動 AI 計算再輝煌七十年。」謝炎最後立下宏願。
/05/神經系統:星環OS與晶片到算法的全棧自研
光有晶片不夠。具身智能需要一套完整的系統,把心臟、大腦、眼睛、手腳組織起來協同工作,這套系統的「神經系統」,叫做「星環OS」。

「星環OS是理想汽車為具身智能專門設計的神經系統,從設計的第一天起,它就是為 AI 原生而生。」謝炎介紹,「感知、決策、執行全鏈路深度融合,結合全線控底盤的極速響應,我們把端到端的延時壓縮到了0.28秒,反應速度比人類快40%。這就是系統協同的力量,它不是晶片快,也不是軟體快,是整個系統一起快。」

這套系統里,馬赫M100晶片是心臟,全車感知系統是眼睛,自研馬赫模型是大腦,全線控主動底盤系統和能源系統是手腳,星環OS是神經系統,把它們串成一個整體。
為什麼連作業系統也要自己做?謝炎向台下問了一個問題:「蘋果和安卓哪一個更安全?」台下答「蘋果」。「為什麼?因為蘋果把晶片和作業系統放在一起設計。安全,不是系統啟動之後才開始,安全是從晶片上電那一刻就已經開始了。手機晶片被攻擊,泄露的是隱私;車的晶片被攻擊,威脅的是生命。」謝炎講出背後邏輯。
理想汽車把密鑰保護、設備身份、可信啟動鏈、關鍵權限管控全部前置到晶片設計中,再通過全棧自研軟體實現統一調度。讓晶片、編譯器、作業系統、AI 算法在同一套可信的基礎上協同運行。

到這裡,理想汽車完成了一個少有車企能完成的動作:晶片、編譯器、作業系統、AI算法、域控制器,全棧自研。

/06/量產路徑:讓具身智能成為日常,Livis Agent現場實操
底層架構講完,真正的問題來了,這一切到底能不能落到一台普通用戶開的車上?
現場,理想直接做了一場真實的Livis Agent演示,展現了它的多項車載智能體能力。「請相信我,這些展示都是真正運行在模型上的Agent,絕不是提前寫好的程序。」謝炎強調。
演示中,這個Agent可以根據一句自然語言指令,完成接機、餐廳推薦、路線規劃等連續任務。甚至,可以根據「孩子困了」等場景需求,聯動車內音樂、燈光、冷氣、懸架等系統,完成座艙環境調整,隨後汽車輕微搖晃,化身一個搖籃。現場實際來看,整體體驗確實比較絲滑,沒有翻車。

最後,理想公布了今年下半年完整的OTA路線圖,分三個節點:7月份、9月份、12月份。

理想汽車2026年7月OTA計劃

理想汽車2026年9月OTA計劃

理想汽車2026年12月OTA計劃
發布會最後,李想留了兩句話作為收尾。
一句關於產品:「過去10年,我們創造了一個移動的家。在第二個10年,我們會給車和家賦予生命」。
另一句關於姿態:「理想汽車堅持做最好的自己,不要期望我們變成別人」。






