近日,英偉達
在台北GTC大會正式推出新一代物理AI基礎模型Cosmos 3,主打面向機器人、自動駕駛、視覺智能體等實體場景開發,憑藉一體化融合能力,為物理AI落地提供全新底層支撐。
據悉,Cosmos 3是業內首款實現視覺推理、虛擬世界生成、智能行為預測三合一架構的開源全能模型。其搭載創新MoT混合Transformer架構,通過推理自回歸塔與影片動作擴散塔協同運作,可兼容文本、圖像、影片、環境音效、動作指令等多類輸入輸出,全方位適配真實物理場景的AI交互需求。

為適配不同開發場景,英偉達推出梯度化版本矩陣。其中320億參數的Cosmos 3 Super適配高精度物理仿真訓練,80億參數的Cosmos 3 Nano主打亞秒級高速推理,面向邊緣終端的Cosmos 3 Edge也即將上線。多項權威基準測試顯示,該模型在世界生成精度、行為策略規劃、視覺場景理解等核心指標上,穩居同類開源模型首位。
生態層面,英偉達同步牽頭組建Cosmos Coalition產業聯盟,聯合六家行業頭部企業共建開放世界模型生態。目前Cosmos 3已開放下載與線上試用,開發者可通過Hugging Face獲取模型資源,也可在英偉達官方平台體驗實測功能,進一步降低物理AI應用的開發門檻。






