宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

Nvidia 在 AI 機器人領域再下一城:推出 Cosmos 平台

2025年01月15日 首頁 » 熱門科技

 

Nvidia 在 AI 機器人領域再下一城:推出 Cosmos 平台

 

 

在可能是 CES 歷史上觀眾最多的主題演講中,Nvidia CEO 黃仁勛在座無虛席的 Michelob Ultra 體育場發布了一系列令人目不暇接的新技術。從面向消費者的新款 GeForce RTX 50 系列遊戲顯卡,到基於公司最新 Blackwell GPU 技術的安全自動駕駛平台 Thor,以及更多產品。然而,一項名為 Cosmos 的新型 Nvidia 生成式 AI 技術,可能因其複雜性被一些人忽略,但在我看來,它是另一個重要亮點。我甚至敢說,如果 Cosmos 按照公司的設想發展,它可能成為推動 Nvidia 機器人和自動駕駛業務騰飛的助推器。

理解 Nvidia Cosmos 物理 AI

Nvidia 將 Cosmos 稱為"加速物理 AI 開發的平台"。簡單來說,物理 AI 可以理解為任何機器人背後的大腦,無論是設計用於最優化適應我們生活世界的人形機器人、工廠自動化機器人,還是為在道路上運載人類或各類貨物而優化的自動駕駛汽車。然而,訓練機器人 AI 需要大量的人力和資源投入,通常需要捕獲、標註和分類數百萬小時的真實環境中的人類互動,或者在全球實際道路上行駛數百萬英里。

Nvidia Cosmos 旨在通過一系列稱為"世界基礎模型" (WFM) 的技術來部分解決這個資源問題。這些 AI 神經網路可以為虛擬環境的未來狀態生成具有準確物理特性的影片 - 可以稱之為多元宇宙。這聽起來很深奧,但實際上相當直觀。WFM 類似於大語言模型,但與用於自然語言識別、生成和翻譯的 LLM 不同,WFM 利用文本、圖像、影片內容和運動數據來生成模擬虛擬世界和虛擬世界互動,具有準確的空間感知、物理特性和物理交互,甚至物體永久性。例如,如果工廠里的螺栓從桌子上滾落,即使當前攝像機視角看不到,AI 模型也知道它仍然存在,可能只是掉在地板上。

跟上了嗎?很好,因為接下來會更有趣。這種用於訓練物理 AI 或機器人的新型合成數據生成方式需要基於真實數據才能準確。換句話說,輸入錯誤的數據意味著模型會產生幻覺或在生成機器人 AI 訓練數據時不可靠。這就是 Nvidia 幾年前宣布的 Omniverse 平台發揮作用的地方。

Cosmos 與 Nvidia Omniverse 數字孿生集成

Nvidia 的 Omniverse 數字孿生作業系統允許來自任何行業的公司和開發者在一個環境中模擬產品、工廠、機器人、車輛等,該環境設計用於連接行業標準工具,從電腦輔助設計到動畫等。實際上,Nvidia 在 CES 2025 上還發布了新的 Omniverse "藍圖",以幫助開發者模擬工廠和倉庫的機器人車隊 (稱為 Mega)、自動駕駛模擬、用於大規模工業數字孿生的 Apple Vision Pro 頭顯空間流媒體,以及實時電腦輔助工程和物理可視化。公司還為 OpenUSD(通用場景描述)提供免費教學,這是支撐 Omniverse 並允許集成行業標準工具和內容的語言。Nvidia 宣布多個主要企業正在採用其 Omniverse 平台,從用於半導體 EDA 設計工具的 Cadence,到用於計算流體動力學的 Altair 和 Ansys 等。

回到 Cosmos,我們現在可以看到 Nvidia 在機器人物理 AI 方面的完整解決方案正在成形。Cosmos 模型從真實世界的數字化版本獲取輸入,然後生成 AI 訓練內容。根據黃仁勛在主題演講中透露,雖然 Cosmos 模型是通過訓練 2000 萬小時的影片數據開發的,但希望在自己的數字孿生和數據上訓練物理或機器人 AI 的開發者可以在 Omniverse 中進行模擬,然後讓 Cosmos 播放出這些機器人 AI 可以訓練的各種合成現實。

Cosmos 會成為 Nvidia 的又一個 CUDA 時刻嗎?

此時,我知道你在想什麼。在模擬數據和模擬世界中訓練機器人,會出什麼問題?毫無疑問,這項技術仍處於初期階段,但俗話說得好,萬事開頭難。機器學習雖然容易產生幻覺,需要有防護措施 (Nvidia 在這方面有完善的工具和政策),但其優勢在於可以不斷訓練,直到確信達到正確結果。而且機器不需要睡覺或喝咖啡休息,更不用說它比手動在人類生成和分類的內容上訓練 AI 效率高得多。

話說回來,多年前,當 Nvidia 首次發布其 CUDA 編程語言,引發了 GPU 加速器上機器學習的時代時,公司採取了類似約翰尼蘋果籽的策略,向各行各業的開發者提供工具,最終使其成為數據中心 AI 工作負載加速的事實標準。對於 Cosmos,Nvidia 再次在其開放模型許可下免費向開發者提供這些生成式 AI 世界基礎模型,可以在 Hugging Face 或公司自己的 NGC 目錄庫訪問。這些模型也將很快作為優化的 Nvidia 推理微服務 (NIM) 提供,所有這些都將在其 DGX 數據中心 AI 平台上加速,並在 AI 邊緣設備、機器人和自動駕駛車輛中使用其 AGX Drive Orin 和 Thor 汽車計算平台。或者,正如黃仁勛和公司所稱的"Nvidia 機器人 3 計算解決方案"。

Nvidia 指出,物理 AI 領域的幾個大牌玩家已經採用了 Cosmos,從人形機器人公司如 1X 和 XPENG,到用於通用機器人的 Hillbot 和 SkildAI,再到網約車巨頭 Uber,後者正在將 Cosmos 與其海量駕駛數據集結合使用,幫助為自動駕駛行業構建 AI 模型。

將這稱為 Nvidia 的另一個"CUDA 時刻"可能有點牽強,但這家 AI 領域的全球領導者剛剛為物理 AI 開發者推出了一些非常強大的新工具,而且是免費的。我個人認為這是黃仁勛和他的 AI 魔法師團隊的又一個高明之舉。我們將拭目以待 Cosmos 會將這個機器人 AI 多元宇宙帶向何方,這將是一個令人著迷的過程。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新