
本月初的 CES 展會上,Nvidia 宣布了名為 Nvidia Cosmos 的開發項目。
這個名字本身並不能說明太多,它讓人聯想到廣闊的天空或是人類用來解釋萬物起源的宇宙學。
那麼這個系統究竟是什麼?
Nvidia 將 Cosmos 定義為"一個最先進的生成式世界基礎模型平台",並將世界基礎模型定義為"能夠模擬真實環境,並基於文本、圖像或影片輸入預測準確結果的神經網路"。
據發言人解釋,世界模型能夠"理解"真實世界的物理規律。它們支持機器人系統和自動駕駛汽車的開發,以及其他能夠遵循道路規則或工作場所要求的物理結構。從某種意義上說,這些都是推動能夠像人類一樣思考、推理、移動並最終生活的物理實體誕生的引擎。
技術術語表 Nvidia 團隊還詳細介紹了 Nvidia Cosmos 的其他方面,包括"幫助將高層數據分割成可用片段的高級分詞器"。
作為參考,以下是 ChatGPT 對高級分詞器的描述:"高級分詞器超越了簡單的空格或基於規則的分段方式,能夠生成子詞、字節級或混合段,更好地處理罕見詞、多語言文本和特定領域的詞彙...這些'智能'分詞器是現代自然語言處理系統的重要基礎,使模型能夠擴展到海量數據集和多樣化的語言輸入。"
這些模型將以開放許可的方式提供,以幫助開發者進行開發。Nvidia 1 月份的新聞稿解釋道:
"物理 AI 模型的開發成本高昂,需要大量的真實世界數據和測試。Cosmos 世界基礎模型 (WFM) 為開發者提供了一種簡單的方法,可以生成大量逼真的、基於物理的合成數據,用於訓練和評估他們現有的模型。"
儘管對破解和黑客攻擊的擔憂可以理解,但企業們可能會對有機會在這家美國領先科技公司的成果基礎上進行構建感到興奮。
此外,在數據管理過程中,Nvidia NeMo 將提供"加速"流程。
總而言之:這些是"物理感知"系統。它們聽起來像是將 AI 帶入"我們之中"的關鍵應用部件,能夠影響我們的生活,而不是僅僅被封閉在某台電腦中。我們的機器人朋友將會是什麼樣子?我們將如何對待它們,它們又將如何對待我們?這些都是我們作為社會必須考慮的問題。
Nvidia Cosmos:案例研究 當我閱讀已經採用 Nvidia Cosmos 技術的公司名單時,大多數都很陌生。但有一個公司很突出:
網約車公司 Uber 是這類物理 AI 的早期採用者。
"生成式 AI 將推動移動出行的未來,這需要豐富的數據和強大的計算能力," Uber CEO Dara Khosrowshahi 在新聞聲明中表示。"通過與 NVIDIA 合作,我們有信心能夠幫助加速實現安全且可擴展的自動駕駛解決方案。"
"安全且可擴展的自動駕駛"這句話可能很好地概括了這個項目,儘管,就像過去二十年左右的自動駕駛車輛設計一樣,魔鬼藏在細節中。
關於 Uber 具體如何使用 Nvidia Cosmos 的資訊並不多。但我們可以更好地理解這個框架本身,以及 Nvidia 作為這類系統主要創新者所做的工作。
Omniverse 我還了解到 Nvidia Omniverse 平台,該公司是這樣描述的:
"一個由 API、SDK 和服務組成的平台,使開發者能夠將 OpenUSD、NVIDIA RTX(TM) 渲染技術和生成式物理 AI 集成到現有的軟體工具和模擬工作流程中,用於工業和機器人應用場景。"
聽起來 Omniverse 平台更多的是用於評估、監控和工具使用,以幫助探索世界基礎模型本身的可能性。
轉折點 最後引用 CEO Jensen Huang 的話作為結束:"機器人的 ChatGPT 時刻即將到來。"
這可能才是頭條新聞,因為我們所有人都一直在想,什麼時候我們才能開始看到這些智能的、具有物理感知能力的機器人行走在我們中間,或者驅動真正的自動駕駛汽車。
答案似乎是:這一天會比預期來得更早。