英偉達近期預覽了一款名為 James 的交互式數字人,該角色不僅能夠展現豐富的情感與幽默,還能與人類進行自然而流暢的對話。
據悉,James 依託 NVIDIA ACE 這一創新技術框架而生,它作為創建個性化、超現實且高度互動的虛擬形象(Avatar)的藍圖,用戶很快便能通過訪問 http://ai.nvidia.com,與 James 展開實時互動。
此外,英偉達還揭示了 NVIDIA Maxine AI 平台的最新成果,特別是 Maxine 3D 與 Audio2Face-2D 兩項技術的突破,旨在重塑遠程交流體驗,使之更加沉浸與真實。Maxine 平台以其尖端的 AI 技術,提升了數字角色的音頻與影片質量,支持通過影片會議系統實現實時、栩栩如生的 2D 及 3D Avatar 互動。
對於開發者而言,Maxine 與 NVIDIA ACE 的結合無疑是提升用戶與數字界面交互體驗的強大工具。眾多行業先鋒,如 HTC VIVE 與 Looking Glass,已率先採用這些技術,為用戶帶來前所未有的沉浸式體驗。
James 作為 NVIDIA NIM 微服務驅動的智能虛擬助手,能夠依據情境提供精準響應,其背後的檢索增強生成(RAG)技術確保資訊更新迅速且準確,而 ACE 則賦予開發者利用自有數據打造專屬領域 Avatar 的能力。
值得一提的是,James 那自然流暢的聲音由 ElevenLabs 精心打造,而 NVIDIA ACE 更進一步,允許開發者根據具體應用場景定製動畫、語音及語言風格,實現個性化與靈活性的完美融合。
Maxine 3D 技術更是將傳統 2D 影片肖像轉化為生動逼真的 3D Avatar,為影片會議及雙向通信應用增添了前所未有的視覺衝擊力。該技術目前正開放搶先試用,預示著遠程協作與社交的新紀元即將開啟。
同時,Audio2Face-2D 技術也已進入搶先體驗階段,它僅憑音頻輸入即可為靜態人像賦予生命,讓一張簡單的圖片變成能夠動態表達、開口說話的數字形象。用戶同樣可通過 http://ai.nvidia.com 親身體驗這一技術的神奇魅力。
HTC VIVE 與 Looking Glass 等企業作為 NVIDIA ACE 與 Maxine 技術的早期採納者,正積極探索其在多種場景下的應用潛力。HTC VIVERSE 通過集成 Audio2Face-3D NVIDIA NIM 微服務,實現了 AI 代理的動態面部動畫與精準口型同步。
而 Looking Glass 則在「魔鏡」演示中,藉助簡單攝像頭設置與 Maxine 的 3D AI 技術,實時生成用戶面部的全息圖像,將全息技術推向了新的高度。