宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

DeepMind的Genie 2能夠生成可以互動的遊戲世界

2024年12月05日 首頁 » 熱門科技

谷歌的AI研究機構DeepMind,公布了一款能夠生成多種遊戲3D世界的模型。

這款名為Genie 2的模型是DeepMind早前發布的Genie模型的升級版,能夠根據一張圖片和文字描述(如「一個可愛的類人機器人在樹林中」)生成一個互動的實時場景。它與李飛飛的World Labs公司和以色列初創公司Decart正在研發的模型類似。

DeepMind表示,Genie 2可以生成各種各樣的3D世界,包括那些玩家可以通過鍵盤或鼠標進行跳躍、游泳等互動的世界。該模型經過大量影片數據訓練,能夠模擬物體互動、動畫、光照、物理效果、反射以及NPC(非玩家角色)的行為。

DeepMind的Genie 2能夠生成可以互動的遊戲世界

許多由Genie 2生成的場景,看起來就像3A遊戲畫面,這可能與訓練數據中包含了熱門遊戲的實況影片有關。然而,出於競爭等原因,DeepMind並未透露其數據來源的具體細節。

與此同時,版權問題也引發了關注。作為谷歌的子公司,DeepMind可以自由訪問YouTube,谷歌此前也表示,它的服務條款允許使用YouTube影片進行模型訓練。但Genie 2是否是在未經授權的情況下複製它所「觀看」的遊戲?這一問題還需要法院判定。

DeepMind指出,Genie 2可以生成多個視角的連貫世界,包括第一人稱視角和等距視角等,最長可持續一分鐘,大多數情況下持續10到20秒。

「Genie 2能夠根據鍵盤操作做出智能反應,識別並正確移動角色。」DeepMind在博客中寫道,「例如,我們的模型能夠正確判斷,箭頭鍵應該控制機器人而非樹木或雲朵。」

DeepMind的Genie 2能夠生成可以互動的遊戲世界

像Genie 2這樣的「世界模型」能夠模擬遊戲和3D環境,但常常存在解析度低、場景一致性差以及生成失真等問題。例如,Decart的Minecraft模擬器Oasis就存在解析度低的問題,並且會快速「忘記」關卡布局。

然而,Genie 2能夠記住視野之外的場景部分,並在這些部分重新出現在視野中時準確地呈現出來(World Labs的模型也具有類似功能)。

不過,用Genie 2創建的遊戲並不會特別有趣,因為它們會每分鐘左右重置玩家的進度。這也是DeepMind將該模型定位為研究和創作工具的原因——一個用於打造「互動體驗」和評估AI智能體的工具。

「憑藉Genie 2的跨分布泛化能力,概念藝術和圖紙可以轉化為完全互動的環境。」DeepMind表示,「通過使用Genie 2快速創建豐富多樣的環境供AI智能體使用,我們的研究人員能夠設計出訓練中未見過的評估任務。」

創意人員可能對這一技術感到複雜,尤其是影片遊戲行業的從業者。根據《連線》雜誌的最新調查,像動視暴雪(Activision Blizzard)等大型公司,因裁員而大量引入AI來提升生產效率並彌補人員流失。

儘管如此,谷歌依然加大了在世界模型領域的投入,這有可能成為AI領域的下一大突破。今年10月,DeepMind聘請了曾負責OpenAI影片生成器Sora開發的Tim Brooks,來研究影片生成技術和世界模擬器。兩年前,實驗室還從Meta挖走了Tim Rocktäschel,他因在《NetHack》等遊戲中的「開放性」實驗而著名。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新