在大家震驚Sora生成影片逼真之餘,谷歌緊隨其後推出了更為驚人的全新AI基礎世界模型——Genie。Genie是一個生成式交互環境,由時空影片分詞器、自回歸動力學模型和簡單且可擴展的潛在動作模型組成,擁有110億個參數。
與以往只關注世界生成的模型不同,Genie允許用戶與創建的環境進行交互,通過文本、合成圖像、照片甚至草圖生成可玩的交互式環境和可控虛擬世界。這代表了生成式人工智慧的重大進步,為人工智慧在虛擬世界中展現出無限可能性。
OpenAI和谷歌在AI領域的競爭激烈,Sora和Genie都致力於從視覺模型的角度模擬物理世界,實現通用人工智慧。有趣的是,它們都採用了Visual Transformer模型,但訓練數據的選擇不同。
Sora採用了分布式訓練,將訓練任務拆分成多個子任務並在多個節點上並行執行,以提高訓練速度。同時,Sora還採用了數據並行和模型並行的策略,使訓練更高效。
Genie則在大量公開的網際網路影片數據集上進行了無動作標籤的訓練,可以將任何圖像轉換為簡單的2D平台遊戲。最獨特的地方在於,Genie可以通過無監督學習理解遊戲世界中角色的移動、控制和行動,並根據用戶操作預測未來幀,創造出功能性和可玩性的體驗。簡而言之,Genie具備了「自學成才」的能力。
Genie的問世證明了通過AI構建虛擬世界已經非常接近,AI通過影片的自我訓練可以學習到真實世界的物理規則,為AI在虛擬世界中的應用帶來了更多可能性。這一進展將對虛擬環境的發展和應用產生深遠影響,推動人工智慧技術在遊戲開發等領域的應用和創新。
儘管AI在生成遊戲方面取得了顯著進展,但目前仍需要人類的輔助。雖然AI能夠理解並生成遊戲的基本框架和規則,但深度的遊戲設計、角色設定和劇情構建等方面仍需要人類的創造力和策劃能力。人類設計師可以根據市場需求和玩家偏好,制定詳細的遊戲設計方案,並為AI提供明確的指導和限制。
在遊戲開發完成後,大量的測試和調試工作是必不可少的,以確保遊戲在各種情況下的穩定性和可玩性。這部分工作同樣需要人類的介入,因為AI可能無法覆蓋所有測試場景和異常情況。
AI在遊戲開發領域有著廣泛的應用前景。人類與AI的協作將成為未來遊戲開發的重要趨勢,通過結合人類的創造力和AI的計算能力,可以實現更加創新和優質的遊戲體驗。