宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

AI遊戲引擎生成《毀滅戰士》,為什麼震撼了歐美遊戲界

2024年09月21日 首頁 » 其他

想像著類比一下,大概就是AI做出了《仙劍奇俠傳》的感覺吧。

上個月,谷歌的AI開發團隊DeepMind公布了首個「AI遊戲引擎」GameNGen,正如其名字所暗示的,這個「遊戲引擎」依靠的是新潮的「神經網路」也就是俗稱的AI來生成遊戲畫面。

而這個AI引擎的第一個成果,就是3D射擊遊戲的標杆作品:《毀滅戰士》(DOOM)。

AI遊戲引擎生成《毀滅戰士》,為什麼震撼了歐美遊戲界


這件事一時間在歐美遊戲圈成為了人人在討論的話題,不論是開發者還是普通玩家,都將這視為AI技術在遊戲領域發展的又一標誌性事件。

以旁人的視角來看,這種討論風潮其實更多是基於當地玩家對於《DOOM》的情懷。但事情也並非只是這麼簡單。

1

谷歌技術團隊選擇《DOOM》的原因不難猜測,DOOM作為現代3D射擊遊戲的老大哥,很多設計理念堪稱現代3D遊戲的教科書,如果能順利重現《DOOM》中的各種設計和機制,那麼意味著AI足以駕馭相對複雜的3D遊戲場景。

另一點則是《DOOM》作為老遊戲,對於硬體要求很低,以至於有一部分愛好者熱衷於用各種帶有螢幕的電子設備遊玩《DOOM》,對於AI「遊戲引擎」來說,運行《DOOM》的難度顯然也比動輒4K的現代3D遊戲要現實很多。

AI遊戲引擎生成《毀滅戰士》,為什麼震撼了歐美遊戲界

《DOOM》甚至能在計算器上玩

不過,這個「微波爐和計算器都能運行的遊戲」對於算力充足的AI來說依舊是個不小的挑戰,其主要原因是基於AI的GameNGen採取的是一條截然不同的道路。

於一般的遊戲製作來說,遊戲的開發人員會預先將關卡的地圖製作好,並通過遊戲的3D引擎進行渲染,最後將實際的遊戲畫面呈現在玩家面前。在這個過程中,遊戲的3D引擎並不需要做什麼「主觀創新」,只要老老實實將相對抽象化的關卡數據「翻譯」成直觀易懂的畫面即可。

AI遊戲引擎生成《毀滅戰士》,為什麼震撼了歐美遊戲界

玩家眼裡複雜的地圖,在引擎眼裡只是各種參數和抽象線條

而GameNGen這個AI模型則正好相反,它要根據現有畫面和玩家的輸入,通過自己對於《DOOM》的理解,去「即興創造」出後續的遊戲畫。從邏輯上,更像是在玩桌面RPG時,DM靠自己的創造力和遊戲理解,向玩家們描述場景和接下來遇到的敵人,只不過GameNGen這個「DM」靠的不是用文字和語言敘述,而是通過快速畫圖,給玩家看一段可以實時交互的動畫。

從結果來說,GameNGen的表現著實超出預期。谷歌的團隊放出了內部測試時的實機試玩,能看到AI引擎的確理解了複雜的遊戲規則,正確地識別玩家做出的移動、開火和交互,射擊會消耗子彈,敵人會被正確擊殺,甚至在酸液池這種特殊地形上也會有持續扣血的效果。此外,開門和拾取道具等要素也基本都做了出來,很多時候乍一看就是DOOM。

AI遊戲引擎生成《毀滅戰士》,為什麼震撼了歐美遊戲界


更難能可貴的是,GameNGen能實現每秒20幀的刷新頻率,雖然20 FPS這個數字在大多數玩家眼裡是難以接受的低幀數,但如果考慮到一般的作畫AI往往需要數秒甚至半分鐘才能做出一張圖片,每秒20張圖且能根據玩家的實時交互而隨時做出改變,已經是非常傲人的成績了。

不僅如此,GameNGen的團隊表示他們還嘗試將團隊試玩AI版DOOM的部分畫面剪輯出來,混在DOOM原版的試玩片段中,讓10名人類測試者判斷哪一邊是AI版DOOM,哪一邊是原版DOOM,最終人類識別的正確率是60%左右。即,有40%左右的AI版DOOM畫面成功瞞天過海,混到了原版之中。

2

為了讓GameNGen做到這種效果,開發團隊也的確花了不少心思。

GameNGen的運行方式並不難理解,每一幀的新畫面,都是AI通過前4幀的畫面進行「預測」而來的,和很多影片生成類AI有著相似的原理。不過為了防止AI天馬行空地瞎畫一氣,需要AI本身對於DOOM有著充分的理解,也就是經常在AI相關話題中提到的「AI訓練」,這個過程往往需要巨量的素材來幫助AI構建一個基本概念。

AI遊戲引擎生成《毀滅戰士》,為什麼震撼了歐美遊戲界


左側的四幅是遊戲中剛剛經過的四幀,中間是AI預測的下一幀畫面,右側則是實際的畫面

根據谷歌開發團隊的文檔,GameNGen用了超過9億幀的DOOM實機畫面進行訓練,如果換算成人類的話差不多相當於不眠不休看了近一年的DOOM,這也讓GameNGen成為了不折不扣的「DOOM雲領域大神」。

當然,這麼種數量級的數據絕非是真人玩家能慢慢打出來的,為了能讓GameNGen獲取足夠的素材,谷歌團隊還給它準備了8個專門玩DOOM的AI,高強度地在那裡打DOOM積攢素材。一些網友開玩笑說就像是GameNGen在追8個AI Vtuber的切片錄播。

而針對這幾個「打機」AI,團隊也設計了一套賞罰機制:受擊、死亡就會扣分,而擊中、擊殺敵人則會加分,團隊還希望幾個AI能像人類一樣「舔圖」,給了發現秘密地區和長距離移動探索等行為一定的加分。

AI遊戲引擎生成《毀滅戰士》,為什麼震撼了歐美遊戲界

谷歌團隊設置的賞罰標準

生成DOOM畫面的是很多人都熟悉的Stable Diffusion,這是個可以將文字轉化為圖片的AI繪圖模型,不管是以假亂真的照片還是漂亮的二次元小姐姐都不在話下。但正如前文提到的,這類繪圖AI的生成速度並不快,儘管DOOM的解析度只有320x240,想要達到能玩的標準,還需要進行一些修改。

他們將Stable Diffusion生成圖片的步驟從原本的20步縮減成了4步,大幅加快了出圖的速度。由於DOOM的畫面相對簡單,在這種情況下,雖然很多畫面的細節被扭曲成了奇怪的色塊,卻依舊能大致分辨出畫面上的元素。

在這個基礎上,谷歌的團隊進一步精調了解碼器,讓生成的結果更接近實際的畫面。

AI遊戲引擎生成《毀滅戰士》,為什麼震撼了歐美遊戲界


左側為調整解碼前SD生成的圖片,中間為調整後,右側則是實機上的原始效果

從結果來說,GameNGen的確做到了挨打會扣血,開槍能殺怪,敵人也會在螢幕上做出相應的移動、攻擊,但從團隊放出的更多花絮影片來看,距離AI取代遊戲設計師還差了很遠。

3

像很多AI模型一樣,GameNGen也有著各種各樣的抽象絕活。

首先一個問題就是,它的記性不怎麼好,從團隊給出的數據來看,GameNGen只能記住過去3秒的圖像資訊,對於單個敵人的瞄準射擊來說的確綽綽有餘,但對於整個遊戲關卡來說就顯得力不從心了。

比如在一段錄像中,我們看到遊玩者打開了一扇門,擊殺了位於門後的兩個敵人。由於遊玩者並沒有選擇直接進入新房間,反而是轉身在原房間中又繞了兩圈,等到遊玩者再次打開剛才的大門時,門後的敵人「死而復生」,再次發起了攻擊。

AI遊戲引擎生成《毀滅戰士》,為什麼震撼了歐美遊戲界

像是剩餘備彈這種相對穩定的數據,AI有時候也會莫名「抽風」

實際上,在前文提到只有60%正確率的人類測試中,所有的遊戲影像都被控制在了3秒之內,避免了AI穿幫。

另一方面,基於前四幀進行預測生成的畫面,也有諸多不穩定之處。當敵人位於遠方時,AI一會認定那個小的褐色色塊應該是一個持槍的敵人,一會又認為那不過是後方牆體的貼圖,導致螢幕上出現的是一個不斷變換的褐色煙霧,直到遊玩者走近後才「定型」。

AI遊戲引擎生成《毀滅戰士》,為什麼震撼了歐美遊戲界


一些場合下,槍口火光、遠處背景和敵人本身的色塊混在一起,

讓陷入混亂的AI呈現出了不真切的夢幻感

而走到一些過於黑暗、辨識度不高的場景時,GameNGen疑似還出現了「鬼打牆」的現象,有可能是因為記錄的過往畫面過於相似,無法讓AI正確地判斷出玩家的位置和方向。

總體而言,比起「在AI引擎上玩DOOM」,GameNGen目前的表現更像是「做了一場在玩DOOM的夢」,雖然看上去煞有其事,但並沒有辦法像真正的電子遊戲一樣,有著一以貫之的客觀邏輯。

結語

在過去幾年,我們見證了人工智慧技術的高速發展,就在幾年前,AI繪圖還是連手指都畫不明白的人工智障,如今,AI不僅能畫出精美的圖片,也可以生成數十秒的影片,弄出繪聲繪色的配音。而現在甚至開始能當遊戲引擎了。

各行各業的從業者,對於AI的發展也是五味雜陳,一方面它們作為工具的確能提供不少的幫助,提高從業者的生產力。比如在前陣子德國舉辦的Devcom開發者論壇上,根據部分機構的調研披露,從業者中最常使用AI的崗位恰恰也正是目前反對聲最大的美術相關人員;

另一方面,每個人又確實在擔心自己的工作會不會有朝一日被AI靠著低成本和高疊代給搶走。在不久前,因擔心自己的形象被3D掃描和AI配音替代掉,不少遊戲演員們參與了罷工。

谷歌公布的GameNGen,從目前來看還十分稚嫩和原始,不管是談助力或是威脅都為時尚早,但在技術高速發展的今天,誰又說得好幾年後又會是什麼樣子呢?

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新