《流浪地球 2》里有個表現力很強、寓意十分深刻的情節,量子電腦 MOSS 建議劉培強放棄治療命不久矣的妻子,這樣才能讓兒子劉啟以及老丈人韓子昂都進入地下城。客觀講這顯然是個理性的好提議,但劉培強聽了之後整張臉因為憤怒而漲得通紅,轉過頭對著單面鏡另一邊工作人員的方向罵了髒話 —— 冰冷的邏輯理性與熾熱的人類感情在這一刻產生激烈的碰撞。

ChatGPT 近日更新到了最新版本「GPT-4」,相較於之前本來就很強大的邏輯化文本生成功能,「GPT-4」是一個大型多模態模型,現在能夠接受文字以外的圖形資訊,比如在官方演示中工作人員給 GPT-4 輸入了一張他用手寫的網站結構草圖,幾秒鐘之後機器就輸出了比較完整的前端代碼。
從數據面來講,GPT-4 跟前幾個月就風風火火的較早版本相比也有著飛越性的提升,開發商 OpenAI 拿它接受了包括 SAT 試題(可以簡單理解為美國聯考)在內的 30 多種標準化考試測驗,發現分數最高可以排進前 10% 以內,而之前的 GPT-3.5 做出來的分數差不多是倒數 10% 的水平。
也就是說,GPT-4 如果是個真人,那它現在已經可以在美國上最好的大學,並且同時獲得包括律師執業資格證在內的一系列專業證書。
此外官方還表示 GPT-4 可以進行一些創意類工作,包括根據主題創作詩歌、在回答時模仿特定的文字風格、處理數據的上限相較 GPT-3.5 也有指數級的提升。

於是最近一段時間網上關於 GPT-4 本身、關於人工智慧的討論再次火熱起來的原因就不難理解了,這項技術進步既前沿又平民,儘管有一些障礙,但並不能阻止越來越多的人藉助各種手段進行體驗,有人覺得不過如此,有人則把這看作是第四次工業革命的發端。
不過作為普通老百姓,普通的遊戲媒體從業者,我更關心一個十分現實的問題 —— 包括 GPT-4 及其後續版本在內的人工智慧工具,究竟有多大的可能會讓我丟掉飯碗?
遊戲媒體究竟是幹什麼的?
這是個很大、很寬泛的話題,可以牽扯到廣義的「媒體」在社會生產生活中的角色與作用,那樣的話一本專著的篇幅可能也只夠開個頭,所以我並不打算在這篇小短文里把它說得那麼透徹,結合實際談談遊戲媒體目前的生態位以及 GPT-4 帶來的影響就行。
簡單來講遊戲媒體是一種降低資訊的獲取和分發成本的「中介」機構,通過訪問媒體提供的資訊,玩家不必挨個去搜索自己關心的遊戲產品、遊戲公司的相關消息,開發商也可以反過來使用現成的媒體平台將自己想要傳達的資訊分發給更多人,而不必費勁吧啦地自己搭平台、自己維護。
C 端減少的時間成本以及 B 端節約下來的資訊送達成本打包到一起形成的利潤空間,就是遊戲媒體的生態位。

具體到本土主單機媒體這個領域則還有一個特點,那就是由於產業規模、品牌知名度等方面的巨大差距,可以說整個業態里差不多有 99% 的資訊都來自英語或是日語經濟圈,所以準確的翻譯能力向來是本土遊戲媒體的基本指標之一。
在這些最尋常的資訊傳導工作領域,有一個 ChatGPT 這樣的資訊整合對話 AI 的確能省很多事,首先翻譯問題幾乎不存在了,早在 GPT-4 之前,國內外各種文字、圖片提取翻譯工具的可用性就在最近幾年有很大進步,準確性大幅提高。我們的同事之前就曾用 ChatGPT 幫忙寫過《霍格華茲的傳承》的微博新聞文案,生成的內容本身就可以直接用,噱頭效果更是直接拉滿。
不過機械的、純粹的、可替代性極強的資訊轉譯只是遊戲媒體日常工作內容的一部分(當然具體的運營技巧和方法這裡邊也有很多供從業者發揮主觀能動性的空間,包括文字技巧、配圖等等),另外還有一個很重要的角色,是對未公開、未發售遊戲進行試玩、評測、分析,有時候還需要匯總自己的體驗給發行商、開發商提出意見或建議,屬於偏諮詢以及預測方向的職能,而這恰恰是幾乎所有 AI 工具目前所欠缺的能力。
為什麼現階段 AI 很難代替我們做評測?
這件事要從輸入和輸出兩個埠來分析。
輸入部分,儘管 GPT-4 已經支持了多模態,不過目前來看它能夠分析的還只是平面圖形(這部分沒有完全開放),將來有極大可能會拓展到語音、影片等,但這些素材的識別再結合搜索的技術並不稀奇,國內外都有很多具體應用,把識別出來的資訊按照固有邏輯進行分析轉譯之後生成解答,底層邏輯還是其實還是圍繞文本展開的。
當然我不是說這個進步不大,畢竟從純文本到文字 圖形對用戶來說肯定是在便捷性上的顯著提升,只不過具體到我們的遊戲評測工作上,至少現階段而言這還遠遠不夠。

首先遊戲體驗除了畫面效果、流暢與否這些也許能夠被數據化之後讓 AI 來做歸納分析的量化指標以外,還有故事情節是否吸引人、操作的流暢度、打擊感高低、音樂水準、音效品質等十分依賴個人主觀情感意願來定性的、無法量化的元素,不僅這些內容本身極難以客觀的標準量化成數字讓人直觀地看到,哪怕將來進化到可以量化了,實際感受也是因人而異的,不存在一個放到所有遊戲上都適用的統一標準,一段情節有人覺得好有人覺得難以接受,一場打鬥設計有人心滿意足有人嗤之以鼻,都是很常見也很合理的情況。
比如我現在手裡握著遊戲手柄,上面傳來主角受傷時的震動,此時角色模型與敵人的武器模型產生交叉,視覺特效與受傷音效同時出現 —— 這是一個典型的動作冒險遊戲場景,多種類型的場景不斷堆疊、重複,形成一段連貫的由我的肉體以及精神互動形成的遊戲體驗,而我的任務就是通過體驗這一切得出混合了各方面元素的結論:遊戲本身的質素在市場上達到了怎樣的水準,會有多少玩家在多大程度上喜歡這款遊戲,這遊戲到底能不能幫開發商/發行商賺錢?
我不是故意要給自己的日常工作加上一道神秘主義光環以此來對抗 AI 革命拒絕進步,實在是因為在我匱乏的想像力邊界範圍內,至少目前能看到的 AI 拋開逗悶子、製造段子的調侃不談,在具體的工具層面都只能對一些有明確目標或準確答案的日常工作提供輔助,其結果還是需要專業人士進行修正才能用(比如前端代碼的編寫等等),具體到文科的一些基礎工作上效果的確明顯,和現有的搜尋引擎相比,這也確實是一個更便捷、更人性化的內容整合工具,能夠節省大量的重複勞動時間,大幅提升這部分勞動的工作效率,但還至少現階段暫時還沒有觸達到我們工作的核心競爭力領域。

遊戲評測不僅僅只是建立在評測者豐富的遊戲經驗之上就能直接得出一個明確結論的東西,如果真是這樣的話,那麼只需要建立一個專門的「遊戲測試 AI」,給它玩過幾千上萬款遊戲之後就能解決這個問題。
AI 要想代替評測者來做分析和預測,更重要的障礙在於這是一個並不存在所謂標準答案的工作,AI 並不能通過學習以及部分掌握「規律」來獲得預判一款新遊戲的質素以及市場反應,因為這行當根本就沒有「規律」可言。
實力雄厚的大公司就沒有暴雷虧本的產品嗎?層出不窮。默默無聞的微型團隊出不了爆款嗎?《空洞騎士》的開發商 Team Cherry 攏共就 3 個人。不僅如此,如果說客觀總結一款遊戲本身的質素表現本身對於機器來說就已足夠困難,但還不是 100% 沒有解決可能的話,那麼不同地域、不同興趣指向的玩家群體面對這樣一款遊戲的反應如何,就真的如同黑洞一般難以捉摸了,而在工作實踐中後者往往才是開發商/發行商最關心也最難以把握的難題。
從業多年,我已經見證過太多開發者志得意滿、遊戲本身質量也不錯,但最終被現實無情打臉的遊戲,莫名其妙的偶發意外對遊戲產品產生至關重要影響的戲劇化場面也出現過無數次,目前來看沒有任何機制和手段能夠預測和防止這類「意外」情況的出現。

如果 AI 能夠完成這項工作的話,那說明我們的生活已經進入好萊塢科幻電影的領域,而這又會牽扯到一系列法律和倫理問題,比如最簡單的,誰有權利逮捕一個根據預測有 99% 的可能會在未來 N 小時內犯罪的人?具體到遊戲業務上,AI 根據邏輯演算讓你不要更新一個功能,這有 XX% 的可能帶來大量負面評價,你現在是開發者,你會不會聽 AI 的?AI 要如何為它提供的建議以及決策導致的後果負責?自爆嗎?
好吧,就此打住。
做遊戲內容評估和分析的確是建立在當事人豐富的遊戲經驗之上,這部分也許可以數據化、也許可以總結出一定的邏輯性被 AI 學習、掌握,但最終的結論一定是基於客觀經驗以及主觀情感所得出的,內容輸出的邏輯出發點上機器和人有著本質的不同,一個基於現有和過往資料的邏輯推演,一個在此基礎上還會疊加當下的瞬間情緒與個人感情。
就像文章開頭提到的劉培強的怒吼與 MOSS 冰冷的話語之間,到底還是存在一道鴻溝的,至少暫時是這樣。
總結
再次強調,我不是鄙視、不看好以 ChatGPT 為代表的人工智慧模型的成就與發展前景,恰恰相反,獲得 New Bing 資格之後,我用它來搜集寫文章的基礎資料的效率相比以往動輒打開十幾個標籤的時代有指數級的提升,我很享受這種技術進步帶來的便利性。
但問題是至少目前階段我沒有看到一些摻雜了大量感性的、不確定元素的、強烈主觀意識的工作內容被 AI 全完替代的可能,比如 GPT-4 現在可以模仿郭德綱給你講一段全是京片子的笑話,但無法從零開始變出一個新的「郭德綱」,或是評估一個年輕人會不會成為下一個「郭德綱」。
基於現有技術與表達習慣的無窮隨機組合每天都在創造全新的、出人意料的遊戲產品,這也是我作為從業者始終對這個行業保持興奮和期待的主要原因,分享這種接觸到新生事物的激情既是一種職業需要,也是我作為一個玩家的本能,如果有一天 AI 已經進化到可以取代我的程度,我想知道它要如何把控制林克走出洞穴來到一片綠地時的興奮傳達給所有人。
整篇文章都是我一個老頭子在做情緒輸出,這一點都不科技,一點都不 AI,最後還是聽聽 ChatGPT 是怎麼說的。

PS:這段回答跟我文章里想要表達的意思差不多,但明顯更言簡意賅一些,我是得考慮找個新工作了(TдT)