「俗話說得好,三個臭皮匠,頂個諸葛亮,那三篇評測不會比一篇評測更好嗎?」這是一個 IGN 和同類網站上經常有人問的問題:為什麼不多找幾個人來評測每一部遊戲、電影、電視劇、電子產品,然後取分數的平均值,從而得出最終分數?
在紙面上,這聽上去確實不錯:這肯定能減少「離群值」分數的出現頻率(有時候,出於這樣那樣的理由,某個評測者就是會比其他人更喜歡或者更討厭某個遊戲,繼而給出一個「不合群」的分數)。我也很理解,當自己和評測者意見不一致的時候,會想要看到自己喜歡的東西分數變高,或者不喜歡的東西得分變低 —— 我們都希望自己的觀點得到認可。
但是在實踐中,大規模採用這種模式並不切合實際,而且,這種勞動密集型的方式想要解決的問題,已經由網際網路解決了。
這適用於所有類型的評測,但我會集中討論遊戲評測,因為這是我自己的專業領域。在紙媒全盛期,在《Fami 通》《EGM》這樣的雜誌里,讓好幾個人玩同一個遊戲並對其做出評價是很合理的做法。要知道,雜誌並不是免費的 —— 按年訂閱一般比較便宜,但從報攤買的話,一本通常要 5 到 12 美元 —— 所以不用再買其他雜誌就能看到另一個評測者的看法是個不小的賣點。況且在 90 年代和 2000 年代初,新遊戲的數量遠遠不及現在,所以不會因為多安排幾個人評測同一個遊戲就忽視了其他作品。
現在的情況大不相同。現在不僅新遊戲的數量指數級增長,使得讓多人評測同一個作品變得更加困難,而且,如果你想獲得不同角度的看法,只要在搜尋引擎或者影片網站上面找就行了。只要按一個鍵,你就會被淹沒在無數個觀點當中 —— 而且全都是免費的。你甚至可以打開 Metacritic 或者 OpenCritic 這樣的評測聚合網站,在一個地方查看幾十份評測的總結。
因此,從純商業的角度來看,給同一個遊戲做好幾篇評測實在不值當。由於網際網路的運作機制(具體來說是谷歌),給同一個東西寫兩篇評測並不會產生兩倍的流量。如果將兩篇評測放在同一個頁面上,那就需要雙倍的訪客才能讓收益與投入成正比。
就算將兩篇評測放在不同頁面上,也並不能解決這個問題,反倒有可能不利於網站在搜索結果中的排序(因為谷歌會試圖判斷哪一篇評測是網站中最重要的結果),而這有可能會導致流量暴跌。所以在你需要控制預算,確保高效利用它們的時候,同一個作品做好幾篇評測就很不划算。這就是 IGN —— 以及幾乎所有媒體 —— 很少這麼做的主要原因。
但也不全是錢的問題:就算不考慮收支情況,如果要把這種做法常態化,還會有後勤和風評上的問題。例如,提前評測的資格通常都很稀缺。無論是《艾爾登法環》的遊戲兌換碼,還是《阿凡達:水之道》的超前點映票,只要是這種備受期待的作品,都很難讓許多人提前接觸到它們。對遊戲來說,這一點尤為重要,大部分情況下,通關一個遊戲需要的時間遠遠超過電影的長度,所以提前玩到是非常重要的。
這是因為評測需要及時公布,大部分關注新作品的人都想儘早看到評測,但它們也是 IGN 的內容中最耗費人力的東西之一。要在評測解禁日期之前完成多篇評測,勢必會非常困難或者不可能做到,讓我們只剩下非常糟糕的選擇:我們可以等幾個人都做完評測再公布,但那樣我們就會比別人晚很多;或者是做好一篇就發布一篇,但那樣就會讓第一篇擁有更高的權重,導致各種風評問題,例如,如果最後的分數有分歧,會有人指責我們是為了吹捧或者抹黑一部作品,而故意扣住了後面幾篇。
那麼,只讓熱門遊戲,或者有特殊機緣的遊戲享受這種待遇,可不可行呢?也不合適。首先,這是一個公平性的問題。如果多篇評測的目的是減輕離群值的影響,那麼與大部分只評一次的遊戲相比,多次評測的遊戲更不容易出現過高或者過低的分數。此外,很多熱門遊戲都在一年當中最繁忙的時候發售(這也就是這些時段會變得繁忙的原因!),我們用於評測的資源已經是捉襟見肘 —— 而且這種熱門、重要的遊戲也很難拿到好幾份遊戲代碼。
即便如此,我們也確實嘗試過多人一起評測,其中最突出的就是 2019 年的《星際大戰絕地:隕落的武士團》IGN 員工集體評測。由於 EA 為我們提供了好幾份代碼,共有 8 名 IGN 員工參與了評分,並且我們在第一篇評測(照常公布的標準評測)發布了僅僅 5 天之後,就把集體評測發出來了。雖然那篇文章得到了大量好評,評論里都在夸,但是數據並不好看:點擊量只有 5 天前那篇單作者評測的 15%。
對一篇普通的評測來說,這個流量其實也不錯了,但考慮到需要 8 名員工在新遊戲扎堆的 11 月,每人投入大約 20 個小時(總共 160 個小時)來玩其中一部遊戲,這並不是利用時間的理想方式。
就算把人數縮減到每篇評測 4 個人,這依然要多用幾十個小時,而這些時間本來可以分配給《死亡擱淺》《寶可夢 劍/盾》《決勝時刻:現代戰爭》《路易吉洋樓 3》《極樂迪斯科》或者其他十幾部剛發售的遊戲 —— 而這些都是人們期待 IGN 評測的遊戲。在外人看來,我們可能是一個很龐大的組織,事實上,相對於其他競爭網站來說,我們也確實如此,但我們的資源遠非無限,我們必須合理地利用它們。
還有一點是,從我個人的理念出發,我不太喜歡將評分平均化,因為儘管最後要打一個分數,但這並非數學。比如說,用加減法來處理評分明顯是非常荒謬的:連玩兩個劣質(4 4)的遊戲,並不等於玩了一個優秀(8)的遊戲;一部大師之作(10)的前半部分,也絕對不會是平庸(5)的。
算平均分比這略好一點,因為最終的結果沒那麼荒唐 —— 將 6 分和 8 分平均成 7 分感覺是個完美的折中。但這忽略了一個事實,即評測的分數並非傳統意義上的「數字」:它們其實是代表了一串有高低順序的單詞,而給單詞取平均數也不怎麼合理。
即便你接受了平均分數的做法,在很多情況下,最終得出的分數也是實際玩過這個遊戲的人都不認可的結果……那你為什麼要相信它呢?在上面的例子中,一個人認為這個假想中的遊戲「尚可」,另一個人覺得它「優秀」,但兩個人都沒有將其描述為「良好」,但這就是它最終會得到的評價。
與一個人的個人推薦相比,這種結果更不自然、更不容易讓人產生共鳴,而且到了最後,你估計不會因為它是平均分就更加相信這個結果,因為你並不是一個平均值。你是一個有著自我觀點的人類,你的觀點和所有評測者一樣有獨特性。除非你同意每個遊戲的 Metacritic 平均分,不然這個系統 —— 它的數據樣本甚至更少 —— 怎麼會有所不同?
簡而言之,嘗試多篇評測會產生無法持續的工作量,大幅提升成本,造成大量的混亂,卻基本沒有額外收益,尤其是現在已經有評測聚合網站了。我們需要明白的是,評測和數據匯總是兩個不同的事物:一個是個人觀點,另一個更像是一堆人投票 —— 而且很重要的一點是,在人們做出個人評測之前,是根本不會有分數匯總的。
這並不意味著我們認為員工們的不同觀點沒有各自的價值和意義,也並不意味著我們想要掩飾分歧。恰恰相反,我們很鼓勵員工表達自己的看法,只要收聽我們每周的播客節目,例如 PlayStation Beyond、Xbox Unlocked、Nintend Voice Chat,就可以聽到他們針對我們評測過的遊戲自由發表意見、進行討論,有時候他們的看法和我們的評測有很大的差異。如果你發現某位 IGN 員工的口味和自己很像,想直接從他們那裡得到推薦,你也可以在社交媒體上關注他們。
此外,很多我們的 Top 10/25/100 遊戲榜單也是由評委會決定排名,而不是讓某個剛剛第一次玩過某個遊戲的人決定。最後是,每年我們都會公布我們的年度遊戲大獎,這也反映了我們員工的集體意見,而非單個評測者給出的分數。
評測有特定的時效和定位,但在 IGN,幾乎所有重要的遊戲、電影、電視節目或者設備,都不會缺少關於它們的意見和觀點。