宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

被 AlphaGo 擊敗的李世石,用 8 年重建崩塌的世界

2024年07月22日 首頁 » 其他

被 AlphaGo 擊敗的李世石,用 8 年重建崩塌的世界

輸給 AI,有種感覺是,我整個世界都塌了。

被 AlphaGo 擊敗的李世石,用 8 年重建崩塌的世界

2016 年,這位曾 14 次獲世界冠軍的韓國棋士代表人類出戰 Google 的 AlphaGo,最終以 1:4 告敗。

他當初在接受邀請時,覺得那會是一次「好玩」的經歷:

好玩的前提是我覺得會贏。我從未想過自己會輸。

那可能是 AI 技術在 ChatGPT 登場前,其中一個最重要的高光時刻。

現在離 ChatGPT 的發布過去了不足兩年,我們已看到多個領域被 AI 影響,而生活更多方面似乎也被埋下了改變的伏筆,我們總忍不住想要去推測和暢想未來的 AI。

在這個語境下,比其他行業和領域更早受到 AI 衝擊的圍棋界,能幫助我們看到一種已經發生的可能性。

擊敗人類後,更強的 AI 在進一步去「人味」

被 AlphaGo 擊敗的李世石,用 8 年重建崩塌的世界

我沒有辦法再去享受圍棋,所以我就退役了。

和 AlphaGo 對戰的三年後,李世石正式宣布退役。

對於 5 歲就開始學圍棋的李世石而言,圍棋不僅是競賽,而是一種藝術,一種棋手個性和風格的延伸,但在 AI 時代,它卻「淪為」了算法的效率遊戲。

在這三年間,其實還發生了另一件事。

2017 年,DeepMind 宣布了新版的 AlphaGo —— AlphaGo Zero。

AlphaGo 誕生自神經網路對人類高手 3000 多萬手數的學習和自我練習,但 AlphaGo Zero 卻是從一開始就脫離「人味」,訓練期間不接觸任何人類棋譜,單純靠自己和自己下棋訓練。

只用了三天,AlphaGo Zero 在迎戰 AlphaGo 時就已經以 100:0 取勝。

被 AlphaGo 擊敗的李世石,用 8 年重建崩塌的世界

在圍棋中,有一種手法看起來簡單或無關緊要,但長遠卻能造成致命威脅,有人會說那就像是「幽靈」般。

而 AlphaGo 和 AlphaGo Zero 的棋譜,卻難以理解到直接被視為「外星文明投下的一本神秘指南」。

美國職業棋手 Michael Redmond 於 2017 年表示,人類學習圍棋其中一個重要的手段是搭建一個故事:「那是我們溝通的方式。它是一件非常人性的事。」

這也許也呼應了李世石的觀點,在下棋時,棋手也展現了他們作為人的一部分。

Redmond 補充說,據他自己的觀察,人類棋手初見「AI 味」棋路時很可能直接「舉手投降」:

AlphaGo 下棋的方式,總讓人覺得很「非人性」,面對這樣的棋局,我們甚至很難投入其中。

李世石作為其中一位最早經受到衝擊的圍棋高手,久久不能釋懷。

他開始執迷於 AI。

被 AlphaGo 擊敗的李世石,用 8 年重建崩塌的世界

退役後,除了開設自己的圍棋學院、出書和推出基於圍棋的桌遊外,李世石還開始做關於 AI 的演講:

我算是很早開始面對 AI 的問題,其他人也將會經歷。那未必會有開心大團圓結局。

對於他來說,AI 最讓人擔心的地方在於,它可能會改變人類的價值觀:

過去,人們會對創造力、原創性和創新充滿敬畏,但自從 AI 出現以來,這些很多都已經消失了。

並不是所有人都同意這個講法。

人機共創時代

被 AlphaGo 擊敗的李世石,用 8 年重建崩塌的世界

AI 毀滅了圍棋圈所有存在的秩序,然後開始重建。

在康奈爾大學研究人工智慧的圍棋愛好者 Jiuheng He 說道。

在很多圍棋學院裡,用 AI 來學習圍棋已經幾乎是所有棋手都要經歷的過程。

在香港一家圍棋學院裡,Ng Chee Man 會為學生提供 iPad 來用 AI 學習圍棋。

每次到學生下棋,AI 都會展示出「最佳走法」建議,同時,系統也會記錄下學生哪些步下得好,哪些不好。

被 AlphaGo 擊敗的李世石,用 8 年重建崩塌的世界

去年,在《美國國家科學院院刊》上刊登的一篇研究指出,自從 AI 進入圍棋圈後,人類棋手的判斷能力獲得了提升。

早在 2016 年,在 AlphaGo 打敗李世石前,曾在不公開測試中對決 AlphaGo 的樊麾也有過類似經歷。

雖然落敗,但樊麾說 AlphaGo 讓以他一種全新的方式去看待圍棋,提升他的技巧,讓他的世界排名快速躍升。

2023 年的研究則以 1950 年至 2021 年積累的棋譜為基礎,包含了 580 萬手數的數據。

研究人員發現,在 AlphaGo 擊敗李世石前,人類棋手的判斷質量在 66 年中都保持平穩,基本不變,但在 2016、2017 期間,棋手的判斷質量開始爬升。

換言之,人類棋手雖然未必能擊敗 AI 棋手,但他們的判斷能力的確有所提升。

看到人類棋手能如此快速地適應,將這些新走法融入自己的方法中正式讓人非常振奮。

這些結果表明,人類將適應這些發現,並在它們基礎上大大地提升自身潛力。

DeepMind 首席研究科學家、 AlphaGo 項目負責人 David Silver 對這個研究評論道。

被 AlphaGo 擊敗的李世石,用 8 年重建崩塌的世界

曾被 AlphaGo 於 2017 年擊敗的柯潔,也曾於 2023 年表示自己除了比賽外,已經很少和真人練習了,並認為 AI 甚至已經成為了圍棋創造力的源頭:

創造性不是你隨便做一件什麼不同的事情,創造性必須投入實戰並得到檢驗,現在圍棋創新的大部分是 AI 來完成,我們想下一些和以前不一樣的棋,大概率會輸,因為 AI 通過大量實戰,得出和之前不同的思維,這才是創造力。

除此以外,另一位職業棋手的表現也尤其引人關注。

韓國棋手申真諝是首位奪得世界冠軍的 00 後棋手,常被棋迷稱為「申工智能」,因為他正是通過長時間進行 AI 訓練和研究著稱。

被 AlphaGo 擊敗的李世石,用 8 年重建崩塌的世界

今年 2 月,申真諝於 25 屆農心杯擊敗中國主將辜梓豪,實現了單賽季六連勝,跨賽季 16 連勝,超越了其前輩李昌鎬。今年 3 月,他談論了自己和 AI 的關係:

我覺得我和 AI 現在是朋友關係。

我和比我更優秀的 AI 一起學習。AI 和人類的思路是完全不同的,AI 通過數學算法解決問題,借鑑 AI 的思路使我受益良多。

現在,中國、韓國、日本的職業選手,都會用 AI 來訓練。

「AI 味」啟示錄

被 AlphaGo 擊敗的李世石,用 8 年重建崩塌的世界

正如在生成式 AI 時代下,一些設計師和作者需要因為作品中包含的所謂「AI 味」而進行繁複的自證,在融入 AI 已久的圍棋界也一直在面對「AI 味」衍生出來的各種議題。

在現時圍棋比賽中,常常都會配有 AI 推測勝率和 AI 推薦最好的走法。觀眾在觀賽過程中也因此能獲得一種「主動性」,擁有多個觀賽的角度。

2022 年,中國棋手李軒豪在對決申真諝過程中,很多決策都和 AI 最優判斷預測前三符合,因此被隊友楊鼎新質疑其有用 AI 作弊之疑。

生於 95 年的李軒豪在用 AI 訓練上「朝九晚九,全年無休,確實很用功」,因此棋路有時會被視作有所謂的「機器味」。

被 AlphaGo 擊敗的李世石,用 8 年重建崩塌的世界

對於質疑,中國圍棋協會進行了調查,最終認定這一指控沒有證據,楊鼎新作出了處罰。

但用 AI 作弊的情況也的確存在。

2020 年,韓國 13 歲的職業棋手金恩持被發現在線上比賽中的落子與 AI 推薦有高達 92% 的重合。經過調查後,最終認定其作弊(且本人也承認了),被罰禁賽一年。

2022 年,中國棋手劉睿智被判定 AI 作弊,是中國首次正式因 AI 作弊而被處罰的職業棋手。和金恩持相比,劉睿智已經懂得規避「AI 味」,只是在一些關鍵點用了 AI。

為了應對,各國的比賽也是在不斷改進反 AI 作弊機制。

與此同時,也有人利用了「AI 味」來擊敗 AI。

KataGo 是現有開源最強圍棋 AI 之一,韓國也會用它來訓練棋手。

Pelrine 利用了名為 FAR AI 的程序和 KataGo 對決了超過 100 萬局,最後 FAR AI 找到了 KataGo 的弱點,並在人機對決中踐行且獲勝了:

那個策略算不上小兒科,但也不是特別難學。

然後,他也用同樣的方法擊敗了另一個比較厲害的圍棋 AI Leela Zero。

被 AlphaGo 擊敗的李世石,用 8 年重建崩塌的世界

策略關鍵在於要創造一個大的「圈」來圍住對手一組棋,然後可以突然把一子下到另一個不相關的角落,去干擾 AI。

Pelrine 說,如果是人類棋手,看到那個圈肯定就知道有問題,但 AI 並不會留意到。

這個弱點看起來有點「取巧」,是不是讓 AI 去進行針對性地訓練就能打上補丁?

《自然》上周一篇報道援引了今年一篇預印本論文指出,面對專門找 AI 弱點的程序,模型的漏洞並非想像中容易修復。

這次被「針對」的還是 KataGo。研究人員用三種不同的策略來讓 KataGo 反擊能力更強:

讓 KataGo 通過自我對弈學習如何應對攻擊;疊代訓練,用攻擊程序攻擊 KataGo,把漏洞反饋給 KataGo,讓它通過自我對弈或其他方式學習應對,然後再用攻擊程序攻擊 KataGo,往復循環;從頭開始訓練一個新的圍棋 AI 系統,採用不同的神經網路模型。

雖然這些訓練在一定程度上幫助了 KataGo 提高防禦能力,但攻擊程序依舊能發現漏洞,分別以 91%、81% 和 78% 的勝率擊敗 KataGo。

這些攻擊程序本身不是出色的圍棋 AI,人類也能輕鬆擊敗。

當然,這裡的關鍵不是去比拼到底是人類厲害還是 AI 厲害。

重點是,對於圍棋這個 AI 曾「顛覆」的領域,並且經過那麼多年的應用與改進,其 AI 依舊存在很多問題。論文作者 Adam Gleave 說道:

如果我們在像圍棋這種單一領域裡也沒法解決這個問題,那在短期里,想在 ChatGPT 之類模型修復越獄的可能性似乎很小。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新