Google DeepMind挑戰數學奧林匹亞競賽達銀牌水準

國際數學奧林匹亞競賽（International Mathematical Olympiad，IMO）是歷史最悠久、規模最盛大的中學生數學競賽，自1959年以來每年舉辦一次，今年的IMO已是第65屆，更有來在AI霸權Google DeepMind的挑戰。

贊助商廣告

Google DeepMind推出的AlphaProof，是一個以強化學習為基礎的新型形式數學推理系統，通過產生並驗證數百萬個證明進行自我訓練，逐步解決更困難的問題；以及AlphaGeometry 2，是幾何解題系統的升級版本，由Gemini模型所支持。這兩套AI系統共同解決今年IMO競賽6道題目中的4題，達到銀牌得主的水準，並展現數學推理能力的巨大進步。

這次由IMO金牌得主、菲爾茲獎（Fields Medal）得主的著名數學家Timothy Gowers教授，以及兩屆IMO金牌得主、IMO 2024試題委員會主席Joseph Myers博士，根據IMO評分規則對Google DeepMind的系統進行評分。

Google DeepMind指出，今年IMO競賽題目被翻譯成正式的數學語言，讓這兩套AI系統能夠理解。在正式比賽中，學生分兩節提交答案，每節4.5小時。Google DeepMind的系統在幾分鐘內先解決一個問題，並花3天時間解決其他問題。

AlphaProof通過確定答案並證明其正確性，成功解決兩個代數問題和一個數論問題，其中包括今年競賽最困難的問題，僅5名參賽學生有解決，加上AlphaGeometry 2證明的幾何問題，共解出四個問題，還有兩個組合數學問題未解決。

今年IMO競賽六個問題中的每解一題可獲7分，總分最高42分，金牌門檻則為29分。Google DeepMind的系統獲得28分，距離金牌只有一步之遙。

「主要條件是，該程序比人類選手需要更長的時間，其中一些問題需要超過60個小時，當然處理速度比人類大腦快得多。」Timothy Gowers賽後通過X（前身Twitter）談道，「如果人類選手在每個問題上允許思考這麼長的時間，他們無疑會獲得更高分數。」儘管存在限制，他認為這種AI系統可成為有價值的研究工具。

If the human competitors had been allowed that sort of time per problem they would undoubtedly have scored higher.
Nevertheless, (i) this is well beyond what automatic theorem provers could do before, and (ii) these times are likely to come down as efficiency gains are made.
— Timothy Gowers @wtgowers (@wtgowers)July 25, 2024

數學家Timothy Gowers分享Google DeepMind挑戰IMO競賽的看法。

贊助商廣告

（首圖來源：Google DeepMind）