今天,我們發布了Gemini 3 Deep Think的重大升級版本,這是我們專門的推理模式,旨在推進智能前沿並解決科學、研究和工程領域的現代挑戰。
我們與科學家和研究人員密切合作,更新了Gemini 3 Deep Think以應對艱難的研究挑戰——這些問題往往缺乏明確的界限或單一正確解決方案,數據通常混亂或不完整。通過將深厚的科學知識與日常工程實用性相結合,Deep Think超越了抽象理論,推動實際應用。
新的Deep Think現已在Gemini應用中向Google AI Ultra訂閱用戶開放,這是我們首次通過Gemini API向特定研究人員、工程師和企業提供Deep Think。可在此處申請早期訪問權限。
以下是早期測試者使用最新Deep Think的情況:
羅格斯大學數學家Lisa Carbone專注於高能物理學界所需的數學結構研究,致力於彌合愛因斯坦引力理論與量子力學之間的鴻溝。在這個訓練數據極其稀少的領域,她使用Deep Think審查一篇高度技術性的數學論文。Deep Think成功識別出一個微妙的邏輯缺陷,這個缺陷此前在人工同行評議中未被發現。
在杜克大學,Wang實驗室利用Deep Think優化複雜晶體生長的製造方法,用於潛在的半導體材料發現。Deep Think成功設計了生長大於100微米薄膜的配方,達到了以往方法難以實現的精確目標。
Google平台與設備部門研發負責人、前Liftware首席執行官Anupam Pathak測試了新的Deep Think來加速物理組件設計。
通過數學和算法嚴密性提升推理能力
去年,我們展示了專門版本的Deep Think能夠成功應對一些最嚴峻的推理挑戰,在數學和編程世界錦標賽上達到金牌標準。最近,Deep Think使專門的智能體能夠進行研究級數學探索。
更新的Deep Think模式繼續推進智能前沿,在最嚴格的學術基準測試中達到新高度,包括:
在"人類最後考試"基準測試中創造新標準(無工具輔助下48.4%),該基準測試旨在測試現代前沿模型的極限
在ARC-AGI-2上取得前所未有的84.6%成績,經ARC Prize基金會驗證
在Codeforces上獲得驚人的3455 Elo評分,這是一個包含競賽編程挑戰的基準測試
在2025年國際數學奧林匹克競賽中達到金牌級表現
駕馭複雜科學領域
除了數學和競賽編程,Gemini 3 Deep Think現在在化學和物理等廣泛科學領域也表現卓越。我們更新的Deep Think模式在2025年國際物理奧林匹克競賽和化學奧林匹克競賽的筆試部分展現出金牌級結果。它還在高級理論物理方面表現出熟練程度,在CMT基準測試中獲得50.5%的分數。
加速現實世界工程應用
除了最先進的性能表現,Deep Think還致力於推動實際應用,使研究人員能夠解釋複雜數據,工程師能夠通過代碼建模物理系統。最重要的是,我們正在努力將Deep Think帶到研究人員和從業者最需要的地方——首先從Gemini API等平台開始。
通過更新的Deep Think,你可以將草圖轉化為可3D列印的現實。Deep Think分析繪圖,建模複雜形狀並生成文件,通過3D列印創造物理對象。
向Google AI Ultra訂閱用戶和Gemini API早期訪問計劃開放
Google AI Ultra訂閱用戶今天開始可以在Gemini應用中訪問更新的Deep Think模式。科學家、工程師和企業現在也可以申請我們的早期訪問計劃,通過Gemini API測試Deep Think。
我們迫不及待地想看到您的發現。
Q&A
Q1:Gemini 3 Deep Think是什麼?有什麼特別功能?
A:Gemini 3 Deep Think是Google推出的專門推理模式,專為解決科學、研究和工程領域的複雜挑戰而設計。它能夠處理缺乏明確答案和混亂數據的研究問題,將深厚科學知識與工程實用性結合,甚至能識別人工同行評議未發現的邏輯缺陷,還可以將草圖轉化為3D列印文件。
Q2:Deep Think在學術測試中表現如何?
A:Deep Think在各項嚴格學術基準測試中表現卓越:在"人類最後考試"中達到48.4%,在ARC-AGI-2上獲得84.6%,Codeforces評分達到3455 Elo,2025年國際數學奧林匹克達到金牌級表現,在國際物理和化學奧林匹克筆試中也展現金牌級結果。
Q3:如何獲得Deep Think的使用權限?
A:Google AI Ultra訂閱用戶可以直接在Gemini應用中使用更新的Deep Think模式。科學家、工程師和企業用戶可以申請早期訪問計劃,通過Gemini API體驗Deep Think功能。這是首次通過API向研究人員和企業開放這項技術。






