OpenAI「深度研究」準確度再超DeepSeek　評分大幅領先

OpenAI近日宣布推出全新AI研究工具「深度研究」（Deep Research），為需要深入查詢與分析的專業用戶提供更精確的數據檢索與分析功能。這項技術主要針對金融、科學、政策制定、工程等領域的知識工作者，並可應用於需要詳細比較與評估的購物決策，例如選購汽車、家電與家具等。與一般AI簡短回答不同，「深度研究」專注於多來源綜合分析，讓用戶獲得更全面與可靠的結果。

贊助商廣告

OpenAI在官方部落格中表示，「深度研究」功能現已對ChatGPT Pro用戶開放，並設有每月100次查詢限制，未來將陸續支持Plus、Team及Enterprise版本。據了解，Plus版本預計約一個月內推出，且未來付費用戶的查詢次數限制將顯著提升。

「深度研究」目前僅能通過網頁版ChatGPT使用，用戶需在輸入查詢時選擇該功能，並可附加文件或試算表進行輔助分析。根據OpenAI的說明，系統需要5至30分鐘處理查詢，完成後用戶將收到通知。未來，OpenAI計劃將此功能擴展至手機與桌面應用程式。目前「深度研究」的輸出為純文本，但OpenAI表示將加入嵌入式圖片、數據可視化圖表等分析結果，並預計支持更多專業數據來源，包括付費訂閱服務與內部資料庫。

為提升「深度研究」的準確性，OpenAI採用了特別版本的「o3」推理AI模型，該模型經過強化學習，能夠利用瀏覽器與Python工具完成實際網路查詢與數據分析，幫助AI自動篩選、解讀並分析來自網路的文本、圖像與PDF文件，並根據查詢內容靈活調整搜索方向。模型也可瀏覽用戶上傳的文件，並通過Python工具搭建圖表，讓研究結果更具參考價值。

為驗證「深度研究」的準確度，OpenAI通過「人類最後考試」（Humanity's Last Exam）測試該功能，該測試涵蓋3000多道專業級問題。測試結果顯示，「深度研究」模型提供達到26.6%的準確率，雖然數字看似不高，但已超越DeepSeek-R1的9.4%以及遠超Google Gemini Thinking（6.2%）、Grok-2（3.8%）及OpenAI自己旗下的GPT-4o（3.3%）。

贊助商廣告

OpenAI仍承認AI在處理複雜研究時可能存在不確定性，部分內容可能存在誤導性資訊，特別是在面對未經驗證的網路數據時。「深度研究」能否成為可靠的學術與專業研究工具，仍有待觀察。

數據源：OpenAI

贊助商廣告

OpenAI「深度研究」準確度再超DeepSeek 評分大幅領先

OpenAI「深度研究」準確度再超DeepSeek　評分大幅領先