OpenAI於1月31日正式推出最新的推理模型o3-mini,相較於前一代o1-mini,o3-mini擁有更強的推理能力,並降低延遲;ChatGPT免費用戶也可使用o3-mini,這也是OpenAI首次允許免費用戶體驗推理模型。o3-mini這款新模型在運算成本、速度與推理能力之間達到優化平衡,特別適用於數學、科學與程序設計等STEM領域。
o3-mini是OpenAI首款支持函數調用(Function Calling)、結構化輸出(Structured Outputs) 和開發者消息(Developer Messages) 的小型推理模型。該模型提供低、中、高三種推理模式,用戶可根據需求選擇更快的回應速度或更深入的推理能力,適用於不同應用場景。不過,o3-mini不支持形象識別,需處理視覺推理任務時,仍需使用OpenAI o1。
根據OpenAI的測試,o3-mini在競技數學(AIME)、博士級科學問答(GPQA)和競技程序設計(Codeforces)等基準測試中均表現優異。在AIME 2024數學測驗中,o3-mini高推理模式的準確率比過去版本有明顯進步;在高推理模式下,能在FrontierMath測試中成功解決32%的數學問題,並能有效提升程序設計相關的準確度與效率。
除了提升推理能力,o3-mini也在回應速度上超越o1-mini,平均回應時間比前代快24%,首次回應時間減少2500毫秒,提供更即時的對話體驗。同時,OpenAI也強化安全機制,使用「深思熟慮對齊(Deliberative Alignment)」技術,確保AI能依照安全規範進行推理,減少錯誤與不當回應的風險。OpenAI也表示將持續優化推理模型,在降低運算成本的同時,確保AI的智慧、效率與安全性。
目前,ChatGPT Plus、Team和Pro方案的用戶已可使用o3-mini,企業方案則將於2月開放。此外,這次OpenAI也首次允許免費用戶體驗推理模型,用戶只需在對話框選擇「推理(Reason)」或重新產生回應,即可試用o3-mini。