
OpenAI 今日宣布其 o3-mini 大語言模型正式向 ChatGPT 用戶和開發者開放使用。
該發布消息在幾小時前就已泄露。據 Wired 報道,OpenAI 提前發布 o3-mini 是為了應對 DeepSeek 上周一發布的專注推理的大語言模型 R1。後者的發布引發了人工智慧股票的大幅拋售,也讓人們對 OpenAI 模型的成本效益產生質疑。
o3-mini 在去年 12 月首次預覽,它是 OpenAI 旗艦推理優化大語言模型 o3 的低成本版本,且運行速度更快。OpenAI 今天詳細介紹稱,o3-mini 的延遲性能與去年 9 月發布的較為基礎的推理大語言模型 o1-mini 相當。
該公司已在 ChatGPT 的免費版、Plus 版、Pro 版和 Team 版中提供 o3-mini。該模型將於下周在企業版中推出。在 Plus 和 Team 版本中,o3-mini 的使用限制為每天 150 條消息,是 o1-mini 支持數量的三倍。
OpenAI 還通過多個應用程序接口 (API) 提供新模型。開發者可以使用這些 API 將 o3-mini 集成到他們的應用程序中。API 版本的模型提供三種不同輸出質量的版本:o3-mini-low、o3-mini-medium 和 o3-mini-high。
OpenAI 的推理優化模型採用了稱為"測試時計算"的處理方法。該方法通過增加生成每個答案所使用的硬體資源來提高大語言模型的響應質量。入門級的 o3-mini-low 版本需要最少的基礎設施和時間來回答問題,而高端的 o3-mini-high 則需要最多的硬體資源。
在 12 月的演示中,OpenAI 展示了 o3-mini 與旗艦推理模型 o3 的對比。在一項編程挑戰評估中,o3-mini 獲得了 2,073 分,而 o3 獲得了 2,727 分。其中,o3-mini 還用 Python 為自己的 API 編寫了一個基於網路的聊天機器人界面。
OpenAI 工程師在 12 月的評估中還進行了其他測試。他們發現 o3-mini-high 在美國數學奧林匹克競賽資格考試中獲得了 83.6 分(滿分 100 分),僅落後於 o3 不到 16 分。根據 OpenAI 今天發布的最新基準測試結果,o3-mini-high 的分數已提升到 79.6 分,這暗示公司可能自上月演示以來已對模型進行了升級。
OpenAI 於去年 9 月推出了第一代推理大語言模型 o1。據 Wired 今日援引消息源稱,該發布揭示了公司內部開發流程存在的問題。報道稱,OpenAI 將 o1 部署在一個並非為商業使用設計的 AI 技術棧上,為了追求速度而犧牲了一些"實驗嚴謹性"。
該公司還開發了第二個更可靠的 AI 技術棧。OpenAI 曾試圖合併這兩種技術,但員工認為該項目"未能完全實現"。
在 12 月的 o3-mini 演示中,OpenAI 首席執行官 Sam Altman 詳細說明,公司計劃在發布前與外部 AI 安全研究人員合作測試 o3-mini。此前公司僅依賴內部安全測試。Altman 補充說,公司的旗艦推理模型 o3 將在 o3-mini 發布後"不久"推出。