繼兩周前首席執行官Sam Altman預告,OpenAI上周宣布具推理能力的小型AI模型OpenAI o3-mini,已部署到ChatGPT及API供付費方案用戶及開發人員使用。
OpenAI是於去年12月新消息12連發中,公布最新一代具推理能力的旗艦模型o3,並預告o3-mini將是最先推出的同系列模型。
OpenAI指出,o3-mini保有OpenAI o1-mini的低成本及低延遲性,但進一步拓展小模型的性能及速度,具備優異的STEM(科學、數學和程序撰寫)能力。o1仍是OpenAI最主要的通用知識推理模型,但是在需要精準和速度的STEM領域o3-mini提供另類選擇。在ChatGPT中,o3-mini使用中等推理能力,兼顧速度和答案的精準性。
對開發人員而言,o3 mini也是OpenAI第一個提供高呼聲開發功能的小型模型,像是函數調用、結構式輸入及開發人員消息等。和o1-mini相同,o3-mini也支持流媒體。開發人員有低、中、高三種推理能力,可以選擇用於不同使用場景。這種彈性讓o3-mini可以在解決複雜任務時更積極思考,或是在考量延遲性時優化速度。
根據OpenAI提供的數據,在AIME 2024數學基準測試中,o3-mini-high推理能力等級模型得分在87.3,優於o1-preview的56.7及o1-mini的63.6。科學解題的GPQA Diamond測試中,o3-mini-high(79.7)也高於o1-preview(78.3)及o1-mini(60.0)。程序競賽測試(Codeforces)及軟體工程(SWE-bench Verified)測試中,o3-mini-high也都高過另二個前代模型。
圖片來源/OpenAI
o3-mini現在也能集成搜索功能,可提供即時網頁答案及連接。OpenAI說致力於將搜索集成至所有推理模型,o3-mini是早期原型。
不過目前o3並不支持視覺功能,需要的用戶還是得繼續使用o1-mini。
o3-mini現在已部署到ChatGPT及API。API部分,即日起o3-mini已經部署到API使用層級3到5特定開發人員的Chat Completions API、Assistants API及Batch API。
在ChatGPT部分,Plus、Team和Pro用戶現在就可以訪問o3-mini,企業方案用戶2月可以開始使用。在模型選擇器中的o1-mini將由o3-mini取代,提供更高速限和更低延遲性。Plus和Team用戶每天互動消息,由o1-mini的50則提高為o3-mini的150則。所有付費用戶都可以在模型選擇器,選擇回應時間耗時較久的o3-mini-high,Pro用戶則可以無上限選擇o3-mini及o3-mini-high。
免費方案用戶也可以試用o3-mini,方法是選擇消息輸入圍的「Reason」圖標。o3也是第一個提供給免費ChatGPT用戶的推理模型。
OpenAI指出,由於持續提升模型數理推理能力,和GPT-4相比,現在OpenAI的模型每字詞使用價格已降低95%,未來該公司會持續朝此發展。
OpenAI此舉顯然部分是回應橫空出世的中國新興開源模型DeepSeek。DeepSeek V3模型多項性能測試超越Meta Llama,令美國AI科技公司繃緊神經,加快研發及推出作業。