宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

OpenAI發布GPT-5.5,數學與編程能力大幅躍升

2026年04月24日 首頁 » 熱門科技

OpenAI近日正式推出新一代大語言模型GPT-5.5,該模型在數學解題與代碼編寫方面相較前代產品有顯著提升。

GPT-5.5的發布時間恰好在競爭對手Anthropic推出其最新大語言模型一周之後。OpenAI為用戶提供兩種版本選擇:標準版以及功能更強、定價更高的GPT-5.5 Pro版。

據OpenAI介紹,兩個版本均在多個維度上實現了輸出質量的提升。標準版GPT-5.5在電腦操作任務和知識工作方面優於上一代模型,而GPT-5.5 Pro則在商業、法律、教育和數據科學等應用場景中帶來了尤為突出的質量提升。

GPT-5.5還增強了對模糊指令的理解能力。以往,大語言模型的用戶往往需要逐步描述任務細節,否則容易產生輸出錯誤。而GPT-5.5能夠自動推斷出相關細節,例如在用戶未作說明的情況下,自行判斷如何使用MCPOpenAI發布GPT55數學與編程能力大幅躍升伺服器。

OpenAI將GPT-5.5與Anthropic上周發布的新款大語言模型Claude Opus 4.7進行了超過十項基準測試的橫向對比,GPT-5.5的標準版和Pro版在其中多項測試中均取得了更優異的成績。

在OpenAI測試集中難度最高的基準之一FrontierMath Tier 4上,該測試包含數十道博士後級別的數學難題,人類專家往往需要數天時間才能解答。GPT-5.5 Pro的得分為39.6%,接近Claude Opus 4.7所得22.9%的兩倍。

OpenAI還表示,GPT-5.5的定製版本已協助研究人員發現了一個全新的數學證明——一組用於驗證數學定理的方程式,該證明與"拉姆齊數"相關。拉姆齊數是組合數學領域的重要研究對象,在電腦科學中具有廣泛的應用價值。

在編程能力方面,GPT-5.5同樣領先於競品。標準版大語言模型在Terminal-Bench 2.0基準測試中獲得82.7%的高分,該測試衡量大語言模型使用命令行工具的能力,而Claude Opus 4.7的得分為69.4%。

OpenAI表示,GPT-5.5的編程能力已在內部得到實際應用,該模型協助優化了管理其運行基礎設施的軟體。該基礎設施由英偉達OpenAI發布GPT55數學與編程能力大幅躍升的GB200和GB300 NVL72系統組成,分別搭載了英偉達Blackwell B200和Blackwell Ultra圖形處理器。

由於GPU擁有遠多於CPU的處理核心,OpenAI的基礎設施管理軟體會將發送至GPU的大語言模型請求批量打包,並分發至晶片的各個核心進行處理。據OpenAI介紹,GPT-5.5開發出了一種更高效的處理方式,使Token生成速度提升了20%以上。

此外,該模型在非技術類任務上同樣表現出色。GPT-5.5在GDPval基準數據集上創下新紀錄,該數據集用於測試大語言模型在44個領域完成經濟價值任務的能力。值得關注的是,GPT-5.5標準版以84.9%的得分超越了Pro版以及Claude Opus 4.7。

目前,GPT-5.5已面向ChatGPT和Codex的Plus、Pro、Business及Enterprise訂閱用戶開放使用。GPT-5.5 Pro則僅在後三種訂閱方案中通過ChatGPT提供。OpenAI表示,將"很快"通過應用程序編程接口向開發者開放該模型。

Q&A

Q1:GPT-5.5和GPT-5.5 Pro有什麼區別?

A:GPT-5.5提供標準版和Pro版兩種版本。標準版在電腦操作任務和知識工作方面表現更優,而Pro版則在商業、法律、教育和數據科學等場景中帶來更大幅度的質量提升,但價格也更高。Pro版僅面向Pro、Business和Enterprise訂閱用戶開放。

Q2:GPT-5.5在數學方面的能力有多強?

A:GPT-5.5 Pro在FrontierMath Tier 4基準測試中得分39.6%,該測試包含數十道需要人類專家花費數天時間才能解答的博士後級別數學難題。這一成績接近競爭對手Claude Opus 4.7所得22.9%的兩倍。此外,GPT-5.5的定製版本還協助研究人員發現了與拉姆齊數相關的全新數學證明。

Q3:GPT-5.5如何提升了Token生成速度?

A:GPT-5.5協助優化了OpenAI管理GPU基礎設施的軟體。該軟體負責將大語言模型請求批量分發至GPU的各個處理核心,GPT-5.5開發出了更高效的分發方式,最終使Token生成速度提升了20%以上。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2026 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新