宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

Anthropic發布Claude Sonnet 5大語言模型,編程能力與安全性雙升級

2026年07月01日 首頁 » 熱門科技

Anthropic今日正式發布了Claude Sonnet 5,這是一款中端大語言模型,在多個維度上超越了前代產品。

該模型將成為Anthropic旗下Claude聊天服務消費級套餐的默認選項。

Anthropic的商用大語言模型產品線分為三個系列:入門級的Haiku系列、中端的Sonnet系列,以及高端的Opus系列。今年4月,該公司推出了兩款能力更強的大語言模型Mythos 5和Fable 5,性能甚至超越了Opus系列,但目前尚未向大眾開放。

在編程能力方面,Anthropic使用SWE-Bench Pro和Terminal-Bench 2.1兩項基準測試對Sonnet 5進行了評估。與前代產品相比,該模型的得分分別提升了5.1%和13.4%。不過,OpenAI旗下同級別競品GPT-5.6 Terra在Terminal-Bench 2.1上的表現仍領先Sonnet 5約4%。

Anthropic還對新模型在其他領域的表現進行了測試。在涵蓋44個職業知識工作任務的GDPval-AA v2基準測試中,Sonnet 5獲得了1618分,而上一代Sonnet 4.5僅得1395分。

Sonnet 5輸出質量提升的一個重要原因在於其自主性更強。據Anthropic介紹,參與發布前測試的用戶反饋,該模型有時會在未收到指令的情況下主動對輸出結果進行二次核查。此外,Sonnet 5還能夠處理前代模型難以應對的複雜任務。

大語言模型自主性的增強在某些場景下可能帶來網路安全風險。Anthropic表示,Sonnet 5在應對此類風險方面優於Sonnet 4.6,尤其是在攔截惡意請求和提示詞注入攻擊方面表現更為出色。所謂提示詞注入攻擊,是指隱藏在大語言模型所分析數據中的惡意指令。

新模型內置了相應的防護機制,可阻止黑客利用其發動網路攻擊。據Anthropic透露,由於該模型無法生成可實際運行的漏洞利用代碼,因此其帶來的網路安全風險十分有限。

Sonnet 5現已成為Claude聊天服務免費版和面向消費者的Pro套餐的默認模型,未來還將向Max、Team和企業版套餐用戶開放。開發者則可通過Anthropic的應用程式編程接口調用該模型。自9月起,Sonnet 5的定價為每百萬輸入Token 3美元、每百萬輸出Token 15美元,略高於OpenAI的中端產品Terra。

Anthropic用戶即將獲得另外兩款新模型的訪問權限。本月早些時候,該公司發布了旗艦大語言模型Mythos 5及其精簡版Fable 5,後者內置了更嚴格的防護機制,可隱藏潛在風險提示詞。

Mythos 5和Fable 5發布數日後,美國政府對這兩款模型實施了出口管制,Anthropic隨即暫停了相關模型的推廣。該公司今日宣布,上述管制已被解除,相關訪問權限將於周三起逐步恢復。Anthropic計劃將Fable 5向大眾廣泛開放,而Mythos 5則僅向有限數量的受信任機構提供訪問權限。

Q&A

Q1:Claude Sonnet 5的編程能力提升有多大?

A:根據Anthropic的測試,Claude Sonnet 5在SWE-Bench Pro基準測試上比前代提升了5.1%,在Terminal-Bench 2.1上提升了13.4%。不過,OpenAI的同級別競品GPT-5.6 Terra在Terminal-Bench 2.1上仍領先Sonnet 5約4%。

Q2:Claude Sonnet 5的安全防護機制有哪些改進?

A:Claude Sonnet 5在安全性方面有明顯提升,能更有效地攔截惡意請求和提示詞注入攻擊。模型內置了防護機制,阻止黑客用其發動網路攻擊,且由於無法生成可實際運行的漏洞利用代碼,其整體網路安全風險被控制在較低水平。

Q3:Claude Sonnet 5的定價是多少?如何獲取訪問權限?

A:自9月起,Claude Sonnet 5的定價為每百萬輸入Token 3美元、每百萬輸出Token 15美元。該模型現已成為Claude免費版和Pro套餐的默認模型,同時也將向Max、Team和企業版套餐開放。開發者可通過Anthropic的API接口調用該模型。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2026 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新