Anthropic發布Claude Sonnet 5大語言模型，編程能力與安全性雙升級

Anthropic今日正式發布了Claude Sonnet 5，這是一款中端大語言模型，在多個維度上超越了前代產品。

贊助商廣告

該模型將成為Anthropic旗下Claude聊天服務消費級套餐的默認選項。

Anthropic的商用大語言模型產品線分為三個系列：入門級的Haiku系列、中端的Sonnet系列，以及高端的Opus系列。今年4月，該公司推出了兩款能力更強的大語言模型Mythos 5和Fable 5，性能甚至超越了Opus系列，但目前尚未向大眾開放。

在編程能力方面，Anthropic使用SWE-Bench Pro和Terminal-Bench 2.1兩項基準測試對Sonnet 5進行了評估。與前代產品相比，該模型的得分分別提升了5.1%和13.4%。不過，OpenAI旗下同級別競品GPT-5.6 Terra在Terminal-Bench 2.1上的表現仍領先Sonnet 5約4%。

Anthropic還對新模型在其他領域的表現進行了測試。在涵蓋44個職業知識工作任務的GDPval-AA v2基準測試中，Sonnet 5獲得了1618分，而上一代Sonnet 4.5僅得1395分。

Sonnet 5輸出質量提升的一個重要原因在於其自主性更強。據Anthropic介紹，參與發布前測試的用戶反饋，該模型有時會在未收到指令的情況下主動對輸出結果進行二次核查。此外，Sonnet 5還能夠處理前代模型難以應對的複雜任務。

大語言模型自主性的增強在某些場景下可能帶來網路安全風險。Anthropic表示，Sonnet 5在應對此類風險方面優於Sonnet 4.6，尤其是在攔截惡意請求和提示詞注入攻擊方面表現更為出色。所謂提示詞注入攻擊，是指隱藏在大語言模型所分析數據中的惡意指令。

新模型內置了相應的防護機制，可阻止黑客利用其發動網路攻擊。據Anthropic透露，由於該模型無法生成可實際運行的漏洞利用代碼，因此其帶來的網路安全風險十分有限。

Sonnet 5現已成為Claude聊天服務免費版和面向消費者的Pro套餐的默認模型，未來還將向Max、Team和企業版套餐用戶開放。開發者則可通過Anthropic的應用程式編程接口調用該模型。自9月起，Sonnet 5的定價為每百萬輸入Token 3美元、每百萬輸出Token 15美元，略高於OpenAI的中端產品Terra。

贊助商廣告

Anthropic用戶即將獲得另外兩款新模型的訪問權限。本月早些時候，該公司發布了旗艦大語言模型Mythos 5及其精簡版Fable 5，後者內置了更嚴格的防護機制，可隱藏潛在風險提示詞。

Mythos 5和Fable 5發布數日後，美國政府對這兩款模型實施了出口管制，Anthropic隨即暫停了相關模型的推廣。該公司今日宣布，上述管制已被解除，相關訪問權限將於周三起逐步恢復。Anthropic計劃將Fable 5向大眾廣泛開放，而Mythos 5則僅向有限數量的受信任機構提供訪問權限。

Q&A

Q1：Claude Sonnet 5的編程能力提升有多大？

A：根據Anthropic的測試，Claude Sonnet 5在SWE-Bench Pro基準測試上比前代提升了5.1%，在Terminal-Bench 2.1上提升了13.4%。不過，OpenAI的同級別競品GPT-5.6 Terra在Terminal-Bench 2.1上仍領先Sonnet 5約4%。

Q2：Claude Sonnet 5的安全防護機制有哪些改進？

A：Claude Sonnet 5在安全性方面有明顯提升，能更有效地攔截惡意請求和提示詞注入攻擊。模型內置了防護機制，阻止黑客用其發動網路攻擊，且由於無法生成可實際運行的漏洞利用代碼，其整體網路安全風險被控制在較低水平。

Q3：Claude Sonnet 5的定價是多少？如何獲取訪問權限？

A：自9月起，Claude Sonnet 5的定價為每百萬輸入Token 3美元、每百萬輸出Token 15美元。該模型現已成為Claude免費版和Pro套餐的默認模型，同時也將向Max、Team和企業版套餐開放。開發者可通過Anthropic的API接口調用該模型。