Anthropic公司今日發布了新一代大語言模型Claude Opus 4.8,該模型在處理複雜編程任務方面的表現顯著優於前代產品。
與新模型發布同時,Anthropic宣布了另一項重大商業里程碑:公司以9650億美元估值完成650億美元新一輪融資,資金將用於採購更多計算基礎設施。
性能提升顯著
Anthropic使用Terminal-Bench 2.1基準測試評估了Claude Opus 4.8的推理能力,該基準專門衡量大語言模型在命令行中執行任務的能力。新模型得分74.2%,比4.7版本提升8.4%。在更通用的編程測試SWE-Bench Pro中,Opus 4.8的得分高出4.9%。此外,Anthropic在電腦操作和財務分析任務的基準測試中也記錄到性能改進。
新模型包含的優化功能使其能夠檢測錯誤的提示響應。據Anthropic介紹,與前代相比,該模型在輸出錯誤代碼時不指出問題的可能性降低了四倍,同時也更不容易做出無根據的聲明和遺漏濫用企圖。
動態工作流功能上線
Opus 4.8為Claude Code提供支持,推出了名為"動態工作流"的新功能。該功能使編程助手能夠執行複雜任務,例如用新語言重寫整個應用程式。據Anthropic介紹,Opus 4.8通過生成數百個智能體來完成此類項目,每個智能體負責完成一小部分工作。
升級後的"快速模式"設置允許Claude Code用戶犧牲部分輸出質量以換取更低延遲。該模式使工具速度提升150%,成本比前一版本降低三倍。Claude聊天機器人和用於自動化多步驟業務任務的工具Claude Cowork也將獲得類似功能,使用戶可以在不同響應速度之間切換。
Mythos級模型即將推出
Anthropic計劃在Opus 4.8之後推出"Mythos級模型",這些模型將在未來幾周內廣泛提供。Claude Mythos Preview是上個月首次亮相的高級大語言模型,該模型擅長發現網路安全漏洞等任務。
出於對黑客濫用的擔憂,公司目前僅向有限數量的組織提供Claude Mythos Preview。據該公司透露,其工程師正在開發新的防護措施來應對黑客風險。Anthropic預計這些防護措施將使其能夠安全地向所有客戶發布Mythos級模型。
投資者對Mythos級模型收入潛力的樂觀態度可能是Anthropic估值上漲的因素之一。以9650億美元估值計算,該公司目前的價值已超過OpenAI。Anthropic的收入已經快速增長:公司今日披露,其運營收入在過去三個月內增長了兩倍多,達到470億美元。
融資詳情與資金用途
Anthropic的H輪融資由Altimeter Capital、Dragoneer、Greenoaks和紅杉資本領投。公司列出的聯合領投方包括Capital Group、Coatue、D1 Capital Partners、GIC、ICONIQ和XN。此外還有十多家其他投資方參與,包括美光科技、SK海力士和三星電子。
這筆650億美元的融資包括約150億美元此前宣布的雲服務商承諾投資。亞馬遜雲科技投資50億美元。上個月,AWS同意為Anthropic提供最多5吉瓦的新計算能力。
這家大語言模型開發商將使用融資所得購買更多基礎設施,同時還計劃投資於AI安全舉措和合作夥伴關係。
Q&A
Q1:Claude Opus 4.8相比前代版本有哪些性能提升?
A:Claude Opus 4.8在Terminal-Bench 2.1基準測試中得分74.2%,比4.7版本提升8.4%。在SWE-Bench Pro編程測試中得分高出4.9%。新模型輸出錯誤代碼時不指出問題的可能性降低了四倍,更不容易做出無根據的聲明。
Q2:Claude Code的動態工作流功能是什麼?
A:動態工作流是Claude Code推出的新功能,使編程助手能夠執行複雜任務,例如用新語言重寫整個應用程式。Opus 4.8通過生成數百個智能體來完成此類項目,每個智能體負責完成一小部分工作。
Q3:Anthropic這輪融資規模有多大?估值是多少?
A:Anthropic完成了650億美元的H輪融資,公司估值達到9650億美元,目前價值已超過OpenAI。融資由Altimeter Capital、Dragoneer、Greenoaks和紅杉資本領投,包括約150億美元此前宣布的雲服務商承諾投資。






