宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

Anthropic發布Claude Fable 5:與Mythos同源但內置安全防護機制

2026年06月10日 首頁 » 熱門科技

Anthropic近日宣布推出其旗艦大語言模型Mythos的"降權版本"——Claude Fable 5。該公司將其定位為"適合大眾使用的Mythos級別模型",通過內置安全防護機制,使這一強大的底層模型得以面向更廣泛的用戶群體開放。

Mythos的背景

Mythos模型於今年4月正式亮相,憑藉其在代碼漏洞挖掘方面的卓越能力引發業界廣泛關注——它能夠識別出經驗豐富的開發者和其他AI模型都無法發現的安全漏洞。由於能力過於強大,Mythos被認為存在較高的濫用風險,因此僅向參與"玻璃翼計劃"(Project Glasswing)的合作夥伴開放,包括亞馬遜雲服務、蘋果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金會、微軟、英偉達Anthropic發布ClaudeFable5與Mythos同源但內置安全防護機制以及Palo Alto Networks等機構。

從預覽版到正式版

此前,Mythos一直以預覽產品形式提供。此次Anthropic正式推出Claude Mythos 5,所有擁有Mythos預覽版訪問權限的用戶均可使用。Anthropic表示將通過更系統化的可信訪問計劃逐步擴大用戶範圍,但目前尚未披露Mythos預覽版與Mythos 5之間的具體差異,後者看起來更像是預覽版的正式發布版本。

Fable 5的安全機制

Fable 5與Mythos共用相同的底層模型,但額外增加了安全防護層,專門隱藏網路安全和生物領域中特定高風險類別的響應內容。值得關注的是,生物領域的限制措辭引發了外界猜測——這意味著Anthropic在實際使用日誌中可能已觀察到與生物武器相關的提示或響應內容。

當Fable 5檢測到提示內容觸及上述高風險領域時,模型會自動降級至Opus 4.8進行處理。自Opus 4.7版本起,Anthropic已封鎖"幾乎專用於惡意目的且幾乎沒有合法防禦用途的活動,例如大規模數據竊取或勒索軟體代碼開發"。持有Anthropic安全許可的專業人員,可通過網路安全核驗計劃使用Opus 4.7和4.8執行受限操作。目前尚不明確該計劃認證用戶是否同樣可以在Fable 5上執行受限查詢。

Anthropic對Fable 5的安全性表現頗具信心,並公布了相關數據:超過95%的Fable會話完全在Fable自身響應範圍內運行,無需觸發降級機制;在超過1000小時的內部漏洞懸賞測試和外部紅隊測試中,均未發現可繞過所有限制的通用越獄方法。

用戶反饋與實際體驗

儘管官方尚未披露Fable 5的詳細技術資訊,但已有多位早期用戶給出了積極評價。

低代碼平台Base44的代表表示:"Fable在一次性生成完整應用方面表現出色,工具調用能力也非常優秀。"

AI工作空間平台Genspark的代表稱:"Fable在我們的評測中排名第一,在所有測試模型的正面對比中全面勝出,尤其在最難的任務——UI設計和遊戲編程方面表現顯著更強。"

電商平台樂天的代表則表示:"在最高處理強度下,Fable會對自身輸出進行反思與驗證,這正是實現高度自主運營的關鍵所在——額外的思考過程物有所值。"

定價與訪問計劃

Fable 5與Mythos 5的定價為:輸入Token每百萬10美元,輸出Token每百萬50美元,約為Claude Opus 4.8價格的兩倍。

Anthropic針對Fable 5制定了特殊的分階段推出計劃:即日起至6月22日,Pro、Max、Team及按席位計費的企業版用戶均可免費使用Fable 5;6月23日起,上述計劃將移除Fable 5,後續使用需消耗用量積分;Anthropic表示將儘快將Fable 5重新納入標準訂閱計劃。

在命名寓意方面,Anthropic未作官方解釋。參照詞典釋義,"Mythos"指解釋世界起源與文化價值觀的神聖敘事體系,而"Fable"則指旨在傳達道德教訓的短篇虛構故事——這一命名邏輯頗耐人尋味。

Q&A

Q1:Claude Fable 5和Mythos有什麼區別?

A:Claude Fable 5與Mythos共用相同的底層大語言模型,主要區別在於Fable 5額外增加了安全防護層,會隱藏網路安全和生物等高風險領域的相關響應。當用戶提問觸及這些領域時,模型會自動降級至Opus 4.8處理。簡單來說,Mythos是面向受信任合作夥伴的完整版,Fable 5是面向大眾用戶的安全增強版。

Q2:Claude Fable 5的價格是多少?普通用戶能用嗎?

A:Fable 5定價為輸入Token每百萬10美元、輸出Token每百萬50美元,約為Opus 4.8的兩倍。現階段(至6月22日),Pro、Max、Team及企業版用戶可免費使用;6月23日起需消耗用量積分;Anthropic後續計劃將其重新納入標準訂閱計劃。

Q3:Claude Fable 5能防止被惡意利用嗎?

A:Anthropic公布的數據顯示,超過95%的Fable會話無需觸發安全降級機制,且在超過1000小時的內外部紅隊測試中均未發現通用越獄方法。此外,涉及網路安全和生物等高風險領域的請求會自動降級至Opus 4.8處理,內置多層防護機制,整體安全性較為可靠。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2026 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新