Anthropic近日宣布推出其旗艦大語言模型Mythos的"降權版本"——Claude Fable 5。該公司將其定位為"適合大眾使用的Mythos級別模型",通過內置安全防護機制,使這一強大的底層模型得以面向更廣泛的用戶群體開放。
Mythos的背景
Mythos模型於今年4月正式亮相,憑藉其在代碼漏洞挖掘方面的卓越能力引發業界廣泛關注——它能夠識別出經驗豐富的開發者和其他AI模型都無法發現的安全漏洞。由於能力過於強大,Mythos被認為存在較高的濫用風險,因此僅向參與"玻璃翼計劃"(Project Glasswing)的合作夥伴開放,包括亞馬遜雲服務、蘋果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金會、微軟、英偉達
以及Palo Alto Networks等機構。
從預覽版到正式版
此前,Mythos一直以預覽產品形式提供。此次Anthropic正式推出Claude Mythos 5,所有擁有Mythos預覽版訪問權限的用戶均可使用。Anthropic表示將通過更系統化的可信訪問計劃逐步擴大用戶範圍,但目前尚未披露Mythos預覽版與Mythos 5之間的具體差異,後者看起來更像是預覽版的正式發布版本。
Fable 5的安全機制
Fable 5與Mythos共用相同的底層模型,但額外增加了安全防護層,專門隱藏網路安全和生物領域中特定高風險類別的響應內容。值得關注的是,生物領域的限制措辭引發了外界猜測——這意味著Anthropic在實際使用日誌中可能已觀察到與生物武器相關的提示或響應內容。
當Fable 5檢測到提示內容觸及上述高風險領域時,模型會自動降級至Opus 4.8進行處理。自Opus 4.7版本起,Anthropic已封鎖"幾乎專用於惡意目的且幾乎沒有合法防禦用途的活動,例如大規模數據竊取或勒索軟體代碼開發"。持有Anthropic安全許可的專業人員,可通過網路安全核驗計劃使用Opus 4.7和4.8執行受限操作。目前尚不明確該計劃認證用戶是否同樣可以在Fable 5上執行受限查詢。
Anthropic對Fable 5的安全性表現頗具信心,並公布了相關數據:超過95%的Fable會話完全在Fable自身響應範圍內運行,無需觸發降級機制;在超過1000小時的內部漏洞懸賞測試和外部紅隊測試中,均未發現可繞過所有限制的通用越獄方法。
用戶反饋與實際體驗
儘管官方尚未披露Fable 5的詳細技術資訊,但已有多位早期用戶給出了積極評價。
低代碼平台Base44的代表表示:"Fable在一次性生成完整應用方面表現出色,工具調用能力也非常優秀。"
AI工作空間平台Genspark的代表稱:"Fable在我們的評測中排名第一,在所有測試模型的正面對比中全面勝出,尤其在最難的任務——UI設計和遊戲編程方面表現顯著更強。"
電商平台樂天的代表則表示:"在最高處理強度下,Fable會對自身輸出進行反思與驗證,這正是實現高度自主運營的關鍵所在——額外的思考過程物有所值。"
定價與訪問計劃
Fable 5與Mythos 5的定價為:輸入Token每百萬10美元,輸出Token每百萬50美元,約為Claude Opus 4.8價格的兩倍。
Anthropic針對Fable 5制定了特殊的分階段推出計劃:即日起至6月22日,Pro、Max、Team及按席位計費的企業版用戶均可免費使用Fable 5;6月23日起,上述計劃將移除Fable 5,後續使用需消耗用量積分;Anthropic表示將儘快將Fable 5重新納入標準訂閱計劃。
在命名寓意方面,Anthropic未作官方解釋。參照詞典釋義,"Mythos"指解釋世界起源與文化價值觀的神聖敘事體系,而"Fable"則指旨在傳達道德教訓的短篇虛構故事——這一命名邏輯頗耐人尋味。
Q&A
Q1:Claude Fable 5和Mythos有什麼區別?
A:Claude Fable 5與Mythos共用相同的底層大語言模型,主要區別在於Fable 5額外增加了安全防護層,會隱藏網路安全和生物等高風險領域的相關響應。當用戶提問觸及這些領域時,模型會自動降級至Opus 4.8處理。簡單來說,Mythos是面向受信任合作夥伴的完整版,Fable 5是面向大眾用戶的安全增強版。
Q2:Claude Fable 5的價格是多少?普通用戶能用嗎?
A:Fable 5定價為輸入Token每百萬10美元、輸出Token每百萬50美元,約為Opus 4.8的兩倍。現階段(至6月22日),Pro、Max、Team及企業版用戶可免費使用;6月23日起需消耗用量積分;Anthropic後續計劃將其重新納入標準訂閱計劃。
Q3:Claude Fable 5能防止被惡意利用嗎?
A:Anthropic公布的數據顯示,超過95%的Fable會話無需觸發安全降級機制,且在超過1000小時的內外部紅隊測試中均未發現通用越獄方法。此外,涉及網路安全和生物等高風險領域的請求會自動降級至Opus 4.8處理,內置多層防護機制,整體安全性較為可靠。






