Anthropic發布Claude Fable 5：與Mythos同源但內置安全防護機制

Anthropic近日宣布推出其旗艦大語言模型Mythos的"降權版本"——Claude Fable 5。該公司將其定位為"適合大眾使用的Mythos級別模型"，通過內置安全防護機制，使這一強大的底層模型得以面向更廣泛的用戶群體開放。

贊助商廣告

Mythos的背景

Mythos模型於今年4月正式亮相，憑藉其在代碼漏洞挖掘方面的卓越能力引發業界廣泛關注——它能夠識別出經驗豐富的開發者和其他AI模型都無法發現的安全漏洞。由於能力過於強大，Mythos被認為存在較高的濫用風險，因此僅向參與"玻璃翼計劃"（Project Glasswing）的合作夥伴開放，包括亞馬遜雲服務、蘋果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金會、微軟、英偉達 Anthropic發布ClaudeFable5與Mythos同源但內置安全防護機制以及Palo Alto Networks等機構。

從預覽版到正式版

此前，Mythos一直以預覽產品形式提供。此次Anthropic正式推出Claude Mythos 5，所有擁有Mythos預覽版訪問權限的用戶均可使用。Anthropic表示將通過更系統化的可信訪問計劃逐步擴大用戶範圍，但目前尚未披露Mythos預覽版與Mythos 5之間的具體差異，後者看起來更像是預覽版的正式發布版本。

Fable 5的安全機制

Fable 5與Mythos共用相同的底層模型，但額外增加了安全防護層，專門隱藏網路安全和生物領域中特定高風險類別的響應內容。值得關注的是，生物領域的限制措辭引發了外界猜測——這意味著Anthropic在實際使用日誌中可能已觀察到與生物武器相關的提示或響應內容。

當Fable 5檢測到提示內容觸及上述高風險領域時，模型會自動降級至Opus 4.8進行處理。自Opus 4.7版本起，Anthropic已封鎖"幾乎專用於惡意目的且幾乎沒有合法防禦用途的活動，例如大規模數據竊取或勒索軟體代碼開發"。持有Anthropic安全許可的專業人員，可通過網路安全核驗計劃使用Opus 4.7和4.8執行受限操作。目前尚不明確該計劃認證用戶是否同樣可以在Fable 5上執行受限查詢。

Anthropic對Fable 5的安全性表現頗具信心，並公布了相關數據：超過95%的Fable會話完全在Fable自身響應範圍內運行，無需觸發降級機制；在超過1000小時的內部漏洞懸賞測試和外部紅隊測試中，均未發現可繞過所有限制的通用越獄方法。

贊助商廣告

用戶反饋與實際體驗

儘管官方尚未披露Fable 5的詳細技術資訊，但已有多位早期用戶給出了積極評價。

低代碼平台Base44的代表表示："Fable在一次性生成完整應用方面表現出色，工具調用能力也非常優秀。"

AI工作空間平台Genspark的代表稱："Fable在我們的評測中排名第一，在所有測試模型的正面對比中全面勝出，尤其在最難的任務——UI設計和遊戲編程方面表現顯著更強。"

電商平台樂天的代表則表示："在最高處理強度下，Fable會對自身輸出進行反思與驗證，這正是實現高度自主運營的關鍵所在——額外的思考過程物有所值。"

定價與訪問計劃

Fable 5與Mythos 5的定價為：輸入Token每百萬10美元，輸出Token每百萬50美元，約為Claude Opus 4.8價格的兩倍。

Anthropic針對Fable 5制定了特殊的分階段推出計劃：即日起至6月22日，Pro、Max、Team及按席位計費的企業版用戶均可免費使用Fable 5；6月23日起，上述計劃將移除Fable 5，後續使用需消耗用量積分；Anthropic表示將儘快將Fable 5重新納入標準訂閱計劃。

在命名寓意方面，Anthropic未作官方解釋。參照詞典釋義，"Mythos"指解釋世界起源與文化價值觀的神聖敘事體系，而"Fable"則指旨在傳達道德教訓的短篇虛構故事——這一命名邏輯頗耐人尋味。

Q&A

Q1：Claude Fable 5和Mythos有什麼區別？

A：Claude Fable 5與Mythos共用相同的底層大語言模型，主要區別在於Fable 5額外增加了安全防護層，會隱藏網路安全和生物等高風險領域的相關響應。當用戶提問觸及這些領域時，模型會自動降級至Opus 4.8處理。簡單來說，Mythos是面向受信任合作夥伴的完整版，Fable 5是面向大眾用戶的安全增強版。

Q2：Claude Fable 5的價格是多少？普通用戶能用嗎？

A：Fable 5定價為輸入Token每百萬10美元、輸出Token每百萬50美元，約為Opus 4.8的兩倍。現階段（至6月22日），Pro、Max、Team及企業版用戶可免費使用；6月23日起需消耗用量積分；Anthropic後續計劃將其重新納入標準訂閱計劃。

贊助商廣告

Q3：Claude Fable 5能防止被惡意利用嗎？

A：Anthropic公布的數據顯示，超過95%的Fable會話無需觸發安全降級機制，且在超過1000小時的內外部紅隊測試中均未發現通用越獄方法。此外，涉及網路安全和生物等高風險領域的請求會自動降級至Opus 4.8處理，內置多層防護機制，整體安全性較為可靠。