宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

最強Claude意外泄露!完勝Opus 4.6,代號「卡皮巴拉」,奧特曼又要睡不著了

2026年03月28日 首頁 » 熱門科技

就在剛剛,Anthropic 泄露了一個從未公開過的新模型。

沒有小道消息鋪墊,沒有「知情人士透露」的前戲,Anthropic 自己的 CMS 資料庫忘了關權限,近 3000 份內部文件直接躺在公網上,被《Fortune》記者翻了個底朝天。

劍橋大學網路安全研究員 Alexandre Pauwels 受邀驗證了這批材料的真實性和規模。Anthropic 發言人隨後向《Fortune》確認:模型確實存在。

最強Claude意外泄露!完勝Opus 4.6,代號「卡皮巴拉」,奧特曼又要睡不著了
🔗 https://m1astra-mythos.pages.dev/

這個模型叫 Claude Mythos,內部代號 Capybara(卡皮巴拉)。

它跳過了 Opus 升級版的劇本,跳過了 Sonnet 換皮的套路,直接開闢了一個凌駕於 Opus 之上的全新第四層級。Anthropic 自己在草稿里的原話:「Mythos 是一個全新層級模型的名字,比我們的 Opus 模型更大、更智能。在此之前,Opus 一直是我們最強大的模型。」

如果你覺得 Claude Opus 4.6 已經夠猛了,那 Mythos 就是 Anthropic 在說:那只是熱身。

Opus 之上,到底強了多少

Anthropic 現有產品線是三層結構:Haiku 最輕最快,適合輕量任務;Sonnet 居中,性價比之選;Opus 最大最強,重型推理擔當。這個框架從 Claude 3 時代延續至今,行業里幾乎所有人都默認 Opus 就是 Anthropic 的天花板。

Mythos 把這個天花板掀了。

泄露的草稿博文顯示,與當前最強的 Claude Opus 4.6 相比,Mythos 在多個核心領域取得了「顯著更高的分數」。至少覆蓋了三大方向:

軟體編程。 這是當前 AI 模型競爭最白熱化的戰場。Claude Opus 4.6 本身已經是公認的編程最強模型之一,而 Mythos 在編程基準上進一步拉開了差距。對於每天用 Claude 寫代碼的開發者來說,這意味著一個量級的躍升,不是小數點後面的微調。

學術推理。 數學、科學、邏輯推理,這些考驗模型「深度思考」能力的硬骨頭,Mythos 同樣顯著領先。草稿中特意把「學術推理」作為獨立測試維度單獨拎出來講,說明 Anthropic 對這個方向的突破底氣很足。

網路安全。 這是最炸裂的部分。

最強Claude意外泄露!完勝Opus 4.6,代號「卡皮巴拉」,奧特曼又要睡不著了

草稿博文中有一段話,措辭之重,在 Anthropic 歷來的官方敘事中極為罕見:

儘管 Mythos 目前在網路安全能力上遠超任何其他 AI 模型,但它預示著即將到來的一波浪潮,屆時模型將能以遠超防禦者努力的速度來利用漏洞。

注意用詞:不是「領先」,不是「優於」,是「遠超」。而且這是泄露出來的內部評估,不是市場部寫的宣傳稿,用詞分量完全不同。

Anthropic 發言人在確認 Mythos 存在時,用了兩個定性:「質的飛躍」 和 「迄今為止最強大的模型」。

過去兩年,AI 模型的競爭一直在同一個量級上貼身肉搏。GPT 系列、Gemini、Claude、Llama,各項基準你追我趕,差距用個位數百分比來量。而 Mythos 暗示的已經不是追趕了,是變道超車。

這大概就是為什麼,每次 Anthropic 有大動作,社交媒體上總有人第一時間 @Sam Altman:睡了嗎?

太強了怎麼辦?Anthropic 的答案是:先把解藥發出去

一家以「安全第一」立身的 AI 公司,在自己內部文檔里承認造出了一個可能讓攻擊者碾壓防禦者的東西。這種坦率在行業里幾乎沒有先例。

於是 Anthropic 做了一個罕見的決定:Mythos 的第一批用戶,不是開發者,不是企業客戶,而是網路安全防禦機構。

邏輯很簡單:如果這個模型的攻擊能力確實如內部評估所言,那在放給所有人之前,得先讓守門的人拿到同樣的武器。毒藥還沒散出去,解藥先到位。

這在 AI 行業的發布史上幾乎沒有先例。OpenAI 發 GPT-4 的時候做過紅隊測試,Google 發 Gemini 做過安全審查,但沒有哪家公司把「安全防禦者優先使用」寫進正式的發布路線圖裡。

Anthropic 這麼做,要麼是真的被自己造出來的東西嚇到了,要麼是在用一種極其高明的方式給 Mythos 的能力背書。又或者兩者兼有。

與此同時,Mythos 的運行成本是另一個現實問題。草稿坦承「服務成本非常昂貴」,需要大幅優化效率才會考慮面向大眾。翻譯一下:這隻卡皮巴拉目前是實驗室里的珍稀品種,想讓它走進千家萬戶的聊天窗口,Anthropic 還得先把飼養成本打下來。

但信號已經出去了。當競爭對手還在為 Opus 級別的模型絞盡腦汁時,Anthropic 已經在討論 Opus 之上的東西該怎麼安全地放出來了。

兩家公司,撞上同一隻卡皮巴拉

每個大模型都有內部代號。GPT-4 叫過 Arrakis,Google 用寶石命名。而 Anthropic 給有史以來最強模型取的代號,是一隻卡皮巴拉,就是那個在網際網路上以「呆萌臉 + 跟誰都能和平共處」聞名的 meme 之王。

怎麼實錘的?泄露的博客有兩個版本。V1 通篇用「Mythos」,V2 把每一個「Mythos」都替換成了「Capybara」,連文中每處引用都做了對應修改。說明這個模型在 Anthropic 內部相當長時間裡就叫「卡皮巴拉」,「Mythos」是後來包裝出來的發布名。

最強Claude意外泄露!完勝Opus 4.6,代號「卡皮巴拉」,奧特曼又要睡不著了

但 AI 圈最知名的卡皮巴拉 IP 早就有主了。阿里通義千問 Qwen 的吉祥物就是卡皮巴拉,社區里到處是卡皮巴拉頭像和周邊,品牌認知度拉滿。

所以當 Mythos 的代號被曝光,社交媒體直接炸了。而全場最佳來自千問前技術負責人林俊暘親自現身留言區,只留了一句:

「capybara? seriously?」

兩家爭奪 AI 王座的公司,不約而同看上了同一隻呆頭呆腦的大齧齒目。2026 年 AI 圈最有喜劇張力的一幕,大概就是這了。

 

最低級的配置錯誤扒了底褲

最後聊聊這次泄露本身,因為它的荒誕程度值得單獨說。

Anthropic 把原因歸結為「外部 CMS 工具中的人工配置錯誤」,同時特意強調跟 Claude、Cowork 或任何 AI 工具無關。後半句的急切耐人尋味:最近多家科技公司因 AI 生成代碼引發技術事故頻頻上新聞,而 Anthropic 恰恰是那個最高調宣傳用 Claude Code 自動化內部流程的公司。「不是 AI 乾的」,他們顯然覺得有必要把這句話說清楚。

技術本質很簡單。劍橋研究員指出,CMS 系統中上傳的所有資產默認公開,除非手動設為私密。Anthropic 忘了點那個開關。和 AWS S3 存儲桶忘關權限一個性質的低級失誤,有充分文檔記錄,完全可以預防。

一家正在造有史以來最強網路安全 AI 的公司,被最基礎的權限配置疏忽扒了個精光。你很難想出比這更諷刺的劇本。

同一批文件里還藏著一場閉門 CEO 峰會的細節:計劃在英國一處 18 世紀鄉間莊園酒店舉辦,Anthropic CEO Dario Amodei 將出席,對象是歐洲大型企業掌門人。一場精心策劃的高端商務社交,就這樣和產品草稿一起被晾在了陽光下。

最強Claude意外泄露!完勝Opus 4.6,代號「卡皮巴拉」,奧特曼又要睡不著了

Anthropic 發言人的回應是:「這些只是考慮發布的早期草稿,不涉及核心基礎設施、AI 系統、客戶數據或安全架構。」

技術上沒錯。但當你的「早期草稿」裏白紙黑字寫著這個模型可能引發「AI 驅動的漏洞利用浪潮」,這就已經不是一次普通的內容泄露了。

泄露本身的戲劇性是其次,關鍵在於它無意間撕開了一個行業一直在迴避的問題:當模型強大到連造它的人都需要先給自己買保險,我們到底該興奮還是該緊張?

過去兩年,AI 公司的發布節奏像軍備競賽,每家都在說自己更快更強更安全。但 Mythos 的泄露文檔里,罕見地出現了一種不同的語氣:「我們造出了一個自己都需要小心對待的東西」。

有人會說,這不過是 Anthropic 的另一種營銷,用「太強了所以要謹慎」來製造稀缺感。

也許吧。但如果你讀過那些草稿原文就會發現,那種措辭的分量不像是市場部能寫出來的。當一家公司在內部文檔里承認自己的產品「預示著一波 AI 驅動的漏洞利用浪潮」,這要麼是史上最大膽的營銷,要麼就是真話。

而這一切,只是因為有人忘了在 CMS 後台點一個「設為私密」的按鈕。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2026 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新