OpenAI 稱掌握 DeepSeek 違規證據，Anthropic CEO 發萬字長文喊話美國加強管制

最近的 DeepSeek 陷入了多事之秋。

據外媒金融時報報道，OpenAI 稱有證據表明，中國 AI 公司 DeepSeek 藉助 OpenAI 的模型來開發自己的開源 AI 產品，此舉可能違反了 OpenAI 的服務條款。

在 AI 行業，通過「蒸餾」技術來開發新模型較為常見。但 OpenAI 認為 DeepSeek 的行為已經超出了可接受的範圍，因為他們是在利用 OpenAI 的技術來打造一個競品。

截至發稿時，對於這些指控的具體細節，OpenAI 目前拒絕作出進一步說明。

OpenAI 稱掌握 DeepSeek 違規證據，Anthropic CEO 發萬字長文喊話美國加強管制

而在昨日，彭博社報道稱，OpenAI 及其合作夥伴微軟對去年使用 OpenAI API 的若干賬戶展開調查，並切斷了涉嫌進行模型蒸餾的賬戶訪問權限，理由同樣是這些行為違反了服務條款。

一波未平，一波又起。

據外媒 TechCrunch 報道，DeepSeek 近期向美國專利商標局（USPTO）提交了商標申請，希望註冊其 AI 聊天機器人、產品和工具的品牌。然而，它的申請晚了一步。

贊助商廣告

就在 36 小時前，一家名為 Delson Group Inc.的德拉瓦州公司率先提交了「DeepSeek」商標的申請。

Delson Group 聲稱自 2020 年起就一直在銷售「DeepSeek」品牌的 AI 產品。該公司在商標申請中登記的地址是庫比蒂諾的一處住宅，創始人兼 CEO 為 Willie Lu。

有趣的是，Lu 與 DeepSeek 的創始人梁文峰同為浙江大學校友。根據 Lu 的 LinkedIn 資料，他自稱是斯坦福大學的「半退休」諮詢教授，同時擔任美國聯邦通信委員會(FCC)顧問，職業生涯主要聚焦無線通信領域。

TechCrunch 調查發現，Lu 還以「DeepSeek」品牌在拉斯維加斯舉辦名為「AI 超級智能」（AI Super-Intelligence）的教育課程，門票起價 800 美元。該課程的網站也被列在 Delson Group 的商標申請文件中，並宣稱 Lu 在資訊通信技術（ICT）和人工智慧（AI）領域有約 30 年的經驗。

當 TechCrunch 通過商標申請文件中的電子郵件聯繫 Lu 時，他表示願意在加州帕洛阿爾托或薩拉托加見面討論。但在進一步的置評請求中，Lu 未作回應。

贊助商廣告

通過 USPTO 的商標審理和上訴委員會（TTAB）資料庫查詢可以發現，Delson Group 此前曾與多家知名企業發生過二十多起商標糾紛，包括 GSMA、騰訊和 TracFone Wireless。該公司曾主動放棄或取消部分商標申請，但也成功註冊了一些商標。

更廣泛的 USPTO 商標資料庫搜索顯示，Delson Group 已註冊了 28 個商標，其中包括一些知名中國企業的品牌。例如，該公司註冊了「吉利」（Geely）和「中國移動」（China Mobile）的商標，這些品牌分別屬於中國的汽車製造商和香港的電信巨頭。

這種模式表明，Delson Group 可能存在「商標囤積」（Trademark Squatting）行為，即搶先註冊商標，以便日後出售或利用品牌知名度牟利。

目前來看，DeepSeek 在美國的商標權益處於不利地位。根據美國法律，首個使用商標的公司通常被視為該商標的合法所有者，除非能證明對方是惡意註冊（bad faith registration）。

智慧財產權律師、Gerben IP 事務所創始人 Josh Gerben 在接受 TechCrunch 採訪時表示，Delson Group 在多方面占據優勢：

申請時間更早（比 DeepSeek 早 36 小時提交）；

聲稱自 2020 年起已開始使用該品牌（DeepSeek 的商標申請中稱其成立於 2023年）；

擁有可驗證的 AI 相關活動（包括培訓課程和網站）。

Gerben 指出，Delson Group 甚至可以提出「反向混淆（Reverse Confusion）」訴訟，主張 DeepSeek 的迅速崛起會導致公眾誤認為 DeepSeek 才是商標的真正所有者。此外，Delson Group 還可以起訴 DeepSeek，要求其停止在美國市場繼續使用「DeepSeek」品牌。

「DeepSeek 可能真的面臨嚴重的商標問題，」Gerben 表示，「Delson Group 作為潛在的「在先權利持有者」（prior rights holder），可能有很強的商標侵權訴訟理由。」

值得一提的是，DeepSeek 並不是唯一一家在商標問題上遇到麻煩的 AI 公司。比如 OpenAI 曾試圖註冊「GPT」商標，但在去年 2 月被 USPTO 駁回，理由是該詞過於通用。

包括我們之前也報道過，OpenAI 目前仍在與科技企業家 Guy Ravine 就「Open AI」商標進行法律糾紛，Ravine 聲稱自己早在 2015 年（OpenAI成立之年）就已提出這一商標概念，並希望打造一個「開源」AI 平台。

另外，今天凌晨，Anthropic CEO Dario Amodei 在 X 平台發布了一篇萬字長文，回應了近期圍繞在 DeepSeek 的諸多風波事件。

贊助商廣告

面對 Amodei 的疑似破防的行為，X 網友在留言區貼臉輸出：

Anthropic CEO：不認為 DeepSeek 本身是對手，美國要加強晶片出口管制

幾周前，我曾提出應加強美國對華晶片出口管制。如今，中國 AI 公司 DeepSeek 竟然在某些方面以更低成本接近了美國最前沿的 AI 模型。

在這篇文章中，我不會討論 DeepSeek 是否真的威脅到 Anthropic 等美國 AI 企業（儘管我認為，關於中國 AI 取代美國領導地位的某些說法被誇大了）¹。

相反，我想探討一個問題：DeepSeek 的技術突破是否削弱了對晶片出口管制的必要性？我的答案是否定的。事實上，我認為這反而更加凸顯了出口管制的重要性²。

出口管制的核心目標是確保國家在 AI 發展中保持領先。需要明確的是，管制政策並不是為了迴避中美 AI 競爭。

最終，如果美國及其他國家希望在 AI 領域占據主導地位，就必須擁有比中國更先進的模型。但與此同時，我們也不應該在可以避免的情況下，讓中國政府獲得技術優勢。

AI 發展的三大核心動態

在討論政策問題之前，我想先介紹 AI 系統的三個關鍵發展動態，這對理解 AI 產業至關重要：

1. 縮放規律（Scaling Laws）

AI 領域的一個核心規律是，隨著訓練規模的擴大，模型的表現會持續平穩提升。我和我的聯合創始人在 OpenAI 工作時，就曾率先記錄並驗證過這一現象。簡單來說，在其他條件相同的情況下，增加訓練計算量（compute）會讓 AI 在各種認知任務上的表現更好。例如：

價值 100 萬美元的 AI 可能能解決 20% 的關鍵編程任務

價值 1000 萬美元的 AI 可能能解決 40%

價值 1 億美元的 AI 可能能解決 60%

這些差異在實際應用中會帶來巨大影響——計算量增加 10 倍，可能意味著 AI 水平從大學生提升到博士生。因此，各家公司都在投入巨額資金訓練更強的模型。

2. 計算效率提升（Shifting the Curve）

AI 領域不斷湧現出各種大大小小的創新，使得 AI 訓練和推理更加高效。這些創新可能涉及模型架構改進（例如對 Transformer 結構的優化）、更高效的計算方式（提升硬體利用率）以及新一代 AI 計算晶片。

這些優化會整體提升 AI 的訓練效率，也就是「Shifting the Curve」：

如果某項技術帶來 2 倍的計算提升（Compute Multiplier，CM），那麼原本需要 1000 萬美元訓練出的 40% 代碼解決能力，現在只需要 500 萬美元；原本 1 億美元的 60% 代碼解決能力，現在只需要 5000 萬美元。

各大 AI 公司不斷發現這樣的 CM 提升：

小幅優化。問題在於，中國是否也能獲得數百萬顆晶片⁹。

如果中國能夠獲得數百萬顆晶片，我們將進入一個雙極世界（bipolar world），即美國和中國都擁有強大的 AI 模型，推動科學技術以前所未有的速度發展——我稱之為「數據中心裡的天才國家」（countries of geniuses in a datacenter）。

贊助商廣告

但雙極世界未必會長期保持平衡。即使中美 AI 技術暫時相當，中國可能會投入更多的人才、資金和精力來將 AI 技術應用於軍事領域。再加上中國龐大的工業基礎和軍事戰略優勢，這可能使中國不僅在 AI 領域取得主導地位，甚至在全球各個領域占據領先。

如果中國無法獲得數百萬顆晶片，我們至少暫時會進入一個單極世界（unipolar world），即只有美國及其盟友掌握最先進的 AI 模型。這個單極局面是否會持續並不確定，但至少有可能出現這樣一種情況：由於 AI 系統可以幫助構建更強的 AI，短暫的領先可能會被轉化為長期優勢¹⁰。在這種情況下，美國及其盟友可能會在全球舞台上取得決定性並長期的主導地位。

因此，嚴格執行的出口管制¹¹是阻止中國獲取數百萬顆晶片的唯一有效手段，也是決定世界最終是單極還是雙極格局的最重要因素。

DeepSeek 的成功並不意味著出口管制失效。正如我之前所說，DeepSeek 實際上擁有相當可觀的晶片資源，因此他們能夠開發並訓練出強大的模型並不令人意外。他們在資源上並沒有比美國 AI 公司受到更大的限制，出口管制也並不是促使他們「創新」的主要原因。他們只是非常優秀的工程師，而這正說明了中國在 AI 領域是美國的嚴峻競爭對手。

DeepSeek 的成功也並不意味著中國可以一直通過走私獲得所需的晶片，或者出口管制存在無法堵住的漏洞。我認為，出口管制從來就不是為了阻止中國獲得幾萬顆晶片。10 億美元的經濟活動可以隱藏，但 100 億美元甚至 10 億美元的活動就難以掩蓋了，而要偷偷運送上百萬顆晶片在物理上也可能極為困難。

我們還可以看看目前 DeepSeek 被報道所擁有的晶片類型。據 SemiAnalysis 分析，DeepSeek 現有的 50000 片 AI 晶片是 H100、H800 和 H20 的混合。

H100 自推出以來就受到出口管制的限制，因此如果 DeepSeek 擁有 H100，那它們必然是通過走私獲得的。（不過，值得注意的是，英偉達曾表示 DeepSeek 的 AI 進展「完全符合出口管制規定」）。

H800 在 2022 年最初的出口管制政策下仍可出口，但在 2023 年 10 月政策更新後被禁止，因此這些晶片可能是在禁令生效前運送的。

H20 在訓練方面效率較低，但在推理（採樣）方面更高效，目前仍允許出口，但我認為它也應該被禁止。

綜上所述，DeepSeek 擁有的 AI 晶片主要包括目前尚未被禁（但應該被禁）的晶片、在被禁之前獲得的晶片、可能通過走私獲取的少量晶片。

這實際上表明了出口管制正在發揮作用，並且在不斷調整優化：如果出口管制完全無效，DeepSeek 現在很可能會擁有一整批頂級的 H100 晶片。然而，事實並非如此，這說明政策正在逐步堵住漏洞。如果我們能夠足夠快地加強管控，就可能阻止中國獲得數百萬顆晶片，從而提高美國維持 AI 領先地位、形成單極世界的可能性。

關於出口管制和美國國家安全，我想明確一點：

我並不認為 DeepSeek 本身是對手，我也不是專門針對這家公司。從他們接受採訪時的表現來看，DeepSeek 的研究人員看起來像是聰明、充滿好奇心的工程師，他們只是想開發出有用的技術。

出口管制是我們最強有力的手段之一，能夠阻止這種情況發生。有人認為，AI 技術變得越來越強、性價比越來越高，是一個應該放鬆出口管制的理由——但這完全沒有道理。

腳註

1 關於模型蒸餾：在這篇文章中，我不對有關 DeepSeek 是否對西方模型進行蒸餾的報道發表任何看法。我僅基於 DeepSeek 論文中提供的資訊，假設他們確實按照自己所述的方式訓練了模型。

2 DeepSeek 的發布並不影響英偉達：事實上，我認為 DeepSeek 模型的發布顯然不會對英偉達造成負面影響，而英偉達股價因此下跌約 17% 讓我感到困惑。從邏輯上講，DeepSeek 的發布對英偉達的影響甚至比對其他 AI 公司的影響還要小。但無論如何，我這篇文章的主要目的是為出口管制政策辯護。

3 關於 R1 訓練方式的細節：更精確地說，R1 是一個預訓練模型，並且僅進行了少量的強化學習（RL）訓練，這種做法在推理範式變革前的模型中很常見。

4 DeepSeek 在某些特定任務上表現較強：但這些任務範圍非常有限。

5 關於 DeepSeek 論文中提到的「600 萬美元訓練成本」：這個數據是 DeepSeek 論文中引用的，我在這裡暫且接受，並不對其真實性提出質疑。不過，我質疑的是將此與美國 AI 公司的訓練成本直接對比的合理性。600 萬美元僅指訓練某個具體模型的成本，但 AI 研發的整體成本要遠遠高於這個數字。此外，我們也無法完全確定 600 萬美元的真實性——雖然模型規模可以驗證，但訓練時使用的 token 數量等因素卻難以核實。

6 關於 DeepSeek 現有晶片的更正：在一些採訪中，我曾說 DeepSeek 擁有「50,000 片 H100」，但這實際上是對相關報道的不準確概括，在此更正。H100 是目前最知名的 Hopper 架構晶片，所以我當時假設報道所指的就是 H100。但實際上，Hopper 系列還包括 H800 和 H20，DeepSeek 擁有的是這三種晶片的混合，總數為 50000 片。雖然這個事實並不會改變整體情況，但仍值得澄清。我在討論出口管制時會更詳細地分析 H800 和 H20 的問題。

10 出口管制的目標：這裡需要明確一點，目標並不是剝奪中國從 AI 科技進步中獲益的機會——AI 在科學、醫療、生活質量等領域的突破，理應造福所有人。真正的目標是防止這些國家在軍事領域取得主導地位。

附上報道相關鏈接：