Hugging Face逆向工程DeepSeek-R1，將打造開放推理模型Open-R1

中國人工智慧公司所開發的DeepSeek-R1模型發布以來，相對低廉的硬體與訓練成本就能展現高水準推理能力，在市場引發極大震盪。Hugging Face現正根據DeepSeek所公布的研究內容進行逆向工程，試圖推出名為Open-R1的開放版本，期望在透明、可驗證的環境下讓研究社交媒體能更深入了解該突破性技術。

贊助商廣告

由於DeepSeek-R1以遠低於市場預期的成本達到與先進模型相近的推理表現，業界與學界都希望能了解技術全貌，但DeepSeek未公開完整的訓練數據集與程序代碼，使得外界對其稱為開源模型的真實性存有疑慮。Hugging Face工程師認為，如果只發布模型權重與部分技術報告，仍不足以滿足真正的開放標準，因而決定通過逆向工程與大規模協作，構建完整可供研究者自行驗證與調整語言模型，成為推理模型的開放訓練工作管線與數據集。

深度學習社交媒體之所以對此舉格外關注，主要是因為DeepSeek-R1在數學、程序開發與科學領域的推理能力，甚至能與知名的OpenAI o1模型一較高下，而開發成本卻聲稱僅有美國人工智慧公司花費的一小部分。一旦Hugging Face成功重現Open-R1，研究人員將可確切掌握其中關鍵架構、訓練步驟，以及在有限硬體資源下達到高效訓練的方法。

目前Hugging Face團隊的做法，是先分析DeepSeek發布的技術報告與模型論文，並嘗試從現有權重中推斷其訓練配方與數據分布。由於DeepSeek並未開放完整的數據集與程序代碼，Hugging Face需要召集志願者，共同整理出可供公開使用的高品質推理數據，藉此復刻或接近DeepSeek-R1所使用的多階段訓練策略。

當Open-R1順利出爐，將不只是一個DeepSeek-R1複製品，更可能在技術透明度與研究價值上進一步超越原始模型。Open-R1可供任何人檢閱並改良強化學習流程、語言模型結構以及推理邏輯。這對需要確保模型輸出精度與可控性的企業而言相當重要，也進一步突顯了開源社交媒體在推動人工智慧技術發展史所扮演的關鍵角色。

贊助商廣告

Open-R1模型的訓練將使用Hugging Face的Science Cluster計算資源，該集群有96個節點，每個節點有8張顯示卡，共768顆Nvidia H100可用於密集訓練，Hugging Face預計在數周內推出第一個可公開測試的原型版本。