AI教母50美元成功訓練AI模型挑戰DeepSeek蒸餾他人模型根本不花錢

人工智慧領域再次迎來震撼消息，李飛飛教授的團隊僅用不到50美元（約港幣HK$390）成功訓練出一個名為「s1」的推理模型。這個模型在數學和編程能力測試中的表現，與OpenAI的o1和DeepSeek的R1等先進推理模型相當。這一成就讓美國科技界驚嘆，也顯示出人工智慧技術的競爭越來越激烈。

贊助商廣告

李飛飛團隊的s1模型，採用了來自Google的推理模型Gemini 2.0 Flash Thinking Experimental的知識，並利用「蒸餾技術」改善其AI模型。蒸餾技術是一種模型壓縮方法，研究人員從一個大型、複雜的模型（稱為「教師模型」）中提取知識，再指導一個較小、較簡單的模型（即「學生模型」）進行學習。這樣，學生模型可以保持較高性能，同時顯著降低計算資源消耗。

先前DeepSeek團隊曾公布其將OpenAI的訓練成本壓縮至原本的三十分之一，讓許多人認為人工智慧領域的競爭越發激烈。然後李飛飛教授的團隊在短短一個月內，便用不到50美元的成本訓練出了媲美DeepSeek R1的AI推理模型，這無疑再次刷新了成本與性能之間的平衡。

李飛飛團隊的成功表明，蒸餾技術的應用能改善與壓縮大型AI模型，還能在資源有限的環境下，保持卓越的性能。這為未來在資源受限的環境中部署和運行大型AI模型提供了有效的解決方案。

李飛飛，這位被譽為「AI教母」的華裔科學家，在人工智慧領域的貢獻不容忽視。她創建了全球最大的圖像識別資料庫——ImageNet，該資料庫包含21,800個類別和超過1,400萬張圖像，對電腦視覺領域的發展起到了重要作用。目前，李飛飛是斯坦福大學的終身教授，也曾擔任Google Cloud的首席科學家。

數據源：TechCrunch