宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

AI教母50美元成功訓練AI模型挑戰DeepSeek蒸餾他人模型根本不花錢

2025年02月09日 首頁 » 熱門科技

AI教母50美元成功訓練AI模型挑戰DeepSeek蒸餾他人模型根本不花錢


人工智慧領域再次迎來震撼消息,李飛飛教授的團隊僅用不到50美元(約港幣HK$390)成功訓練出一個名為「s1」的推理模型。這個模型在數學和編程能力測試中的表現,與OpenAI的o1和DeepSeek的R1等先進推理模型相當。這一成就讓美國科技界驚嘆,也顯示出人工智慧技術的競爭越來越激烈。

李飛飛團隊的s1模型,採用了來自Google的推理模型Gemini 2.0 Flash Thinking Experimental的知識,並利用「蒸餾技術」改善其AI模型。蒸餾技術是一種模型壓縮方法,研究人員從一個大型、複雜的模型(稱為「教師模型」)中提取知識,再指導一個較小、較簡單的模型(即「學生模型」)進行學習。這樣,學生模型可以保持較高性能,同時顯著降低計算資源消耗。

先前DeepSeek團隊曾公布其將OpenAI的訓練成本壓縮至原本的三十分之一,讓許多人認為人工智慧領域的競爭越發激烈。然後李飛飛教授的團隊在短短一個月內,便用不到50美元的成本訓練出了媲美DeepSeek R1的AI推理模型,這無疑再次刷新了成本與性能之間的平衡。

李飛飛團隊的成功表明,蒸餾技術的應用能改善與壓縮大型AI模型,還能在資源有限的環境下,保持卓越的性能。這為未來在資源受限的環境中部署和運行大型AI模型提供了有效的解決方案。

李飛飛,這位被譽為「AI教母」的華裔科學家,在人工智慧領域的貢獻不容忽視。她創建了全球最大的圖像識別資料庫——ImageNet,該資料庫包含21,800個類別和超過1,400萬張圖像,對電腦視覺領域的發展起到了重要作用。目前,李飛飛是斯坦福大學的終身教授,也曾擔任Google Cloud的首席科學家。

數據源:TechCrunch

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新