春節檔,除了賀歲片的熱鬧,還有DeepSeek的出圈。
這股來自東方的神秘力量「DeepSeek」究竟是何許人也,竟能震驚美國科技界。連OpenAI CEO Sam Altman都稱DeepSeek是一個「令人印象深刻」的模型。但他也表示,OpenAI依然相信自己將繼續走在技術前沿,推出更出色的產品,並且對迎接這個新競爭者表示歡迎。
讓我先花幾分鐘來介紹下DeepSeek,其成立於2023年7月17日,是幻方量化旗下的AI公司,專注於實現通用人工智慧(AGI)。2024年1月5日DeepSeek推出其首個大模型DeepSeek LLM,隨後2024年12月26日,DeepSeek發布全新系列模型DeepSeek-V3的首個版本,並同步開源。2025年1月27日,發布的DeepSeek-R1模型,以低訓練成本、高性能、開源等特點受到關注,短短幾天迅速攀升至Apple手機應用商店美國區免費應用榜首,單周下載量高達約240萬次。
DeepSeek-R1模型在多項國際評測中表現突出,追平了OpenAI o1模型,這都是源於技術與工程創新,也是全世界都在講的低成本的關鍵所在。
據介紹,DeepSeek-R1模型的訓練成本僅為560萬美元,訓練成本只有Llama 3的1%,遠低於OpenAI、谷歌和Meta等美國科技巨頭在AI領域數億至數十億美元的投入。憑藉更低的成本,DeepSeek-R1實現了與現有前沿模型相當的效果,這也引發了市場對此前投資回報的擔憂。
在2024 re:Invent上,亞馬遜CEO Andy Jassy分享了亞馬遜自身部署人工智慧中的三項關鍵洞察恰好呼應了DeepSeek的成功。首先,隨著生成式AI應用規模的擴大,計算成本變得至關重要。人們非常渴望獲得更高的性價比。其次,構建一個真正優秀的生成式AI應用實際上非常困難。第三,當我們讓開發者自由選擇他們想要使用的模型時,模型的多樣性顯而易見。這並不讓我們感到意外,因為我們一次又一次地學到同樣的教訓:永遠不會有單一的工具能夠統治世界。
亞馬遜CEO Andy Jassy
模型架構設計、訓練策略、基礎設施優化、商業模式都是DeepSeek的成功因素,各大廠商也紛紛跟進,宣布支持DeepSeek,亞馬遜雲科技就是其中一員。
亞馬遜雲科技的用戶現在可以在Amazon Bedrock和Amazon SageMaker AI中輕鬆部署DeepSeek-R1系列模型,目前提供4種部署方式:第一,在Amazon Bedrock Marketplace部署DeepSeek-R1模型;第二,通過Amazon SageMaker JumpStart部署DeepSeek-R1模型;第三,利用Amazon Bedrock的自定義模型導入功能部署DeepSeek-R1-Distill模型;第四,使用Amazon EC2 Trn1實例部署DeepSeek-R1-Distill模型。
Amazon Bedrock Marketplace為客戶提供100多個熱門、新興及專業模型,Amazon Bedrock適合希望通過API快速集成預訓練基礎模型的團隊,Amazon SageMaker AI則更適合需要深度定製、訓練、部署並能訪問底層基礎設施的企業。
通過Amazon Bedrock Marketplace部署DeepSeek-R1,可選實例包括EC2 P5e的48xlarge型號,單個實例包含8顆H200 GPU,以及3200Gbps的網路帶寬,充分滿足DeepSeek-R1的性能需求。
在Amazon SageMaker Jumpstart中快速部署DeepSeek模型。
在Amazon Bedrock模型定製頁面部署DeepSeek 8BLlama Model
亞馬遜雲科技不用過多介紹,全球第一個雲服務就出自於此。在大模型時代,亞馬遜雲科技仍然走在潮頭,為企業運用全球領先模型上提供三大獨特優勢:
雲端優勢:亞馬遜雲科技一直在雲端進行創新,提供了豐富且成熟的分析、數據等基礎服務進行無縫集成。推出基於自研晶片Amazon Trainium2的EC2 Trn2實例,性價比比當時GPU實例高30%-40%;第二代的UltraCluster網路架構,支持超過20,000個GPU協同工作,帶寬達10Pb/s,延遲低於10ms,這一突破性升級將模型訓練時間縮短至少15%。新一代Amazon SageMaker,將快速SQL分析、PB級大數據處理、數據探索和集成、模型開發和訓練以及生成式AI等功能統一到一個集成平台。
多樣化的模型選擇優勢:俗話說,「鐵打的應用,流水的模型」,僅用一個模型打遍天下是不可能的,需要因場景需求進行取捨,實現最優的性價比組合。亞馬遜雲科技也在2024 re:Invent上發布了Amazon Nova六種新基礎模型,Amazon Bedrock的朋友圈也在擴大,覆蓋了AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI、Luma AI和poolside等領先廠商。
企業級AI工具全家桶:Amazon Bedrock不僅可以提供各種先進模型,已經進化為一站式生成式AI解決方案,第一,優化效果、延遲和成本:如低延遲優化推理、模型蒸餾、提示詞緩存等功能,大幅提升推理效率;第二,基於企業自有數據的定製優化:模型微調和知識庫功能不斷豐富,現支持GraphRAG等圖數據,及高效從文檔、圖像、音頻、影片中提取資訊並轉化為結構化格式的Amazon Bedrock Data Automation功能;第三,負責任AI的安全和審查:Amazon Bedrock不斷增強Guardrails功能,例如加入自動推理檢查,以識別事實性錯誤並提高回答準確性;第四,實現複雜功能的多智能體功能:Amazon Bedrock推出多智能體協作功能,客戶可輕鬆構建和協調智能體執行複雜工作流程,精確分配任務並加速執行。
亞馬遜雲科技大中華區產品部總經理陳曉建表示:「亞馬遜雲科技是全球雲計算的開創者和引領者,更是企業構建和應用生成式AI的首選。我們不僅在雲的核心服務層面持續創新,更在從晶片到模型,再到應用的每一個技術堆棧取得突破,讓不同層級的創新相互賦能、協同進化。我相信,只有這樣全棧聯動的大規模創新才能真正滿足當今客戶的發展需求,加速前沿技術的價值釋放,助力各行各業重塑未來。」
OpenAI和DeepSeek的目標都是AGI(通用人工智慧),可能是3年,5年甚至更長時間,然而在這個過程中,企業依然能夠持續受益,在實際應用中創造出巨大價值。