宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

2025 re:Invent :亞馬遜雲科技把Agentic AI生態梳理明白了

2025年12月03日 首頁 » 熱門科技

今年亞馬遜雲科技re:Invent傳遞出一個非常重要的信號,從傳統雲基礎設施供應商,轉型為AI基礎設施與服務領軍者。

亞馬遜雲科技首席執行官Matt Garman第二次登上re:Invent的舞台顯得更加遊刃有餘。他首先po了幾個數據,展示出過去一年的增長軌跡:整體業務規模達1320億美元,同比增長 20%,一年淨增約220億美元;S3客戶已存入超過500萬億個對象,日均峰值請求量超過每秒2億次;連續第三年,新增的雲端CPU容量超過一半來自Graviton;Amazon Bedrock服務超過10萬企業。

Matt Garman提到亞馬遜雲科技一直在創新的路上,AI正在重塑每一個行業,但很多企業沒有看到相應的回報,這是因為AI的真正價值還沒有被釋放。

如今他看到Agent的出現讓企業的投資開始看到成果。未來每個企業都將會有很多Agent,處理更多的事情,每個企業都可以從AI中得到更多價值,所以亞馬遜雲科技對人工智慧基礎設施、推理平台、企業數據、構建Agent的工具進行創新,幫助企業可以自由的發明下一步。

2025reInvent亞馬遜雲科技把AgenticAI生態梳理明白了

亞馬遜雲科技首席執行官Matt Garman

Trainium正在改寫AI底層邏輯

談到AI基礎設施,首先想到的就是GPU。當下最炙手可熱的無疑是英偉達,而亞馬遜雲科技正是全球運行英偉達GPU的最佳場所。

亞馬遜雲科技與英偉達已有15年的合作,具備大規模 GPU 集群的運營經驗。今年P6e-GB300 UltraServer也正式上線。P6e-GB300 UltraServer採用NVIDIA GB300 NVL72加速顯卡,相比P6e-GB200相,GPU內存和FP4計算能力分別提升1.5倍。

擁有最絕佳的AI能力,就需要最好的訓練和推理能力,亞馬遜雲科技一直在為人工智慧負載提供最佳的性價比,目前亞馬遜雲科技Trainium的業務規模已達數十億美元,迄今為止已部署了100萬顆Trainium晶片。

AWS Trainium 3的目標是讓AI工作負載更好,更快,更具成本效益。基於AWS Trainium 3的Amazon EC2 Trn3 UltraServers已經上市,其是面向下一代 Agent、推理和影片生成等高密度應用,提供更優的性價比與更穩定的算力基礎。與上一代相比,性能提升了4.4倍,內存帶寬提升了3.9倍,每瓦性能提升超過3.5倍。

2025reInvent亞馬遜雲科技把AgenticAI生態梳理明白了

同時,AWS Trainium 4的研發也在進行中,屆時所有維度都將實現巨大躍升,預計FP4計算性能提升6倍,內存帶寬提高4倍,高帶寬內存容量提高2倍,支持全球最大規模模型的訓練需求。

重新定義下一代AI交互形態

所有應用都在被AI重構,Amazon Bedrock提供了一個安全的、可擴展的、功能豐富,正在成為企業構建AI工作負載的底座。

亞馬遜雲科技一直認為沒有一個模型可以解決所有問題,所以Amazon Bedrock也得到了眾多客戶的選擇。今天Amazon Bedrock原生支持模型又新增了4個。目前中國模型已經有Deepseek2025reInvent亞馬遜雲科技把AgenticAI生態梳理明白了、Qwen,加上新增的Kimi和Minimax,接近全部模型的1/4。

酒香不怕巷子深,但是自家模型還是要拿來夸一夸。去年眾星捧月,集萬千期待一身的Amazon Nova由亞馬遜首席執行官Andy Jassy親自發布,並且發布了6種基礎模型,經過一年發展到了8種。

去年Andy Jassy就預告了,要推出Amazon Nova Speech-to-Speech語音對語音模型和Amazon Nova Any to Any 任意模態生成任意模態模型。

今年Amazon Nova 2如期而至,包括Lite、Pro、Sonic三款。Lite是一款快速、經濟高效的推理模型,適用於日常工作負載;Pro適用於高度複雜的多步驟任務;Sonic是面向對話式人工智慧的全新Speech-to-Speech模型。

同時還發布預覽版Amazon Nova 2 Omni,可完成多模態推理和圖像生成,是業內首個支持文本、圖像、影片、音頻輸入,並支持文本與圖像輸出的推理模型。

從大模型到「我的模型」,重寫AI訓練範式

Matt Garman一直聽到客戶想要一個「能夠真正理解我的數據」的前沿模型或Agent。因為只有當正確的模型與企業自有數據深度結合,AI價值才能被真正釋放。

Amazon Nova Forge正是基於這一需求而生:引入「開放式訓練模型」理念,實現訪問多種 Nova訓練檢查點,並在訓練的每一個階段,將自有數據注入其中,訓練專屬模型,同時還可使用亞馬遜的豐富數據集。

比如一家企業掌握數百GB數據、數十億token,涵蓋過往設計、故障模式、評審記錄等核心數據。企業從一個已完成80%預訓練的Amazon Nova 2 Lite檢查點開始,將自有數據與亞馬遜雲科技的數據集融合,並按照預置配方完成剩餘的訓練流程,最終得到的模型既融入了企業獨有的領域知識,又保留了大模型推理等底層能力。

目前Booking.com、nimbus、NRI、Reddit、SONY已經成為Nova Forge的早期用戶。Matt Garman認為,Amazon Nova Forge會徹底改變企業使用AI的方式。

SONY一直希望交付給客戶「感動」,其通過對20多個Amazon Nova 2 Lite進行微調,實現了在一致性和文檔等任務方面優於基礎模型,目標將SONY合規審查和評估流程的效率提高100倍。

「AWS一方面相對謹慎投入自研模型Nova系列,定位於高性能、低成本,覆蓋推理、對話、代碼生成、語音交互等場景,強調多模型組合;另一方面戰略投入開放生態,不斷引入包括中國廠商提供的模型在內的第三方模型,同時藉助Amazon Nova Forge幫助企業加速模型調優。」Forrester副總裁兼首席分析師戴鯤說道。

從工具到自治系統的跨越已經開始

孩子的成長需要自由同樣需要約束力,通過制定一些基本規則來避免重大問題,Agent也是一樣的道理。

Amazon Bedrock AgentCore能夠安全、規模化地構建、部署與運營Agent,今天又推出了兩項新功能,Policy in AgentCore和AgentCore Evaluation。

Policy in Amazon Bedrock AgentCore,可以根據策略評估每一個Agent,阻止Agent超出你的請求範圍,讓模型遵守明確的界限和要求。另外人需要定期做體檢,Agent呢?AgentCore Evaluations能夠使用內置評估工具來評估常見的質量維度,例如正確性、有用性、無害性等,而且評估是自動化的。

Kiro是一個用於結構化AI編碼的Agent開發環境,讓開發者在提高AI編碼速度的同時,擁有更強的結構和掌控力。原本需要30名開發者花18個月的項目,他們僅用了6名成員、76天就全部完成,效率的提升是翻天覆地的。

最後想再說說,三款全新的前沿Agent:Kiro自主Agent、Amazon Security Agent和Amazon DevOps Agent。

Kiro自主Agent面向軟體開發,自主處理複雜編碼任務,深度集成開發流程;AWS Security Agent構建更安全應用,主動掃描漏洞,將滲透測試轉為按需服務;AWSDevOps Agent卓越運維,自動診斷並預防故障,即時響應。

前面講的都和AI相關,最後Matt還用10分鐘,極限發布了25項底層的新產品和新功能,為第一天的Keynote收尾。

寫在最後

全球各大雲廠商都在面向AI原生雲加速演進。「今年re:Invent充分體現了AI原生雲在服務平台化、軟硬一體化、技術生態化、能力場景化四個維度的發展趨勢。」戴鯤認為,亞馬遜雲科技一系列發布在全棧布局、自研硬體和生態開放三個層面都有了顯著拓展與提升。但要贏得企業心智,還需加速相關雲服務落地,簡化傳統業務系統集成的複雜度,進一步提升上下文工程能力和智能體與人工流程混合編排能力,以及為行業場景化落地提供更多支持。

可以看到,亞馬遜雲科技正在試圖重塑企業使用AI的方式,在模型、數據、算力和應用場景上形成完整的閉環。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新