從去年的GenAI到今年的Agentic AI,新一輪的AI落地正進一步加速。
今年re:Invent,亞馬遜雲科技的關注點也發生了根本變化,不再強調「生成式 AI 產品矩陣」,而是著手構建一套系統性的Agentic AI生態,讓Agent不止能調用工具,而是能夠穩定、持續地執行真實業務。
聚焦生產級AI Agent的構建,亞馬遜雲科技Agentic AI副總裁Swami Sivasubramanian提煉出四條關鍵路徑:構建、效率、可信、可靠,構成從概念驗證到生產部署的完整技術體系。
這四個路徑恰好對應Agent的開發、推理、決策、執行全生命周期。而且re:Invent帶來了多項全新能力升級,為這一路線補齊了關鍵拼圖。

亞馬遜雲科技Agentic AI副總裁Swami Sivasubramanian
一、Easy to Build易於構建:Agent的門檻正在被重寫
構建Agent說難不難,說簡單也不簡單。因為真正阻礙企業落地的往往不是模型,而是工程體系。亞馬遜雲科技正在進一步降低這道門檻,讓企業能夠以最少的工程量搭建出真正「跨工具、跨系統、可執行任務」的Agent。
今年7月的紐約峰會上,亞馬遜雲科技就已經帶來了Amazon Bedrock AgentCore,它提供不是某一個具體Agent,而是企業構建Agent所需的一整套通用能力底座。
可以說Amazon Bedrock AgentCore正在將阻礙Agent從PoC走向生產的五大難題逐一拆解:AgentCore Runtime提供無伺服器、完全會話隔離的運行環境;AgentCore Memory引入情景記憶Episodic Memory,讓Agent能基於歷史經驗持續學習;AgentCore Identity打通亞馬遜雲科技與第三方服務的統一IAM體系,使身份與權限管理可管理;AgentCore Gateway實現工具、數據與其他Agent的智能發現與安全接入,構建跨系統的執行能力;AgentCore Observability將工作流、運行狀態全面納入可觀測體系,與CloudWatch深度集成。
亞馬遜雲科技的目標,是把構建Agent的過程標準化、模塊化,讓開發者專注於業務邏輯,把基礎設施的複雜性全部交給自己來承擔。
與此同時,亞馬遜雲科技還推出了開源框架Amazon Strands Agents SDK,進一步降低Agent 的開發門檻。其利用大模型的推理能力自主完成規劃與工具調用,開發者只需提供提示詞和工具列表,Agent即可自行判斷何時、如何執行任務。相比傳統的預定義工作流,這種方式顯著簡化了構建過程,讓Agent真正具備「自我決策、按需行動」的能力。
目前Amazon Strands Agents SDK的下載量已經超過500萬次。隨著TypeScript支持和邊緣設備能力的加入,開發者可以用最少的代碼構建出可執行真實任務的Agent。

Amazon Strands Agents SDK工程化價值也在企業實踐中迅速驗證,Cox Automotive將車輛估價流程從2天壓縮到30分鐘;Blue Origin部署了2700個Agent覆蓋了70%的員工,在 T-REX項目中工程師交付效率提升75%,質量提升40%。
二、Efficiency效率:讓Agent不止能跑,還能跑得快
模型定製可以構建高效的Agent,但企業最大的問題不是你是否應該定製你的模型,而是能以多快的速度開始。
如今大模型在企業任務中已經足夠智能,但效率與專業度往往難以兼得。亞馬遜雲科技則定製三項技術構建高效Agent:監督微調將通用模型轉變為領域「專家」;模型蒸餾可以在保留95–98% 效果的前提下帶來最高10倍推理提速,使輕量模型可規模化部署;強化學習則基於行動反饋持續優化策略,讓Agent的決策更穩健、更貼近業務預期。
然而,要讓Agentic AI真正成為企業級工具,還需要新的效率引擎,四項新增能力展示出亞馬遜雲科技如何實現高效訓練、微調和規模化執行上的全面提升。
能否消除所有複雜性和成本,同時獲得先進的訓練技術?這就是Amazon Bedrock推出強化微調(Reinforcement Fine-Tuning, RFT)的原因。強化微調可以幫助客戶無需深厚的機器學習專業知識或大量標記數據,就能提高模型準確性,現在Amazon Bedroc自動化了整個強化微調工作流程,平均使模型的準確性提升66%。目前支持Amazon Nova,很快將支持開放權重模型。
目前,Amazon Bedrock已經提供了模型微調功能,但許多客戶仍希望完全掌控定製,並充分利用自身數據。Amazon SageMaker AI推出了無伺服器模型定製能力,支持對Amazon Nova、Qwen、Llama、DeepSeek
等熱門模型進行定製,並可通過簡單幾步直接部署到Amazon Bedrock或SageMaker上。同時,支持RLAIF、RLHF、DPO等強化學習技術,能夠基於最適合任務的模型實現精準定製。
訓練基礎模型通常需要大量資金與技術能力,現在藉助Amazon Nova Forge,企業可以以最簡便、最具成本效益的方式構建前沿模型。可以在訓練檢查點,將專有數據與亞馬遜雲科技的數據集混合使用,從而打造出既具前沿智能,又針對特定行業和業務用例量身定製的模型。
在模型構建或訓練過程中,常會發生故障。隨著模型規模擴大、訓練集群增大,故障頻率也隨之上升。Amazon SageMaker HyperPod推出了Checkpointless Training無檢查點訓練功能,能夠在幾分鐘內自動恢復訓練,大幅降低故障恢復時間和成本。
三、Trust信任:如何讓一個能自主行動的Agnet變得可信?
目前看來,Agent最大的問題不是能力,而是可控性。企業需要知道Agent為什麼做出這個決策?是否越權?能否審計?
模型會產生幻覺、在複雜規則或邏輯上出錯,推理過程也存在缺陷。如果缺乏信任,就需要在每一步加入人工干預,或將操作流程編碼化,但這些措施都會削弱Agent的創造力和自主性。
如何在保證Agent自由度的同時,明確安全操作邊界?
自動推理與大型語言模型的結合提供了解答,就是所謂的「神經符號AI」。亞馬遜雲科技通過三種方式應用:第一,驗證大型語言模型輸出,並在發現問題時建立反饋循環;第二,基於自動推理輸出訓練大型語言模型,如使用Lean定理證明器;第三,將自動推理驗證器嵌入大型語言模型推理基礎設施,實現「約束編碼」。
受亞馬遜雲科技內部規範與自動推理成功實踐的啟發,Kiro團隊也將規範理念直接融入產品,實現范驅動的生成式IDE,通過規範指導代碼生成、測試生成及正確性驗證。
另外關於信任,re:Invent首日還發布了Policy in Amazon Bedrock AgentCore,其提供了實時且確定性的審計與控制能力,管理Agent與外部工具及數據的交互。用戶可用自然語言描述允許的操作,系統會將其轉換為基於開源授權語言Cedar的形式化表示,其語義在Lean定理證明器中得到形式化驗證。近期,還加入了基於自動推理的分析功能,可用於推演和驗證策略的語義。
四、Reliability可靠性:Agent從「能跑」到「能長期穩定運行」
對於Agent,模型固然重要,但是運行穩定性也同等重要,亞馬遜雲科技正將「執行可靠性」升級到基礎設施等級。
Amazon Nova Act今年早些時候推出了預覽版,在re:Invent大會上也正式發布。Amazon Nova Act能夠幫助開發者構建、部署和管理大量可靠的Agent,從而實現生產環境UI工作流程的自動化。它基於定製的Amazon Nova 2 Lite模型,能夠出色地驅動瀏覽器、支持API調用,並在必要時將問題升級至人工處理。
Swami Sivasubramanian做了一個比喻,就像建立數百個強化學習「健身房」,讓Agent在其中運行數千個工作流程,經過數十萬次交互不斷學習模式,最終具備可靠應對現實企業場景的能力。
目前Amazon Nova Act在企業工作流程中實現90%可靠性,與其他AI框架相比,能以最快的速度實現價值,並簡化部署過程。
另外,re:Invent第一天發布的AgentCore Evaluations也是CIO反響最強烈的功能之一,其可以使用內置評估工具來評估常見的質量維度,例如正確性、幫助性、工具選擇準確率、安全性、目標成功率和上下文相關性。
「這是因為企業在構建Agent時面臨的一個關鍵挑戰就是周期過長,評估能力是加速Agent開發與落地的核心環節。」亞馬遜雲科技Agentic AI總監Madhu Parthasarathy說道。這背後主要原因在於信心的構建。
Agent具備一定的判斷能力和自主性,關係到客戶有信心部署Agent,一個智能體從原型開發到要調整再到落地需要很長的時間,引入評估機制後,企業無需承擔重型工作負載,開發周期可以從幾個月縮短到幾天。
寫在最後
如今,亞馬遜雲科技構建的是整個Agentic AI生態,而不是單點產品。而且四大路徑也不是功能分類,是系統性工程。Forrester副總裁兼首席分析師戴鯤指出,此次是亞馬遜雲科技首次以系統化方式推出Agentic AI生態,對CIO和CTO而言,這不僅是技術升級,更是組織運營模式重構的起點。
未來的企業,不只是會使用AI的企業,而是能夠實現自治智能的企業,而亞馬孫雲科技給出了系統級的答案。






