智能體工作流是一種由AI驅動的軟體系統,它通過串聯多個模型與外部工具來處理複雜任務,例如分析影片並回答相關問題。
然而,這類高度分散化系統在設計和部署方式上往往存在效率問題,導致算力、能源和成本的浪費。
為了提升效率,麻省理工學院與微軟的研究人員聯合開發了一套智能系統,旨在簡化智能體工作流的設計流程,並自動優化工作流的執行方式。
藉助這一新方法,開發者只需用自然語言描述希望工作流實現的功能,無需提前逐一指定應用的所有技術細節。
系統會自動確定最適合的模型與工具,並在雲服務商執行工作流時,自動配置最優的硬體方案和算力資源分配策略。
同時,系統會根據每位用戶的優先需求——例如降低成本或提升速度——動態調整配置方案。
在多項智能體工作負載測試中,與傳統方法相比,這套新系統在不影響性能的前提下,顯著減少了部署所需的計算單元數量,大幅降低了能耗與成本。
"智能體工作流正變得越來越複雜,並迅速成為雲服務商業務的核心支撐。能源消耗是一個重大問題,因此我們必須高度關注工作流的效率。資源過度分配極易發生,進而造成能源和資金的浪費。讓雲服務商能夠智能地優化這些工作流的資源利用,對所有相關方來說都是一件好事。"論文第一作者、麻省理工學院電氣工程與電腦科學系博士生 Gohar Chaudhry 表示。
論文的其他作者包括:麻省理工學院電氣工程與電腦科學系副教授、MIT電腦科學與人工智慧實驗室成員 Adam Belay,以及微軟Azure技術研究員兼公司副總裁、通訊作者 Ricardo Bianchini 等來自微軟Azure的研究人員。該論文將在USENIX作業系統設計與實現研討會上正式發表。
配置難題
智能體工作流是由多個自主AI智能體協同構成的系統,這些智能體通過調用各類模型與工具(如資料庫或Python程序),動態完成數據處理、代碼生成等多步驟任務。
這類工作流通常作為後台進程,為面向用戶的應用程式提供支撐。
傳統做法要求開發者在開發階段就將所有技術選型硬編碼固定。他們需要明確選用哪些AI智能體、模型和工具,以及調用順序,還需指定運行工作流的硬體配置,並在速度與成本等方面進行權衡。
這一過程尤為複雜,因為智能體工作流往往整合了多個黑盒模型和各類工具,每個組件都有各自的配置選項,而這些組件可能來自不同的廠商。
一旦有新的AI模型發布,可以提升應用的精度或效率,開發者就不得不推倒重來。
"即便你想手動完成所有配置,也很難達到最優效果,因為可能的配置空間實在太大了。"Chaudhry 說。
此外,為用戶部署應用的雲數據中心無法深入工作流內部,也就難以在用戶發起請求時以最高效的方式分配硬體資源。
為此,研究團隊開發了這套名為 Murakkab 的新系統——這是一個烏爾都語詞彙,意為"多種事物的組合"——旨在對整個智能體工作流進行全面優化。
動態決策機制
首先,Murakkab 允許開發者以高層次的語言描述應用意圖來創建智能體工作流,而無需詳細說明工作流各組件的具體組合方式。
例如,開發者可以描述一個影片問答應用,該應用需提取關鍵幀、生成文字記錄,並回答用戶關於影片內容的問題。
"實現這一目標的方式有很多,而不同的模型和工具選擇,都會影響應用完成任務的速度。"他說。
Murakkab 會根據開發者的簡單描述,自動識別並整合最合適的現有模型與工具,構建完整的工作流。
系統還會判斷哪些組件需要順序執行,哪些可以並行處理,以提升整體性能。
"該平台會隨時間動態調整配置決策,因此即使明天出現了新的模型或GPU加速器,開發者也無需為此擔心。"他說。
當雲服務商為用戶部署該應用時,Murakkab 會根據用戶的約束條件(如在滿足延遲要求的前提下優先保障精度)對工作流進行優化,實時動態識別最優硬體分配方案和部署計劃,最終生成可供雲服務商直接執行的工作流。
"我們的系統還為雲服務商提供了跨多個工作負載的可視化能力,使其能夠在滿足用戶約束的前提下,以最高效的方式共享計算資源。"他說。
在針對影片問答和代碼生成等多樣化智能體工作流的測試中,Murakkab 在滿足用戶需求的同時,僅需其他方法約35%的計算量,能耗約為27%,成本不足25%。
Murakkab 的動態特性還賦予用戶靈活權衡各項指標的能力。在一個測試案例中,系統將某智能體工作流的能耗降低了逾一個數量級,而精度僅下降約2%。
系統還為影片幀選取模型找到了一種出乎意料的最優配置,顯著提升了影片問答任務的性能。Chaudhry 表示,這類優化幾乎不可能由開發者手動實現。
下一步,研究團隊計劃將系統擴展至更複雜的工作流和更大規模的計算集群,並探索優化新型智能體應用的可能性。
"讓這些工作流更加資源高效、大幅降低能耗的潛力是巨大的,但我們需要從大型雲平台的規模來思考這個問題。"Chaudhry 說。
本研究部分獲得半導體研究公司及美國國防高級研究計劃局的資助支持。
Q&A
Q1:Murakkab系統是什麼?它能解決什麼問題?
A:Murakkab 是由麻省理工學院與微軟聯合開發的智能系統,名稱來源於烏爾都語,意為"多種事物的組合"。它能自動優化AI智能體工作流的設計與執行,解決傳統方式中資源過度分配、配置複雜繁瑣、能耗和成本浪費等問題。開發者只需用自然語言描述需求,系統即可自動完成模型選擇、硬體配置和資源調度。
Q2:Murakkab在實際測試中表現如何?
A:在影片問答和代碼生成等多種智能體工作流測試中,Murakkab 僅需傳統方法約35%的計算量,能耗約為27%,成本不足25%,同時不影響整體性能。在一個具體案例中,系統將工作流能耗降低了逾一個數量級,而精度僅下降約2%。
Q3:Murakkab如何應對新模型或新硬體的出現?
A:Murakkab 採用動態決策機制,能夠持續跟蹤並自動整合最新的模型和GPU加速器,開發者無需重新配置工作流。系統會實時根據用戶的優先需求調整配置,確保工作流始終以最優狀態運行,從而避免了傳統方式中每次更新都需從頭開發的問題。






