戴爾與Meta合作，嘗試在本地馴服Llama 2 AI巨獸

雲設施？打的就是雲設施！

戴爾已經宣布與Facebook母公司Meta開展合作，幫助客戶輕鬆在本地基礎設施之上部署Llama 2大語言模型（LLM），藉此擺脫對雲設施的嚴重依賴。

贊助商廣告

戴爾表示，希望使用自有IT基礎設施部署並運行Meta AI模型的企業客戶已經形成了一定規模的市場，而戴爾正努力成為這部分業務的首選供應商。

此項目以戴爾的生成式AI組合驗證設計為核心，這套設計方案今年剛剛公布了與GPU大廠英偉達聯合開發的預測試硬體版本。除此之外，戴爾還負責提供部署和配置指導，幫助客戶在短時間內順利完成設施的啟動和運行。

例如，戴爾已經將Llama 2模型整合至其系統級調整工具當中，藉此指導客戶正確完成配置、實現其希望通過AI模型達成的目標。

戴爾公司首席AI官Jeff Boudreau在一份聲明中表示，包括Llama 2在內的各類生成式AI模型，有望「改變行業的運營與創新方式」。

他強調稱，「通過與Meta的技術合作，戴爾將提供詳盡的實施指南以及適合各類部署規模的最佳軟硬體基礎設施，確保所有客戶都能更輕鬆地使用開源生成AI模型。」

Llama 2是一套經過預訓練的微調語言模型，於今年7月首次公開亮相，具體提供三種體量選項：70億參數版本，130億參數版本，以及700億參數版本，不同版本分別對應不同的硬體需求。

該模型可免費下載以供研究用途，同時也支持部分商業應用。Meta公司已經與微軟和亞馬遜合作，推動自家模型登陸Azure和AWS雲平台。

當時就有媒體指出，由於Llama 2模型並未獲得開放源代碼促進會（OSI）批准的許可證，因此稱其為「開源」其實存在一定爭議。

戴爾的生成式AI驗證設計（Validated Designs for Generative AI）計劃推出於今年8月，主張將其伺服器套件與英偉達GPU、儲存及軟體（包括英偉達的AI Enterprise套件）相結合。戴爾公司已經確認將提供硬體基礎和配套的專業服務，以幫助客戶啟動並運行生成式AI負載——當然，也要收取相應費用。

贊助商廣告

整套驗證設計方案主要強調推理類負載，適用於涉及自然語言生成的應用場景，例如聊天機器人和虛擬助手、營銷與內容創建等。戴爾公司還表示，後續將進一步擴展其產品組合以支持對模型的定製和微調。

根據戴爾公司的介紹，70億參數版本的Llama 2隻需單個GPU即可運行，130億參數版本則需要雙GPU承載，而700億參數版本需要8個GPU。戴爾在貼文中概述了如何在PowerEdge R760xa系統上部署70億與130億參數兩個模型版本（https://infohub.delltechnologies.com/p/deploying-llama-2-on-the-dell-poweredge-xe9680-server/）；而700億參數版本因為需要8個GPU，所以只能在PowerEdge XE9680級別的伺服器上運行。