宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

英偉達發布新一波生成式AI發展藍圖

2024年08月29日 首頁 » 熱門科技

作為英偉達GPU技術大會上的絕對明星,今年英偉達為我們帶來了 「Blackwell」數據中心GPU硬體,即將在2025年新平台中擔當基石角色的「Grace」CPU、NVLink Switch 5晶片、Bluefield-3 DPU以及更多其他組件。而在本周的Hot Chips 2024大會上,英偉達再次對新一波硬體組合做出了詳盡介紹。

英偉達發布新一波生成式AI發展藍圖

很多朋友可能還不熟悉英偉達的NIM策略,即強調幫助開發人員更輕鬆、更快捷地創建AI應用程序。雖然會上也有討論英偉達推理微服務的聲音,但面對Blackwell這樣的重量級新成果,沒有任何其他議題能夠真正奪走它的風頭。

但也必須承認,NIM策略對於英偉達通過聊天機器人等生成式AI工具幫助用戶開發AI軟體的整體計劃有著至關重要的作用。英偉達方面表示,NIM提供了軟體工程師所需要的一切,其被安置在類似容器的環境當中,並以預構建的微服務形式交付,可被部署在雲端、數據中心乃至工作站等系統之上。在Kubernetes之上構建的NIM容器將囊括開源大語言模型、雲原生技術棧、英偉達TensorRT及TensorRT-LLM、其Triton推理伺服器與標準API等等,將成為英偉達AI Enterprise整體戰略中的關鍵組成部分。

英偉達發布新一波生成式AI發展藍圖

根據英偉達企業AI軟體產品副總裁Justin Boitano所言,NIM是所謂第二波生成式AI技術藍圖的一部分。這股新趨勢將發生在企業當中,使得企業能夠利用自有知識來經營業務、與客戶交互並加快創新節奏。此前的第一波浪潮,是由OpenAI於2022年11月下旬推出ChatGPT之後激發的市場熱情所推動、並由基礎模型開發者引領,主要探索如何將生成式AI融入網際網路服務,從而通過撰寫語言和代碼來提高個人生產力水平。

Boitano在本周於加利福尼亞州召開的Hot Chips展會的會前簡報中向記者和分析師們強調,在這新一波浪潮當中,「生成式AI技術將幫助團隊推理複雜的業務流程與供應鏈依賴關係,以前所未有的速度將新產品和服務推向市場。這波浪潮的開端實際上源自Meta Platforms的Llama 3.1等開放模型的發布。這些模型代表著驚人的AI技術進步,將企業的智能化水平提升到了新的層面,而幾年之前大多數人還無法想像能夠將這些模型運行在數據中心之內。」

他同時提到,NIM的建立是為了實現對這些模型的大規模、生產級安全運行,並補充稱英偉達目前正在與一系列AI模型構建組織合作,利用NIM使其模型在性能與運行時效率方面更上一層樓。

Boitano介紹稱,「這些NIM提供了性能優化,使得token吞吐效率比其他解決方案快2到5倍。因此企業在英偉達系統上運行生成式AI時,可獲得更好的總體擁有成本。另外通過與社區模型構建者、專有模型構建商以及我們自己的模型所共同構成的生態系統合作,英偉達能夠確保任何業務下的任何模式間均可無縫協作,從而為使用英偉達AI Enterprise的客戶提供最佳token處理效率。」

在Hot Chips上,英偉達正通過NIM邁出新的一步,為想要創建自定義生成式AI應用程序的開發者們提供NIM Agent Blueprints。這一方案參考的是AI工作流,包括基於NIM及合作夥伴微服務的示例應用程序、參考代碼、一份概述自定義機制與Helm圖表(用於具體解釋並打包Kubernetes集群資源的應用程序文件)以實現應用程序部署。開發人員還可以對此藍圖做出靈活修改。

Boitano解釋道,「這是一份不斷增長的參考應用目錄,專為各類常見用例而創建,其中整合了英偉達與早期採用者在合作當中總結出的最佳實踐。英偉達NIM Blueprints是一種可運行的AI工作流,針對特定用例進行了預訓練,而且任何開發人員都可靈活修改。這些藍圖將成為企業中各類最核心業務任務的執行起點。」

除了加快模型部署之外,NIM Blueprints還屬於英偉達規劃的「數據飛輪」項目的一部分。這些藍圖能夠增強模型功能並實現模型定製,從而滿足組織中特定用例的實踐需求。Boitano表示在飛輪理念之下,當AI應用程序運行並與用戶產生交互時,它們就會生成數據、將數據反饋至流程當中,最終用於在持續學習周期內改進模型性能。

英偉達發布新一波生成式AI發展藍圖

Boitano指出,「英偉達NeMo正是運行這套飛輪的引擎,英偉達AI Foundry則是運行NeMo飛輪的工廠。這些定製化生成式AI應用程序將幫助企業以更卓越、質量更高的體驗吸引客戶和員工。」

他同時補充稱,「應用程序的構建過程實際上是從NIM開始的。但為了構建數據飛輪,英偉達NeMo框架會介入其間以支持數據管理、模型定製和性能評估,並用於增強應用程序以使其更好地融入生產流程。NeMo加快了生成式AI應用程序整個開發生命周期當中的一切計算密集型階段。我們還擁有廣泛的合作夥伴生態系統,他們以NeMo和NIM為基礎,使得企業能夠輕鬆開發出自己的生成式AI應用程序。」

英偉達發布新一波生成式AI發展藍圖

自從最初的生成式AI熱潮以來,各類組織一直在討論如何將業務數據納入訓練和推理組合,藉此定製屬於自己的一套AI運作體系。而這方面需求最終催生出的成果,就是檢索增強生成(RAG)。

英偉達最初發布了三種場景的藍圖,分別是用於客戶體驗的數字人(即創建能夠與用戶交互的3D數字人)以實現多渠道交互並接入RAG系統。其二是用於企業RAG的多模態PDF數據提取。「企業每年都會生成數萬億份PDF,這些PDF文件中包含多種數據類型,包括文本、圖像、圖表和表格。多模態PDF數據提取藍圖能夠幫助組織準確從海量業務數據中提取出所包含的知識,使得用戶通過聊天界面高效訪問這些數據,亦可快速將數字人轉化為任意主題方面的專家,幫助員工做出更明智、更迅捷的決策。」

最後一類應用,則是加快藥物發現,即使用生成式AI模擬具備靶向性與可結合性的蛋白質分子。

英偉達發布新一波生成式AI發展藍圖

英偉達還攜手埃森哲、德勤、SoftServe、Quantiphi以及World Wide Technology共同參與開發NIM Agent Blueprints,同時力邀Dataiku和DataRobot參與模型的微調和監控,協同LlamaIndex和Langchain建立工作流,配合Weights & Biases公司開展應用程序評估,並與CrowdStrike、Datadog、Fiddler AI、New Relic和Trend Micro一道探索網路安全之道。此外,Nutanix、紅帽和博通的企業級產品組合也將支持英偉達交付的藍圖。

這些藍圖還將運行在思科、戴爾科技、HPE以及聯想等OEM廠商的系統,以及亞馬遜雲科技、Google Cloud微軟Azure以及甲骨文雲基礎設施等超大規模系統之上。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新