宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

NVIDIA首次展示「AI五層蛋糕」完整技術棧 攜手超百家中國夥伴共築AI生態

2026年06月24日 首頁 » 熱門科技

當下,人們對AI的關注幾乎被「大模型智商測試」和各類跑分榜單所占據。這種聚焦於算法、參數層面的線性邏輯,在無形中製造了極大技術焦慮,也讓人誤以為通用人工智慧(AGI)的進化,只關乎模型參數的持續堆疊。

但其實,當AI進入真實產業系統後,這種理解方式並沒有太大意義。模型能力可以提升,但成本、延遲與規模化落地的問題,並不會隨著參數增長自動解決。問題開始暴露在模型之外。

AI產業的核心矛盾,因此從「模型能力」,轉向「系統結構」。

也正是在這一背景下,NVIDIA創始人兼CEO黃仁勛在GTC 2026前夕,提出了一個更貼切的框架——「AI五層蛋糕」框架理論。他認為,AI產業不能僅依靠單點技術突破,而必須作為一個由能源、晶片、基礎設施、模型、應用構成的完整系統來運行。

NVIDIA首次展示「AI五層蛋糕」完整技術棧 攜手超百家中國夥伴共築AI生態

這個框架的意義在於,其重新定義了AI競爭的對象:不再是模型,而是系統。

而當AI被視為系統之後,就必須在現實世界中找到對應產業結構,否則這一框架無法成立。

從產業形態來看,全球供應鏈提供了極佳的參照系,其同樣由多個環節構成,並通過資訊流與物理流的結合實現整體運轉。

而就在6月22日的第四屆中國國際供應鏈促進博覽會(鏈博會)上,黃仁勛也發表了致辭。他指出,鏈博會所關注的是世界上最重要的體系之一:供應鏈。供應鏈連接著能源、工廠、物流、企業和客戶,進而連接著整個世界。每一條供應鏈同時也是一個資訊系統,而AI將賦予這一系統智能。

供應鏈的結構特徵,由能源供給、製造環節、物流網路、企業系統和終端用戶構成,並通過資訊系統進行連接與調度。

如果把這一結構與「AI五層蛋糕」對照,可以看到兩者具有一致的分層邏輯,能源與製造對應底層供給,晶片與基礎設施對應中間計算與連接層,模型與應用對應上層決策與執行。

在這一對照關係下,產業供應鏈成為「AI五層蛋糕」在物理世界中的展開形式。

進一步來看,在全球產業系統中,不同國家的參與方式並不相同,而中國在「AI五層蛋糕」的所有層級中均深度涉獵,並形成了跨層級的系統能力。

在能源與製造環節,中國具備完整的工業體系與供應鏈基礎;在晶片與基礎設施層面,參與硬體製造與系統集成;在模型與應用層面,中國具備大規模的落地能力與產業場景。

在這一框架中,中國已經形成了「全棧式嵌入」的產業形態。

黃仁勛表示:「中國是世界上重要的科技與產業中心之一,這裡的工程師表現卓越,開發者行動敏捷,企業也以非凡的規模實現發展。」

也正因此,NVIDIA在鏈博會上展示了「AI五層蛋糕」切面。其展示聯合110餘家來自不同層級的客戶、合作夥伴與OEM廠商,覆蓋能源、晶片、基礎設施、模型、應用多級產業鏈。

NVIDIA首次展示「AI五層蛋糕」完整技術棧 攜手超百家中國夥伴共築AI生態

這其中,這些合作夥伴大多來自中國供應鏈體系,使得這一展示呈現出中國在「AI五層蛋糕」框架中高度完整的產業嵌入能力,和全鏈條參與結構。

01  透視「AI五層蛋糕」,中國AI供應鏈的「硬核」站位

透視「AI五層蛋糕」,可以更清晰地看到中國AI產業在不同層級中的實際位置和跨層級協同能力。貫穿這一體系,以NVIDIA等為代表的計算架構提供了底層算力基礎設施支持,使不同層級的產業環節能夠在統一的計算平台上協同運行。

「AI五層蛋糕」結構中,能源處於最底層。既決定算力擴張的邊界,也維繫著整個計算系統的持續運行。隨著模型參數規模擴大、推理需求增長,能源與計算之間的關係也在發生變化,算力的增長正不斷抬高能源需求,AI則開始進入能源生產、裝備製造和電力供應環節,二者由單向供給逐漸走向深度耦合。

可控核聚變是這一趨勢下最前沿的能源應用場景之一。在本次展會上,我們看到了中國在能源基建與AI技術雙向賦能方面的深度探索。中國極為完備的電力基礎設施,為AI發展提供了堅實底座,與此同時,AI也正在重塑能源的生產與調度網路。

在可控核聚變這一人類能源終極的探索之路上,能量奇點公司藉助AI駕馭極端複雜的物理裝置。通過在NVIDIA的GPU上部署AI模型,能量奇點利用「實時磁平衡重建算法」對複雜的等離子體特徵進行推理並實施實時控制。藉助NVIDIA Nsight Systems和TensorRT工具鏈54.8倍的加速。這一突破滿足了核聚變裝置毫秒級的嚴苛控制要求,開創了從被動響應到主動預測的新能源控制範式。

(Nsight Systems可將系統工作負載指標可視化到時間軸上,並提供工具幫助開發人員檢測、理解和解決性能問題)

截取自:NVIDIA開發者社區

在更貼近商業化落地的智算中心(AIDC)供電領域,金盤科技打造了製造行業全面採用NVIDIA全棧技術的智能工廠。依託NVIDIA AI Enterprise(NVAIE)與NIM微服務自動化流水線,金盤科技構建了統一的MOI數據治理平台,並為高耗能的AI數據中心量身定製了涵蓋乾式變壓器、儲能變流器、UPS、HVDC(高壓直流)及SST電源的全套智能電力架構解決方案,切實穩固了AI算力高速發展的底層「大動脈」。

NVIDIA首次展示「AI五層蛋糕」完整技術棧 攜手超百家中國夥伴共築AI生態

NVIDIA AI Enterprise

截取自:NVIDIA

能源層之上,晶片層承擔著將電能高效、大規模地轉化為計算能力的核心使命。在大模型時代,算力的競爭早已超越單顆晶片的理論峰值,演變為涵蓋整機架構、高速互聯與極致散熱的系統性工程。

在這一層面,中國硬體生態展現出強大的系統集成與模組化創新能力。

在展區中,中興通訊(ZTE)、新華三(H3C)、比亞迪電子(BYD Electronics)、安擎、雲尖資訊(CNIT)等國內頂尖生態夥伴悉數登場,共同構築起多元化的算力基座。

以中興通訊的R6701G6智算伺服器為例,該設備基於NVIDIA MGX模組化參考設計平台打造,高度標準化的模組設計大幅縮短了量產周期。在搭載雙路Intel GNR-SP CPU與多塊NVIDIA高性能GPU的同時,伺服器通過精密的內部架構,配合高性能風扇模組與N+1雙輸入電源模組,可充分滿足當下高密度模型推理與訓練需求。

NVIDIA首次展示「AI五層蛋糕」完整技術棧 攜手超百家中國夥伴共築AI生態

MGX可將計算和網路伺服器、冷卻、電源、連接器等統一起來,為整個生態系統提供通用的第三代MGX機架級設計。

截取自:NVIDIA

與此同時,算力密度的持續攀升使傳統風冷方案逼近物理極限。超聚變的液冷工作站配備了GPack、CPack、MPack、SPack 等模組化液冷散熱系統,依託這種極致散熱能力,該工作站能夠穩定承載 NVIDIA 的底層算力,面向AI開發、科學計算、工程仿真等高性能應用場景,為入門級終端帶來跨越量級的算力體驗。

晶片層之上,基礎設施層承擔著將算力資源整合為可運轉「AI工廠」的重任。AI時代的數據中心正從傳統機房演進為擁有數萬顆晶片的超大規模算力集群。支撐這座工廠運轉的,不僅包括GPU,更涵蓋高速網際網路路、液冷散熱系統,以及複雜的整機集成能力,這也正是中國製造的重要生態位所在。

在數據處理架構層面,百度推進了離線計算的GPU化工程實踐。面對持續增長的離線計算需求,百度引入了NVIDIA的cuDF、cuVS以及 Spark RAPIDS等工具鏈,以此驅動整體數據處理鏈路的加速。

NVIDIA首次展示「AI五層蛋糕」完整技術棧 攜手超百家中國夥伴共築AI生態

NVIDIA CUDA-X

截取自:NVIDIA

圍繞IO、Scan、調度、Fallback機制,以及系統穩定性等關鍵環節,百度進行了系統性優化,使GPU加速能力覆蓋 ETL、Ad-hoc 查詢以及 Batch 任務等多類核心場景,最終實現端到端計算成本下降約50%。

在金融基礎設施應用方面,NVIDIA的GPU原生資料庫(GPU-Native Databases)在金融數據分析與實時決策中呈現出整體的加速能力。面向風控、交易、反欺詐、客戶洞察與合規審計等典型場景,可基於GPU平台搭建大規模金融數據查詢分析、實時風險計算與模型推理,以及高頻交易數據處理進行加速,從而為金融行業提供高性能的數據處理底座。

當算力與基礎設施逐漸成熟,焦點開始向模型層轉移。中國AI企業在經歷高速擴張後,持續通過底層架構創新(如MoE、DiT)與極致的工程優化來提高運行效率。

行業領先的開源模型MiniMax獲得了NVIDIA的Day 0級接入支持。圍繞這一模型,NVIDIA構建了從原型開發到生產部署的完整路徑。開發者可以直接在 GPU加速端點上快速進行模型驗證與原型設計;當進入工程化階段時,則可以將 MiniMax M3 以容器化推理微服務的形式部署為NVIDIA NIM,在本地、雲端或混合基礎設施中實現靈活擴展與統一調用。

在模型定製層面,NVIDIA 也提供了進一步的能力延展。開發者可基於自有數據對 MiniMax M3進行定製優化,通過NeMo Framework完成微調,從而將通用能力遷移到更貼近業務場景的模型表現。

NVIDIA首次展示「AI五層蛋糕」完整技術棧 攜手超百家中國夥伴共築AI生態

截取自:NVIDIA

除了通用大模型領域,在AI for Science方向,NVIDIA的軟體棧同樣支撐著大量科學大模型的訓練與推理。在氣象與氣候預測領域,「風烏」全球多尺度氣象預報體系運行於NVIDIA GPU集群之上。其跨卡、跨節點的大規模訓練採用CUDA、cuDNN,以及NCCL通信庫保障並行計算效率;而複雜的解耦組合遷移學習、多區域LoRA微調等能力,則藉助NeMo框架實現高效訓練與模型服務。

在生命科學領域,清華大學張強鋒團隊研發的CryoNet利用CUDA、cuDNN以及Tensor Core混合精度計算能力,實現冷凍電鏡原子模型的自動重建;西湖大學的CellVQ則結合NeMo大規模並行訓練能力和RAPIDS數據處理框架,對6800萬個單細胞樣本進行預訓練分析。

NVIDIA首次展示「AI五層蛋糕」完整技術棧 攜手超百家中國夥伴共築AI生態

cuDNN Graph API 描述的示例操作圖

截取自:NVIDIA

在工業研發場景中,十灃科技將自研神經算子與PhysicsNeMo深度融合,並藉助Magnum IO實現多GPU擴展,完成端到端實時物理場預測。

NVIDIA首次展示「AI五層蛋糕」完整技術棧 攜手超百家中國夥伴共築AI生態

PhysicsNeMo框架

截取自:NVIDIA

應用層,是「AI五層蛋糕」價值兌現的最終出口。換句話說,能源、基建、算力、模型的持續投入,解決的是「能不能跑」的問題,而應用層解決的是「跑進哪裡、跑得多深」的問題。

事實上,當AI開始進入業務系統之後,關鍵的變化是,場景變成了反饋源。也就是說,應用層不僅是技術的消耗端,同時也開始反向塑造模型能力與算力結構。而中國市場的特殊性,正在於極度放大了這種反饋。高密度、多行業並行的落地,使AI同時進入大量真實生產系統,塑造出「高頻反饋環境」。

也正是在這種反饋機制下,不同類型的應用開始沿著同一條邏輯鏈展開:當場景複雜度上升,系統瓶頸就會從模型能力,轉移到計算效率與系統結構;而當效率被逼近極限時,AI又會反過來重塑系統形態。

這一挑戰在多模態生成任務中尤為突出,影片生成場景更是如此。以快手的「可靈AI」為例,在其基於DiT的架構中,隨著影片長度和解析度的提升,注意力機制的計算成本急劇攀升,逐漸成為整個生成流程的主要性能瓶頸。

針對這一問題,快手攜手NVIDIA從計算和注意力機制兩個維度進行優化。一方面採用FP8低精度計算降低單次運算開銷,另一方面引入影片稀疏注意力(VSA),減少跨幀及空間維度上的冗餘Attention計算,從而將端到端生成效率提升3倍以上。最終使得影片生成從「具備生成能力」,邁向了「穩定、高效且可持續的規模化生成」。

當生成側算力壓力得到釋放後,系統瓶頸轉移到企業內部的服務鏈路,集中體現為調度效率、數據流轉與端到端延遲控制等系統性工程問題。對此,騰訊元寶一方面通過拆分推理鏈路、優化CPU與GPU間的調度、減少跨層等待來降低端到端時延;另一方面,其混元模型藉助NVIDIA TensorRT-LLM在TP、EP、FP8等多維度推理加速能力,進一步壓縮計算環節耗時。二者協同,使系統能夠支撐更複雜的多模態任務編排與聯動。

02  從「AI五層蛋糕」到「AI工廠」:「三台電腦」與本土產業鏈的「雙向奔赴」

不難發現,中國在「AI五層蛋糕」框架的每一層實現了全面的硬核占位。然而,產業物理結構的「全棧站位」並不等同於商業價值的自動兌現。要將這套全球最完整的供應鏈轉化為持續的生產力,產業界亟需能夠串聯各層能力、實現閉環疊代的生產範式。

當前,這一範式正以「AI工廠」(AI Factory)的形態加速成型。

「AI工廠」的意義,是用工業流水線的方式,重新組織AI模型從開發到交付的工程過程。而在這一框架中,NVIDIA提出用「三台電腦」來對應AI系統的三類關鍵計算形態。

NVIDIA首次展示「AI五層蛋糕」完整技術棧 攜手超百家中國夥伴共築AI生態

第一台電腦是訓練電腦。這台電腦是AI工廠的「大腦鑄造車間」,即NVIDIA DGX所代表的超大規模訓練集群。當大模型邁向萬卡甚至十萬卡規模,且模型能力從純文本向多模態與物理世界演進時,算力中心的建設演變為系統級極限工程,其需要海量GPU的高效協同、超高速無損網路互聯、先進的液冷,以及極端精密的整機機電一體化集成。

而這,恰好也對應著了中國高端製造供應鏈的「深水區」。

AI訓練集群背後的物理基礎設施,是高密度、高功耗、高可靠性的複雜系統工程,其囊括了伺服器、光模組、散熱、電源與機櫃系統在極限算力條件下的協同設計與集成。

在這一過程中,中國本土的伺服器製造商、光模組企業、液冷散熱方案商,以及精密結構件廠商,逐步完成了對NVIDIA GPU等先進計算設備的工程適配,把不斷變化的系統規格,拆解為可製造、可交付、可長期運行的硬體與子系統,並在批量部署中持續修正工藝邊界與可靠性參數。

第二台電腦是仿真電腦。基礎模型誕生後,AI進入物理世界之前必須經歷關鍵的「演習」環節。第二台電腦Omniverse、Cosmos所構建的「虛擬實驗場」是嚴格遵循物理規律的數字孿生環境,用於對模型進行高強度的虛擬訓練與驗證。

在過去,機器人與自動駕駛的測試高度依賴真實物理世界,長尾場景覆蓋周期極其漫長。而Omniverse、Cosmos允許開發者生成海量帶標註的合成數據,對極端路況與精細操作進行無損耗、可復現的加速測試,從根本上改變了研發鏈路中時間與空間的成本結構。

這台仿真電腦與中國龐大的工程師生態產生了頗具價值「化學反應」。中國擁有全球規模最大、疊代速度最快的AI開發者群體,其優勢是高密度的工程問題求解能力。藉助Omniverse、Cosmos,中國企業能夠將原本在物理現場耗時數月甚至數年的調試工作,在虛擬空間中用數倍速提前跑通。這不僅大幅壓降了「仿真到現實(Sim-to-Real)」的遷移成本,更能讓工程師從重複性試錯中解放出來,將創新精力集中在更高層級的系統優化與場景適配之上。

由此極大地加速了具身智能與工業AI的商業化進程。

NVIDIA的第三台電腦(AGX,即Jetson與DRIVE系列)定位於邊緣端實時推理與控制。 在實際場景中,這一平台的實際價值在於提供標準化的硬體算力與軟體棧,使企業能夠在城市交通、工業製造、倉儲物流等高動態環境中直接部署AI模型,無需從底層系統開始構建。

在實際落地中,這一平台的能力邊界很大程度上被真實場景不斷拉伸。

對中國市場而言,應用環境的複雜性尤為突出,新能源車輛在混合交通流中的路徑規劃、工業產線對微米級缺陷的視覺檢測等,都對時延控制、功耗約束、系統可靠性方面提出了更高要求。

在這一過程中,邊緣AI系統不能僅限於單向適配標準平台,而是要形成持續的工程共調。NVIDIA通過與本地OEM、Tier 1供應商、機器人廠商的協作,利用晶片算子庫、驅動固件,以及中間件(如 Isaac SDK)不斷針對傳感器組合、通信協議與工況負載進行優化。

03 寫在最後:讓「AI五層蛋糕」成為高速轉動的「產業飛輪」

從能源、基礎設施、算力、模型到應用,中國在「AI五層蛋糕」的每一層都跑出了突破性優勢。但是,「AI五層蛋糕」並非五塊互不相干的切片,而是在彼此作用中逐漸咬合在一起。就像黃仁勛所說,AI產業並不是拆開的靜態結構,而是不斷循環、自我強化的系統。它的優劣,不取決於哪一層堆得最高,而取決於整體能不能真正轉起來。

而一旦轉起來,「產業飛輪」就出現了。應用先跑出真實需求,需求反過來推動模型持續演進,模型能力提升之後,又會進一步拉動對算力的需求;算力規模擴大後,基礎設施就必須同步升級;而基礎設施越龐大,對能源的消耗與支撐能力要求也隨之上升。

更關鍵的是,當底層能力被持續夯實之後,又會反過來支撐更大規模、更複雜的應用落地,從而推動整個系統進入下一輪加速。

於是,能源、晶片、基礎設施、模型、應用開始相互餵養、彼此強化,在循環中不斷加速,形成一個越轉越快的飛輪。而中國市場所具備的高密度、多行業同步推進的落地節奏,恰好為這個飛輪提供了強力推動力。

說到底,能夠在「AI五層蛋糕」中的某一層建立優勢的國家並不少,但能夠同時把五個層面全部納入同一體系,並形成閉環聯動的,並不多。中國真正的價值,就在於讓這五層不再各自為戰,而是共同運轉,把「全棧站位」轉化為持續釋放的生產力。

而NVIDIA的價值則在於,貫穿「AI五層蛋糕」,為這一「產業飛輪」提供基礎平台。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2026 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新