宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

CUDA當年:0%營收、占90%成本,但我們沒放棄——黃仁勛GTC 2026記者會問答

2026年03月18日 首頁 » 熱門科技

GTC 2026主題演講結束後第二天,黃仁勛在記者會上回答了幾十位全球記者的提問。問題略散,從晶片架構到開源戰略,從遊戲渲染到人生哲學,但我覺得這些問題背後可以找到一條比較核心的線索:AI究竟會對現有的產業秩序做什麼?是否將取代人類工作,我們將無事可做?

CUDA當年0營收占90成本但我們沒放棄黃仁勛GTC2026記者會問答

黃仁勛的說,其實自己比以往任何時候都忙。不是因為項目變多了,而是工作回來的速度變快了。以前寫完一份產品定義,團隊拿去做一個月;現在給Agent,可能30分鐘就回來了,又輪到(人類)工作了。

人類角色在變,電腦的角色也在變:當AI開始能自主完成任務,電腦本身的角色就發生了根本轉變。過去幾十年,電腦的核心使命是數據錄入和數據檢索,你輸入,它存儲,你查詢,它返回。黃仁勛說,這個使命正在被替換:電腦的新使命是製造token。Token是AI生成內容的基本單元,每一次推理都是一次生產。當電腦從檢索工具變成生產系統,整個基礎設施的設計邏輯就要跟著變,不再優化存儲容量,而是優化吞吐量;不再按核心數定價,而是按產出的token定價;不再是一台獨立的機器,而是一座有原料、流水線、調度系統和交付網路的AI工廠。

如果大家常看黃仁勛的主題演講,會注意到有一個每次幾乎都會出現的主角:CUDA。今年GTC恰逢CUDA 20周年,黃仁勛以此開場,回溯了這套並行計算平台從只有學術界少數人使用、消耗了英偉達CUDA當年0營收占90成本但我們沒放棄黃仁勛GTC2026記者會問答當時絕大部分利潤,到今天裝機量達數億GPU、滲透每一家雲廠商和每一個主要行業的歷程。主題演講重點介紹了cuDF(加速結構化數據處理)和cuVS(加速向量搜索)兩個CUDA-X庫在企業數據處理上的落地成果。記者會上,黃仁勛在被問到汽車業務只占英偉達總收入約1%時,又一次搬出了CUDA的故事:當年CUDA是0%營收、90%成本,任何理性的人都會放棄它,但英偉達沒有。這應該是一種很好的說理方式——用歷史說服現在。

1. AI工廠加了一條新生產線:Groq是什麼角色

作為英偉達史上最大的一筆交易,它自然是記者會第一個問題的焦點:你們花200億美元拿下Groq,是不是等於承認GPU在推理上有根本局限,AI的重心已經從訓練轉向了推理?

說明一下背景:Groq由谷歌TPU的創始工程師Jonathan Ross於2016年創立,專門開發LPU(語言處理單元)晶片,針對AI推理的低延遲場景做了專項優化,是英偉達GPU在推理領域最受關注的挑戰者之一。2025年12月,英偉達以約200億美元完成了與Groq的資產許可協議,Jonathan Ross及核心工程團隊隨之加入英偉達;Groq公司本身繼續作為獨立實體運營。英偉達將這筆交易定性為許可合作而非併購。

記者的問題隱含著一個邏輯:既然Groq能做你做不到的事,英偉達是不是間接認輸了?黃仁勛直接否掉了這個前提。

推理,指的是AI模型部署上線後實時響應用戶的那個過程——你向ChatGPT提問,它生成回答,這就是推理。訓練是讓模型學會知識,推理是讓模型把知識用出來。過去幾年,AI行業的算力大頭壓在訓練上;現在,隨著模型越來越多地被真實用戶使用,推理的算力需求正在快速追上來。

黃仁勛說,英偉達早在2024年底、2025年初就預判到了這個拐點,並提前布局了三件事:NVLink 72(把72塊GPU連成一個整體的互聯技術)、NVFP4(更精簡的計算精度格式)、Dynamo(AI工廠的推理調度軟體)。這三件事組合起來,讓Grace Blackwell成為今天推理效率最高的系統,性能提升35倍,成本降至五十分之一,每瓦性能提升50倍。"我們現在是成本最低的token生產商,是吞吐量最高的token工廠。"

那Groq呢?Groq填補的是一個更細分的缺口。黃仁勛在主題演講里提出了一個新判斷:並非每個token都是一樣的。有一類場景,同時要求模型參數量大、上下文窗口極長、響應延遲極低,三個目標同時滿足。Groq的LPU(語言處理單元)晶片專門為低延遲推理設計,單獨使用時可以做到極快,但受限於500MB的片上記憶體,跑不了完整的大模型。Vera Rubin的GPU記憶體大、計算強,但延遲不是它的強項。把兩者放進同一個系統,用Dynamo做調度,Vera Rubin處理需要大算力的預填充階段,Groq LPX處理需要低延遲的解碼階段,吞吐量提升35倍,三個目標同時達成。

具體配比上,黃仁勛給了一個參考數字:整個AI工廠中,大約75%仍然是純Vera Rubin,另外25%配備Groq LPX,而且那25%里Vera Rubin依然是核心。"我們不知道怎麼打敗Vera Rubin,否則我們就會造出打敗它的東西。"

"Groq對英偉達的意義,就像當年Mellanox對英偉達的意義一樣。我們是在給架構做加法,因為我們造的不只是一塊GPU,我們造的是一座AI工廠。"

Mellanox是2020年英偉達以70億美元收購的網路技術公司。收購時也有人質疑,但InfiniBand高速網路後來成為大模型訓練集群里不可或缺的內部骨幹。AI工廠的邏輯很清楚:不是每條生產線都要一樣的機器,不同工序配不同設備,這是工廠管理常識,不是認輸。

2. 這座AI工廠值多少錢:萬億訂單的真實口徑

前一天的主題演講上,黃仁勛說,他現在看到的採購訂單和需求管線,到2027年累計超過1萬億美元——去年同一個場合他說的數字是5000億。記者會上,記者再次追問這個數字:1萬億,口徑到底是怎麼定的?

黃仁勛拆解了這個數字的口徑。

這1萬億隻包含兩樣東西:Blackwell和Vera Rubin的GPU訂單,時間截止2027年底。 明確不包括:Vera CPU獨立業務、Groq LPX機架、存儲系統(BlueField-4 STX)、Vera Rubin Ultra,以及更下一代的Feynman系列。

為什麼要用這麼窄的口徑?他解釋了原因:去年GTC他預測的是Blackwell加Rubin到2026年有5000億美元。如果今年把CPU、Groq、存儲全部打包進來,就沒法和去年做同類比較,讀者會不知道這個數字翻番,是因為業務真的增長了,還是只是算法換了。

但他也給了一個"如果全算上會是多少"的估算:一個一千兆瓦的數據中心,加上Groq LPX之後經濟價值大約增加25%。存儲系統是另一塊新業務,AI使用存儲的方式和人類完全不同,KV緩存的規模讓傳統存儲架構跟不上,英偉達正在重新定義這個市場。理論上,如果把這些都算進去,"那個1萬億可以變成1.2萬億"。

最後他補了一句意味深長的話:"我站在這裡,距離2027年底還有21個月。這意味著它很可能比1萬億更大。"

同一個話題里還有回購問題。英偉達此前承諾將約50%的自由現金流用於股東回報,去年實際分配了約40%。他表示今年基數更大,比例會提高。他對現金分配的優先級排序是:第一,供應鏈投資、產能保障;第二,生態系統投資("投資下一個Google、下一個Meta");第三,圍繞CUDA建設生態;剩餘再回購和分紅。"所以答案是,這很可能是一個非常大的數字。"

3. AI工廠的作業系統:OpenClaw為什麼讓他最興奮

整場記者會裡,黃仁勛談OpenClaw的時間超過了任何一項其他產品。這背後有充分的鋪墊:OpenClaw是奧地利開發者Peter Steinberger於2026年1月發布的開源AI Agent平台,幾周內成為GitHub歷史上增長最快的開源項目,超過了Linux三十年的擴散速度。GTC開幕前一天的預熱圓桌直播里,黃仁勛專程走進直播間,和正在接受採訪的Steinberger打了個招呼;主題演講上,他把OpenClaw列為當下最重要的軟體現象之一,與CUDA、Linux相提並論。Steinberger本人已於今年2月加入OpenAI,但OpenClaw作為開源項目獨立延續。

黃仁勛的歷史坐標很清晰:ChatGPT把生成式AI帶到了世界面前,o1把推理系統帶到了世界面前,而OpenClaw是"後推理時代"第一個真正構建良好的開源Agent平台。此前的Agent工具,比如Claude Code,基本都在科技公司內部使用,沒有暴露給大眾。OpenClaw讓一行代碼安裝、一條指令啟動一個Agent成為現實,覆蓋人群從軟體工程師擴展到了所有人。

英偉達在這個基礎上做了一件事:NemoClaw,OpenClaw的企業安全參考棧。核心解決的是安全性、治理和隱私這三個讓企業不敢用開源工具的顧慮,讓開源模型也能在企業環境裡合規運行。他把NemoClaw定位為Linux加Kubernetes級別的基礎設施,承諾未來30年、60年持續貢獻。

關於為什麼要做這個長期承諾,他給出了一個有說服力的邏輯:Groq 1、Groq 2剛剛發布;Cosmos 1、Cosmos 2剛剛發布;Nemotron已經出到第4代。"當你開始給一個東西編號,就是因為你有意圖繼續下去。CUDA 1到今天是CUDA 13了。"這個編號本身就是一種公開的承諾。

黃仁勛描述的場景很直觀:以前寫完一份產品定義,團隊拿去做一個月;現在,Agent 30分鐘就回來了,然後又輪到你了。"我比以往任何時候都忙,因為工作回到我手上的速度快了太多。你始終處在關鍵路徑上。"

4. AI工廠要對的原料:遊戲數據為什麼不能直接用

有人問到了一個很實際的問題:遊戲玩家產生的海量行為數據,可以用來訓練物理AI的世界模型嗎?畢竟遊戲裡有大量的人體動作、物體運動、場景交互。

這個問題觸發了黃仁勛一段少見的技術深講。

他的回答是:不能直接用。原因是遊戲不完全遵守物理規律。Fortnite里角色的腳步動作和奔跑速度不匹配,人物一半在跑一半在滑;角色可以從山上跳下而不受傷;樹木的搖擺方式也不符合真實物理。"你不能用這些觀察來訓練那些需要基於物理規律的基礎模型,因為它們根本不符合現實。"

這個限制並非無解。英偉達的方案是數據飛輪:先用真實世界的觀察數據打底,數量有限但可靠;再用3D物理仿真來增強——Newton和Isaac Lab是英偉達的物理仿真平台,其中碰撞、關節運動、逆向運動學全部遵守物理規律,不像遊戲引擎那樣為了好玩而妥協準確性;把兩類數據合併訓練出世界基礎模型;等這個模型具備一定能力後,再用3D圖形控制它來生成大量合成數據。飛輪就此啟動,合成數據的規模可以遠遠超過原始觀察數據。

同樣的邏輯貫穿DLSS 5的爭議。遊戲社區有批評聲音認為這項技術會抹平各家遊戲的美術風格,變得千篇一律。黃仁勛的回應沒有繞彎:"首先,他們完全錯了。"DLSS 5不是幀級別的後處理,而是以遊戲本身的幾何數據為輸入,在幾何級別做生成式控制,開發者可以微調生成效果匹配藝術風格。"我們創造了技術,我們不創造藝術。"

黃仁勛說,他自己在思考英偉達戰略的時候,用的也是類似的方式:在腦子裡建一個完全模擬的未來,然後不斷把它和現實校驗,看兩者是否保持一致。"如果我的模擬和現實一直保持連貫,那麼我的未來願景一定正在成真。"

5. 速度翻百倍之後:那時候你打字,它已經想完了

關於Vera Rubin的討論,通常落在參數規格和性能數字上——每瓦多少tokens、每美元多少FLOPS。但這場記者會裡有一個問題,引出了黃仁勛對Vera Rubin最具體的使用場景描述,比任何規格表都更容易理解這個系統在改變什麼。

問題是:Vera Rubin究竟是讓今天的工作負載跑得更快,還是在重塑計算模型本身?

黃仁勛的答案是兩者都有,但他重點講了一個數字:今天使用ChatGPT或任何主流AI,大約每秒輸出20個token。Vera Rubin的推理系統可以做到每秒1000到2000個token,快了將近100倍。

有人追問推理競爭格局,問市場上湧現出這麼多挑戰者,怎麼確定英偉達的方案真的最好。黃仁勛說,看三個事實:MLPerf推理基準測試,英偉達在所有項目上排名第一,大多數競爭者甚至無法完成測試;SemiAnalysis的InferenceX報告,在每一個可量化的維度上英偉達都領先——他說,正是這份報告給了他"推理之王"這個稱號,他通常只能得到玻璃獎盃,不知道拿來幹什麼,但這個名號他很受用;再看Artificial Analysis,它掃描了所有API推理服務商,英偉達是唯一在所有維度上都名列前茅的方案。

這個100倍的差距在數字上聽起來只是硬體參數,但他描述的場景讓這個數字有了質感:

"想像一下按下回車,答案回來快100倍。現在很多問題AI需要思考、推理、做研究。想像一下100倍速度返回。未來你和AI的交互——在你打字的同時,它已經在思考了。等你按下回車,它已經完成了。'給我寫一個網站程序'——按回車——完成。'給我設計一個廚房'——按回車——完成。這就是未來。"

速度上的量變會引發使用方式上的質變。就像寬帶讓影片流媒體成為可能,而撥號上網時代的人根本不會想到"在線看電影"這件事,因為它太慢了。100倍速度會讓今天不敢想像的使用場景變得理所當然。

物理世界的速度變化也在加速。黃仁勛在自動駕駛上的立場從未改變:這是一個"已解決的問題",剩下的只是工程優化。他的理由是一個簡單的乘法:全球每天行駛一萬億英里,如果未來某一天大部分都是自動駕駛,按每英里一個價格算,這是一個數萬億美元的業務。汽車業務目前只占英偉達總收入約1%,但他的參照系是當年CUDA:0%營收、90%成本,"任何理性的人都會放棄它",但他沒有。

機器人上,他給了一個比市場通常預期更激進的時間表。他的邏輯從"存在證明"出發:你已經能看到機器人在走路了。一旦一項技術有了存在證明,精細化改進通常不超過五年。更重要的是,動作控制(System 1,通過視覺-語言-動作模型實現)和認知推理(System 2,通過OpenClaw實現)正在被同時解決。"在不到五年的時間內,比如三年,你將看到極其出色的機器人。"

6. AI工廠不消滅舊世界,它讓舊世界更忙

記者會裡有幾個問題,暗含著同一個焦慮:AI的到來會不會讓一些行業、一些工作、一些軟體消失?

黃仁勛的回答,貫穿三個不同的問題,給出的是同一個答案。

先是SaaS軟體。市場上流傳著一種觀點:Agent工作流可以替代傳統SaaS,軟體授權公司的商業模式即將被顛覆。他讓提問者"轉告那些個人投資者——他們完全錯了",然後給了一個工程師能聽懂的例子。

晶片設計行業的EDA工具(如Synopsys、Cadence)是典型的SaaS商業模式,更多工程師意味著更多工具許可證。現在假設有了Agent工程師,它們會做什麼?它們仍然需要使用EDA工具,因為晶片設計的每一步都需要可驗證、可重複的結果,這些結果必須放回EDA工具的數據結構里,你不能憑空變出電晶體。 SQL同理:Agent完成任務後,結果必須寫回資料庫,ground truth不會消失。因為有了Agent,需要授權的工具數量可能爆炸式增長,不是減少。

人類工作的問題也一樣。機器人會不會搶走製造業和運輸業的崗位——黃仁勛先給了一個常被忽略的現實數據:全球製造業目前缺少數千萬工人,缺數百萬卡車司機,就業率已經很高,但許多公司仍然沒有足夠的勞動力。機器人首先是在填補缺口。

然後他給了一個長周期的類比:"你上次坐在門廊的搖椅上、喝著檸檬水、看著日落是什麼時候?你開玩笑吧?我只在100年前的電影裡看到過。"過去一百年,技術不斷進步,但就業數量和經濟總量都在上升,每個人都比以往更忙。關於那些註定消失的工種,他用了一個冷靜的類比:馬以前有各種用途——騎馬、犁地。現在一匹馬價值500萬美元。"世界在變化,AI會改變所有這些。但我相當確信,會是一個更好的世界。"

還有一個問題來自歐洲記者,問德國這樣的工業強國如何在AI時代找到位置。黃仁勛從上一次工業革命說起。德國和日本曾經引領了機電一體化時代——技術與機械工藝、工業化的深度結合。但IT革命來了之後,軟體的文化和製造業格格不入:製造業講究步步完美,軟體必須先發布後修復,這是深層的文化差異,不只是技術差距。美國因此完全主導了IT革命,德國、日本被甩在後面。

但OpenClaw改變了這個方程式。"OpenClaw不需要你去編程,只需要你告訴它做什麼。你可以跳過IT革命,直接跳到AI革命。"他說這應該是德國聽到的最好消息,也是日本聽到的最好消息:"把AI技術和你們機電一體化產業的天賦結合起來,你們一下子就變成了機器人產業。我是你們最大的啦啦隊長。"

結尾

記者會最後,有一個提問:黃仁勛曾經說希望有些時候可以有一些"受苦"——在一個相對理想的世界裡,什麼樣的苦值得吃?

他停頓了一下,說那番話當時是在一個講座,對著大學生講的,"大家是已經畢業的人,現在應該享受生活"。

然後他認真說了下去。每當你學一些新東西,總伴隨著相當程度的痛苦;每當你做超出舒適區的事情,總有相當程度的焦慮;每當你站在台前做主題演講,知道所有人都在評判你,"總有一定程度的焦慮和痛苦"。"受苦無處不在。它是追求卓越的本質部分。只要你覺得自己在盡力做到最好,把一切都留在了賽場上——那麼受苦一定已經發生了。"

這場記者會兩小時裡,問題天南海北,但黃仁勛給出的答案都指向同一個底層邏輯:工廠不只是更強的GPU,是原料、流水線、調度系統和交付網路的整體——任何一個環節都不能脫離地基單獨存在。

記者會上還有一個小插曲。Motor Trend頒給他年度人物,理由是他在AI和自動駕駛領域的影響力。他接過獎盃,調侃說:"其實我的駕駛技術估計已經退化了。"台下立刻有笑聲。AI工廠建造者,得到了汽車媒體的年度人物獎。時代有時候就是這樣自我註解。

QA歸納:

Q:與Groq的許可合作是不是承認GPU在推理上有根本局限?

"Groq對英偉達的意義,就像當年Mellanox對英偉達的意義一樣。我們是在給架構做加法,因為我們造的不只是一塊GPU,我們造的是一座工廠。"黃仁勛解釋,Groq LPX解決的是"大模型+長上下文+極低延遲"必須同時滿足的特定場景,Vera Rubin依然承擔75%的AI工廠算力,Groq是附加在另外25%機架上的專用加速層。兩者結合,同等功耗下推理吞吐量提升35倍。"我們不知道怎麼打敗Vera Rubin,否則我們就會造出打敗它的東西。"

Q:1萬億美元訂單的口徑是什麼?

"1萬億隻包括Blackwell加Vera Rubin,只到2027年。不包含Vera CPU獨立業務,不包含Groq,不包含存儲,不包含BlueField,不包含Vera Rubin Ultra,不包含Feynman,不包含Feynman Next。只有Blackwell加Vera Rubin。而且這還是我站在這裡、距離2027年底還有21個月的數字——這意味著它很可能比1萬億更大。"

Q:遊戲玩家的數據能用來訓練物理AI的世界模型嗎?

不能直接用。黃仁勛解釋,遊戲引擎為了好玩而妥協了物理準確性——Fortnite的角色腳步不匹配速度,人物可以從山上無損跳落。訓練需要基於物理規律的基礎模型,必須以遵守物理定律的仿真數據為原料,而非遊戲數據。英偉達的方案是:真實觀察數據→物理仿真(Newton/Isaac Lab)→世界基礎模型→合成數據生成→循環擴大規模。"你必須先學到足夠的知識,才能理解事物是如何運作的,然後才能想像大量未來的條件。"

Q:AI Agent會讓SaaS軟體商業模式消亡嗎?

"請轉告那些個人投資者——他們完全錯了。"黃仁勛用晶片設計EDA工具舉例:Agent工程師做完晶片設計,結果必須放回Synopsys和Cadence的數據結構里,因為晶片設計需要可驗證、可重複、可控的輸出——"你不能憑空變出電晶體,你不能那樣設計晶片"。SQL同理,永遠是業務數據的ground truth。有了Agent,需要授權的工具數量可能爆炸式增長——不是減少。

Q:你的人生哲學是什麼,以及NVIDIA未來的關鍵風險是什麼?

"我的哲學很簡單:不要被炒魷魚。不要無聊。不要死。在這個三角形里保持住。"NVIDIA的對應版本是:不要被客戶解僱,不要無聊到公司表現不佳,不要倒閉。關於受苦:"每當你學一些新東西,總伴隨著相當程度的痛苦。受苦無處不在。它是追求卓越的本質部分。只要你覺得自己在盡力做到最好,把一切都留在了賽場上——那麼受苦一定已經發生了。"

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2026 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新