CUDA當年：0%營收、占90%成本，但我們沒放棄——黃仁勛GTC 2026記者會問答

GTC 2026主題演講結束後第二天，黃仁勛在記者會上回答了幾十位全球記者的提問。問題略散，從晶片架構到開源戰略，從遊戲渲染到人生哲學，但我覺得這些問題背後可以找到一條比較核心的線索：AI究竟會對現有的產業秩序做什麼？是否將取代人類工作，我們將無事可做？

贊助商廣告

黃仁勛的說，其實自己比以往任何時候都忙。不是因為項目變多了，而是工作回來的速度變快了。以前寫完一份產品定義，團隊拿去做一個月；現在給Agent，可能30分鐘就回來了，又輪到（人類）工作了。

人類角色在變，電腦的角色也在變：當AI開始能自主完成任務，電腦本身的角色就發生了根本轉變。過去幾十年，電腦的核心使命是數據錄入和數據檢索，你輸入，它儲存，你查詢，它返回。黃仁勛說，這個使命正在被替換：電腦的新使命是製造token。Token是AI生成內容的基本單元，每一次推理都是一次生產。當電腦從檢索工具變成生產系統，整個基礎設施的設計邏輯就要跟著變，不再優化儲存容量，而是優化吞吐量；不再按核心數定價，而是按產出的token定價；不再是一台獨立的機器，而是一座有原料、流水線、調度系統和交付網路的AI工廠。

如果大家常看黃仁勛的主題演講，會注意到有一個每次幾乎都會出現的主角：CUDA。今年GTC恰逢CUDA 20周年，黃仁勛以此開場，回溯了這套並行計算平台從只有學術界少數人使用、消耗了英偉達 CUDA當年0營收占90成本但我們沒放棄黃仁勛GTC2026記者會問答當時絕大部分利潤，到今天裝機量達數億GPU、滲透每一家雲廠商和每一個主要行業的歷程。主題演講重點介紹了cuDF（加速結構化數據處理）和cuVS（加速向量搜索）兩個CUDA-X庫在企業數據處理上的落地成果。記者會上，黃仁勛在被問到汽車業務只占英偉達總收入約1%時，又一次搬出了CUDA的故事：當年CUDA是0%營收、90%成本，任何理性的人都會放棄它，但英偉達沒有。這應該是一種很好的說理方式——用歷史說服現在。

贊助商廣告

1. AI工廠加了一條新生產線：Groq是什麼角色

作為英偉達史上最大的一筆交易，它自然是記者會第一個問題的焦點：你們花200億美元拿下Groq，是不是等於承認GPU在推理上有根本局限，AI的重心已經從訓練轉向了推理？

說明一下背景：Groq由谷歌TPU的創始工程師Jonathan Ross於2016年創立，專門開發LPU（語言處理單元）晶片，針對AI推理的低延遲場景做了專項優化，是英偉達GPU在推理領域最受關注的挑戰者之一。2025年12月，英偉達以約200億美元完成了與Groq的資產許可協議，Jonathan Ross及核心工程團隊隨之加入英偉達；Groq公司本身繼續作為獨立實體運營。英偉達將這筆交易定性為許可合作而非併購。

記者的問題隱含著一個邏輯：既然Groq能做你做不到的事，英偉達是不是間接認輸了？黃仁勛直接否掉了這個前提。

推理，指的是AI模型部署上線後實時響應用戶的那個過程——你向ChatGPT提問，它生成回答，這就是推理。訓練是讓模型學會知識，推理是讓模型把知識用出來。過去幾年，AI行業的算力大頭壓在訓練上；現在，隨著模型越來越多地被真實用戶使用，推理的算力需求正在快速追上來。

黃仁勛說，英偉達早在2024年底、2025年初就預判到了這個拐點，並提前布局了三件事：NVLink 72（把72塊GPU連成一個整體的互聯技術）、NVFP4（更精簡的計算精度格式）、Dynamo（AI工廠的推理調度軟體）。這三件事組合起來，讓Grace Blackwell成為今天推理效率最高的系統，性能提升35倍，成本降至五十分之一，每瓦性能提升50倍。"我們現在是成本最低的token生產商，是吞吐量最高的token工廠。"

那Groq呢？Groq填補的是一個更細分的缺口。黃仁勛在主題演講里提出了一個新判斷：並非每個token都是一樣的。有一類場景，同時要求模型參數量大、上下文窗口極長、響應延遲極低，三個目標同時滿足。Groq的LPU（語言處理單元）晶片專門為低延遲推理設計，單獨使用時可以做到極快，但受限於500MB的片上記憶體，跑不了完整的大模型。Vera Rubin的GPU記憶體大、計算強，但延遲不是它的強項。把兩者放進同一個系統，用Dynamo做調度，Vera Rubin處理需要大算力的預填充階段，Groq LPX處理需要低延遲的解碼階段，吞吐量提升35倍，三個目標同時達成。

贊助商廣告

具體配比上，黃仁勛給了一個參考數字：整個AI工廠中，大約75%仍然是純Vera Rubin，另外25%配備Groq LPX，而且那25%里Vera Rubin依然是核心。"我們不知道怎麼打敗Vera Rubin，否則我們就會造出打敗它的東西。"

"Groq對英偉達的意義，就像當年Mellanox對英偉達的意義一樣。我們是在給架構做加法，因為我們造的不只是一塊GPU，我們造的是一座AI工廠。"

Mellanox是2020年英偉達以70億美元收購的網路技術公司。收購時也有人質疑，但InfiniBand高速網路後來成為大模型訓練集群里不可或缺的內部骨幹。AI工廠的邏輯很清楚：不是每條生產線都要一樣的機器，不同工序配不同設備，這是工廠管理常識，不是認輸。

2. 這座AI工廠值多少錢：萬億訂單的真實口徑

前一天的主題演講上，黃仁勛說，他現在看到的採購訂單和需求管線，到2027年累計超過1萬億美元——去年同一個場合他說的數字是5000億。記者會上，記者再次追問這個數字：1萬億，口徑到底是怎麼定的？

黃仁勛拆解了這個數字的口徑。

這1萬億隻包含兩樣東西：Blackwell和Vera Rubin的GPU訂單，時間截止2027年底。明確不包括：Vera CPU獨立業務、Groq LPX機架、儲存系統（BlueField-4 STX）、Vera Rubin Ultra，以及更下一代的Feynman系列。

為什麼要用這麼窄的口徑？他解釋了原因：去年GTC他預測的是Blackwell加Rubin到2026年有5000億美元。如果今年把CPU、Groq、儲存全部打包進來，就沒法和去年做同類比較，讀者會不知道這個數字翻番，是因為業務真的增長了，還是只是算法換了。

但他也給了一個"如果全算上會是多少"的估算：一個一千兆瓦的數據中心，加上Groq LPX之後經濟價值大約增加25%。儲存系統是另一塊新業務，AI使用儲存的方式和人類完全不同，KV緩存的規模讓傳統儲存架構跟不上，英偉達正在重新定義這個市場。理論上，如果把這些都算進去，"那個1萬億可以變成1.2萬億"。

贊助商廣告

最後他補了一句意味深長的話："我站在這裡，距離2027年底還有21個月。這意味著它很可能比1萬億更大。"

同一個話題里還有回購問題。英偉達此前承諾將約50%的自由現金流用於股東回報，去年實際分配了約40%。他表示今年基數更大，比例會提高。他對現金分配的優先級排序是：第一，供應鏈投資、產能保障；第二，生態系統投資（"投資下一個Google、下一個Meta"）；第三，圍繞CUDA建設生態；剩餘再回購和分紅。"所以答案是，這很可能是一個非常大的數字。"

3. AI工廠的作業系統：OpenClaw為什麼讓他最興奮

整場記者會裡，黃仁勛談OpenClaw的時間超過了任何一項其他產品。這背後有充分的鋪墊：OpenClaw是奧地利開發者Peter Steinberger於2026年1月發布的開源AI Agent平台，幾周內成為GitHub歷史上增長最快的開源項目，超過了Linux三十年的擴散速度。GTC開幕前一天的預熱圓桌直播里，黃仁勛專程走進直播間，和正在接受採訪的Steinberger打了個招呼；主題演講上，他把OpenClaw列為當下最重要的軟體現象之一，與CUDA、Linux相提並論。Steinberger本人已於今年2月加入OpenAI，但OpenClaw作為開源項目獨立延續。

黃仁勛的歷史坐標很清晰：ChatGPT把生成式AI帶到了世界面前，o1把推理系統帶到了世界面前，而OpenClaw是"後推理時代"第一個真正構建良好的開源Agent平台。此前的Agent工具，比如Claude Code，基本都在科技公司內部使用，沒有暴露給大眾。OpenClaw讓一行代碼安裝、一條指令啟動一個Agent成為現實，覆蓋人群從軟體工程師擴展到了所有人。

英偉達在這個基礎上做了一件事：NemoClaw，OpenClaw的企業安全參考棧。核心解決的是安全性、治理和隱私這三個讓企業不敢用開源工具的顧慮，讓開源模型也能在企業環境裡合規運行。他把NemoClaw定位為Linux加Kubernetes級別的基礎設施，承諾未來30年、60年持續貢獻。

關於為什麼要做這個長期承諾，他給出了一個有說服力的邏輯：Groq 1、Groq 2剛剛發布；Cosmos 1、Cosmos 2剛剛發布；Nemotron已經出到第4代。"當你開始給一個東西編號，就是因為你有意圖繼續下去。CUDA 1到今天是CUDA 13了。"這個編號本身就是一種公開的承諾。

贊助商廣告

黃仁勛描述的場景很直觀：以前寫完一份產品定義，團隊拿去做一個月；現在，Agent 30分鐘就回來了，然後又輪到你了。"我比以往任何時候都忙，因為工作回到我手上的速度快了太多。你始終處在關鍵路徑上。"

4. AI工廠要對的原料：遊戲數據為什麼不能直接用

有人問到了一個很實際的問題：遊戲玩家產生的海量行為數據，可以用來訓練物理AI的世界模型嗎？畢竟遊戲裡有大量的人體動作、物體運動、場景交互。

這個問題觸發了黃仁勛一段少見的技術深講。

他的回答是：不能直接用。原因是遊戲不完全遵守物理規律。Fortnite里角色的腳步動作和奔跑速度不匹配，人物一半在跑一半在滑；角色可以從山上跳下而不受傷；樹木的搖擺方式也不符合真實物理。"你不能用這些觀察來訓練那些需要基於物理規律的基礎模型，因為它們根本不符合現實。"

這個限制並非無解。英偉達的方案是數據飛輪：先用真實世界的觀察數據打底，數量有限但可靠；再用3D物理仿真來增強——Newton和Isaac Lab是英偉達的物理仿真平台，其中碰撞、關節運動、逆向運動學全部遵守物理規律，不像遊戲引擎那樣為了好玩而妥協準確性；把兩類數據合併訓練出世界基礎模型；等這個模型具備一定能力後，再用3D圖形控制它來生成大量合成數據。飛輪就此啟動，合成數據的規模可以遠遠超過原始觀察數據。

同樣的邏輯貫穿DLSS 5的爭議。遊戲社區有批評聲音認為這項技術會抹平各家遊戲的美術風格，變得千篇一律。黃仁勛的回應沒有繞彎："首先，他們完全錯了。"DLSS 5不是幀級別的後處理，而是以遊戲本身的幾何數據為輸入，在幾何級別做生成式控制，開發者可以微調生成效果匹配藝術風格。"我們創造了技術，我們不創造藝術。"

黃仁勛說，他自己在思考英偉達戰略的時候，用的也是類似的方式：在腦子裡建一個完全模擬的未來，然後不斷把它和現實校驗，看兩者是否保持一致。"如果我的模擬和現實一直保持連貫，那麼我的未來願景一定正在成真。"

贊助商廣告

5. 速度翻百倍之後：那時候你打字，它已經想完了

關於Vera Rubin的討論，通常落在參數規格和性能數字上——每瓦多少tokens、每美元多少FLOPS。但這場記者會裡有一個問題，引出了黃仁勛對Vera Rubin最具體的使用場景描述，比任何規格表都更容易理解這個系統在改變什麼。

問題是：Vera Rubin究竟是讓今天的工作負載跑得更快，還是在重塑計算模型本身？

黃仁勛的答案是兩者都有，但他重點講了一個數字：今天使用ChatGPT或任何主流AI，大約每秒輸出20個token。Vera Rubin的推理系統可以做到每秒1000到2000個token，快了將近100倍。

有人追問推理競爭格局，問市場上湧現出這麼多挑戰者，怎麼確定英偉達的方案真的最好。黃仁勛說，看三個事實：MLPerf推理基準測試，英偉達在所有項目上排名第一，大多數競爭者甚至無法完成測試；SemiAnalysis的InferenceX報告，在每一個可量化的維度上英偉達都領先——他說，正是這份報告給了他"推理之王"這個稱號，他通常只能得到玻璃獎盃，不知道拿來幹什麼，但這個名號他很受用；再看Artificial Analysis，它掃描了所有API推理服務商，英偉達是唯一在所有維度上都名列前茅的方案。

這個100倍的差距在數字上聽起來只是硬體參數，但他描述的場景讓這個數字有了質感：

"想像一下按下回車，答案回來快100倍。現在很多問題AI需要思考、推理、做研究。想像一下100倍速度返回。未來你和AI的交互——在你打字的同時，它已經在思考了。等你按下回車，它已經完成了。'給我寫一個網站程序'——按回車——完成。'給我設計一個廚房'——按回車——完成。這就是未來。"

速度上的量變會引發使用方式上的質變。就像寬帶讓影片流媒體成為可能，而撥號上網時代的人根本不會想到"在線看電影"這件事，因為它太慢了。100倍速度會讓今天不敢想像的使用場景變得理所當然。

贊助商廣告

物理世界的速度變化也在加速。黃仁勛在自動駕駛上的立場從未改變：這是一個"已解決的問題"，剩下的只是工程優化。他的理由是一個簡單的乘法：全球每天行駛一萬億英里，如果未來某一天大部分都是自動駕駛，按每英里一個價格算，這是一個數萬億美元的業務。汽車業務目前只占英偉達總收入約1%，但他的參照系是當年CUDA：0%營收、90%成本，"任何理性的人都會放棄它"，但他沒有。

機器人上，他給了一個比市場通常預期更激進的時間表。他的邏輯從"存在證明"出發：你已經能看到機器人在走路了。一旦一項技術有了存在證明，精細化改進通常不超過五年。更重要的是，動作控制（System 1，通過視覺-語言-動作模型實現）和認知推理（System 2，通過OpenClaw實現）正在被同時解決。"在不到五年的時間內，比如三年，你將看到極其出色的機器人。"

6. AI工廠不消滅舊世界，它讓舊世界更忙

記者會裡有幾個問題，暗含著同一個焦慮：AI的到來會不會讓一些行業、一些工作、一些軟體消失？

黃仁勛的回答，貫穿三個不同的問題，給出的是同一個答案。

先是SaaS軟體。市場上流傳著一種觀點：Agent工作流可以替代傳統SaaS，軟體授權公司的商業模式即將被顛覆。他讓提問者"轉告那些個人投資者——他們完全錯了"，然後給了一個工程師能聽懂的例子。

晶片設計行業的EDA工具（如Synopsys、Cadence）是典型的SaaS商業模式，更多工程師意味著更多工具許可證。現在假設有了Agent工程師，它們會做什麼？它們仍然需要使用EDA工具，因為晶片設計的每一步都需要可驗證、可重複的結果，這些結果必須放回EDA工具的數據結構里，你不能憑空變出電晶體。 SQL同理：Agent完成任務後，結果必須寫回資料庫，ground truth不會消失。因為有了Agent，需要授權的工具數量可能爆炸式增長，不是減少。

人類工作的問題也一樣。機器人會不會搶走製造業和運輸業的崗位——黃仁勛先給了一個常被忽略的現實數據：全球製造業目前缺少數千萬工人，缺數百萬卡車司機，就業率已經很高，但許多公司仍然沒有足夠的勞動力。機器人首先是在填補缺口。

贊助商廣告

然後他給了一個長周期的類比："你上次坐在門廊的搖椅上、喝著檸檬水、看著日落是什麼時候？你開玩笑吧？我只在100年前的電影裡看到過。"過去一百年，技術不斷進步，但就業數量和經濟總量都在上升，每個人都比以往更忙。關於那些註定消失的工種，他用了一個冷靜的類比：馬以前有各種用途——騎馬、犁地。現在一匹馬價值500萬美元。"世界在變化，AI會改變所有這些。但我相當確信，會是一個更好的世界。"

還有一個問題來自歐洲記者，問德國這樣的工業強國如何在AI時代找到位置。黃仁勛從上一次工業革命說起。德國和日本曾經引領了機電一體化時代——技術與機械工藝、工業化的深度結合。但IT革命來了之後，軟體的文化和製造業格格不入：製造業講究步步完美，軟體必須先發布後修復，這是深層的文化差異，不只是技術差距。美國因此完全主導了IT革命，德國、日本被甩在後面。

但OpenClaw改變了這個方程式。"OpenClaw不需要你去編程，只需要你告訴它做什麼。你可以跳過IT革命，直接跳到AI革命。"他說這應該是德國聽到的最好消息，也是日本聽到的最好消息："把AI技術和你們機電一體化產業的天賦結合起來，你們一下子就變成了機器人產業。我是你們最大的啦啦隊長。"

結尾

記者會最後，有一個提問：黃仁勛曾經說希望有些時候可以有一些"受苦"——在一個相對理想的世界裡，什麼樣的苦值得吃？

他停頓了一下，說那番話當時是在一個講座，對著大學生講的，"大家是已經畢業的人，現在應該享受生活"。

然後他認真說了下去。每當你學一些新東西，總伴隨著相當程度的痛苦；每當你做超出舒適區的事情，總有相當程度的焦慮；每當你站在台前做主題演講，知道所有人都在評判你，"總有一定程度的焦慮和痛苦"。"受苦無處不在。它是追求卓越的本質部分。只要你覺得自己在盡力做到最好，把一切都留在了賽場上——那麼受苦一定已經發生了。"

贊助商廣告

這場記者會兩小時裡，問題天南海北，但黃仁勛給出的答案都指向同一個底層邏輯：工廠不只是更強的GPU，是原料、流水線、調度系統和交付網路的整體——任何一個環節都不能脫離地基單獨存在。

記者會上還有一個小插曲。Motor Trend頒給他年度人物，理由是他在AI和自動駕駛領域的影響力。他接過獎盃，調侃說："其實我的駕駛技術估計已經退化了。"台下立刻有笑聲。AI工廠建造者，得到了汽車媒體的年度人物獎。時代有時候就是這樣自我註解。

QA歸納：

Q：與Groq的許可合作是不是承認GPU在推理上有根本局限？

"Groq對英偉達的意義，就像當年Mellanox對英偉達的意義一樣。我們是在給架構做加法，因為我們造的不只是一塊GPU，我們造的是一座工廠。"黃仁勛解釋，Groq LPX解決的是"大模型+長上下文+極低延遲"必須同時滿足的特定場景，Vera Rubin依然承擔75%的AI工廠算力，Groq是附加在另外25%機架上的專用加速層。兩者結合，同等功耗下推理吞吐量提升35倍。"我們不知道怎麼打敗Vera Rubin，否則我們就會造出打敗它的東西。"

Q：1萬億美元訂單的口徑是什麼？

"1萬億隻包括Blackwell加Vera Rubin，只到2027年。不包含Vera CPU獨立業務，不包含Groq，不包含儲存，不包含BlueField，不包含Vera Rubin Ultra，不包含Feynman，不包含Feynman Next。只有Blackwell加Vera Rubin。而且這還是我站在這裡、距離2027年底還有21個月的數字——這意味著它很可能比1萬億更大。"

Q：遊戲玩家的數據能用來訓練物理AI的世界模型嗎？

不能直接用。黃仁勛解釋，遊戲引擎為了好玩而妥協了物理準確性——Fortnite的角色腳步不匹配速度，人物可以從山上無損跳落。訓練需要基於物理規律的基礎模型，必須以遵守物理定律的仿真數據為原料，而非遊戲數據。英偉達的方案是：真實觀察數據→物理仿真（Newton/Isaac Lab）→世界基礎模型→合成數據生成→循環擴大規模。"你必須先學到足夠的知識，才能理解事物是如何運作的，然後才能想像大量未來的條件。"

贊助商廣告

Q：AI Agent會讓SaaS軟體商業模式消亡嗎？

"請轉告那些個人投資者——他們完全錯了。"黃仁勛用晶片設計EDA工具舉例：Agent工程師做完晶片設計，結果必須放回Synopsys和Cadence的數據結構里，因為晶片設計需要可驗證、可重複、可控的輸出——"你不能憑空變出電晶體，你不能那樣設計晶片"。SQL同理，永遠是業務數據的ground truth。有了Agent，需要授權的工具數量可能爆炸式增長——不是減少。

Q：你的人生哲學是什麼，以及NVIDIA未來的關鍵風險是什麼？

"我的哲學很簡單：不要被炒魷魚。不要無聊。不要死。在這個三角形里保持住。"NVIDIA的對應版本是：不要被客戶解僱，不要無聊到公司表現不佳，不要倒閉。關於受苦："每當你學一些新東西，總伴隨著相當程度的痛苦。受苦無處不在。它是追求卓越的本質部分。只要你覺得自己在盡力做到最好，把一切都留在了賽場上——那麼受苦一定已經發生了。"