在 3 月份的 GTC 大會上,英偉達 CEO 黃仁勛拋表示,「AI 的 iPhone 時刻已經到了。」
時隔 5 個月後,黃仁勛這句話或許可以改寫為「英偉達 AI 的 iPhone 時刻已經到了。」
今天,英偉達公布了 2024 財年第二財季財報。第二季度營收為 135.1 億美元,同比增長 101%,環比增長 88%。此外淨利潤 61.88 億美元, 同比暴增 843%
值得注意的是,這也是英偉達首次在季度收入上超過英特爾,迎來了一個歷史性時刻。
創紀錄的英偉達,狂飆的新計算時代
財報公布後,英偉達股價盤後交易飆升 9.6%,股價再創新高,突破 500 美元,成為美股市場裡「最靚的仔」。
英偉達對下一個財季也做出了頗具野心的展望,收入預計達到 160 億美元,上下浮動 2%。而這數字幾乎是一年前水平的 3 倍,比分析師平均預期的 123 億美元還要高出 37 億美元。
在財報中,黃仁勛表示:「一個新的計算時代已經開始,全球各地的公司正在從通用計算向加速計算和生成式 AI 轉型。」
晶片依舊是英偉達的收入支柱,其向數據中心供應晶片的部門是公司最大的收入來源,該部門第二財季營收達到 103.2 億美元,增長 171%,遠高於市場預期的 79.8 億美元。
其中 H100 是市場上最搶手的晶片,一度被炒到超過 4 萬美元。
此前消息人士向投資銀行公司的 Raymond James 透露,H100 GPU 的成本為 3320 美元,而英偉達選擇以 25000 至 30000 美元的價格出售這些 GPU。
雖然這一說法可能沒有考慮到運輸物流等其他成本,不過僅從生產成本 / 售價的比例來看,英偉達 H100 GPU 簡直就是一個「超級搖錢樹」。
據 Tomshardware 報道,英偉達今年內計劃出售超過 55 萬塊 H100 GPU。倘若屬實,這意味著英偉達光從 H100 GPU 中獲得的收益就已經是個天文數字。
不過由於 H100 晶片需要先進的生產工藝和同樣複雜的封裝技術,供應量將直接和代工廠台積電的封裝能力相關,也是 H100 缺貨的重要原因,行業高管預計 H100 的短缺將持續到 2024 年。
黃仁勛表示,英偉達正在尋求與其生產合作夥伴合作,將更多晶片推向市場,包括通過與其他公司合作來補充台積電的封裝能力,並表示「今年剩餘時間和明年的供應量將大幅增加。」
生成式 AI 的爆火,無數科技巨頭爭先搶後地躬身入局生成式 AI 賽道,試圖打開這道充滿機遇的科技大門。英偉達這個守在 金礦大門外賣「鏟子」的人率先成為了贏家。
微軟和 Google 這些巨頭雖然已經在 AI 投入了上百億美元,但目前基本還沒轉化為利潤。至於風頭正勁的 OpenAI,Analytics India Magazine 報道稱其每日維護 ChatGPT 這一項服務就需花費 70 萬,儘管一直試圖通過 GPT-3.5 和 GPT-4 實現盈利,但目前的收益仍未能實現收支平衡。
▲ OpenAI CEO Sam Altman 圖片來自:CNN
然而,如果 OpenAI 無法扭轉局面,面對每日高額的成本及其無法快速實現盈利的情況,Analytics India Magazine 認為 OpenAI 甚至可能在不久將來就要宣布破產。
對英偉達而言,在 AI 晶片這個賽道中目前還沒有哪家科技公司能望其項背。
研究公司 Omdia 的數據顯示,雖然 Google 、亞馬遜、Meta、IBM 等公司也在生產 AI 晶片,但英偉達已占據了超過 70% AI 晶片銷售額,並且在訓練生成式 AI 模型方面有著更顯著的優勢。
Futurum Group 分析師 Daniel Newman 表示,很多客戶寧願等待 18 個月向英偉達採購晶片,也不從初創公司或其他競爭對手那裡購買現成的晶片。即便是十多年前就開始布局 AI 晶片的 Google,有些工作也不得不依賴英偉達的 GPU 來完成。
儘管晶片的價格高昂且缺貨,但反而英偉達晶片可能是目前世界上成本最低的解決方案。黃仁勛表示高性能晶片其實為客戶節約了更多資金。
如果能夠將價值 50 億美元的數據中心的訓練時間減少一半,所節省的費用將超過所有晶片的成本。
算力、模型、數據一直是 AI 發展的三大要素,AI 晶片所代表的算力既是人工智慧的底層基石,也是打開這道科技大門的鑰匙。
這把通往未來的鑰匙正掌握在英偉達的手中,並形成了自己的護城河。
英偉達的晶片護城河
58 年前,英特爾創始人之一戈登• 摩爾提出了著名的摩爾定律。
集成電路上可容納的電晶體數目,約每隔兩年便會增加一倍。
隨後新的推斷又湧現了出來,兩年的時間間隔被縮短到了 18 個月。
在摩爾定律的作用下,CPU 和 GPU 的處理性能都獲得了指數級的增長,2000 年以後,CPU 從單核走向多核,核心數量得到大幅提升。
AI 深度學習的訓練和推理大量依賴矩陣計算和浮點計算,對算力提出了極高的要求,而 GPU 能夠大規模並行計算,在矩陣和向量計算上遠超 CPU,成為高性能計算的「寵兒」。
此外,高速的內存寬帶、可擴展性強的算力池、專門優化的深度學習框架、雲端部署支撐等優點,也堅定確立了 GPU 在 AI 時代的算力核心地位。
成立於 1993 年 4 月的英偉達最初便是靠 GPU 起家,通過不斷的創新和發展,逐漸成為了高性能計算領域的領導者。
根據 Jon Peddie Research 發布的 GPU 市場數據統計報告,英偉達以 84% 的市場份額排名第一,排名第二的 AMD 為 12%,第三位的英特爾為 4%。
A100 和 H100 都是英偉達專門為 AI 計算設計的頂級數據中心 GPU,在訓練和推理大型神經網路方面,性能都遠超其他競爭對手,二者也都採用專門的 Tensor Core 和數據流架構,堪稱英偉達手裡的兩張王牌晶片。
今年以來,英偉達主打的就是「你買的越多,省的也越多」,非常熟練且「貼心」地推出各種疊代更新的 GPU。
3 月,英偉達一口氣發布了 H100 NVL GPU、L4 Tensor Core GPU、L40 GPU 以和 NVIDIA Grace Hopper 四款 AI 推理晶片。
兩個月後,5 月的台北電腦展上,黃仁勛發布了用 256個 NVIDIA GH200 Grace Hopper 超級晶片組成的超級電腦 DGX GH200。
就在兩周前,黃仁勛又發布了搭載 HBM3e 內存新版 GH200 Grace Hopper,這也是世界上首個搭載 HBM3e 內存的 GPU 晶片。
HBM3e 內存是一種新型的高帶寬內存技術,在運算速度上 HBM3e 能比 HBM3 運算速度快 50%,提供最高 5TB/秒的傳輸速率。
訓練和推理是 AI 大模型的非常重要的兩個步驟,而這恰恰是 GH200 所擅長的部分。在黃仁勛看來,未來 GH200 的典型應用場景就是大語言模型,並且「加速運算」、「AI 運算」將逐漸取代傳統 x86 GPU的「通用計算」。
過往無數的案例證明,優異生態系統一旦構築成護城河,外來者在競爭中便占了下風。
英偉達過硬的生態系統自然少不了競爭對手的蓋章認證,神經網路科學家 Naveen Rao 曾在英特爾擔任過副總裁與人工智慧平台事業部總經理。
他發現英偉達的最大優勢不僅僅在於晶片本身,而是英偉達擁有一個具有大量優秀人工智慧程式設計師的大型社區和集散地。
每個人都優先以英偉達為基礎,當你推出了一款新硬體,就會全力追趕它。
在第二財季財報中,黃仁勛也談到:「通過我們的 Mellanox 網路和交換機技術連接並運行我們的 CUDA AI 軟體堆棧的英偉達 GPU 構成了生成式 AI 的計算基礎設施。」
CUDA 是英偉達基於其生產的 GPUs 的一個並行計算平台和編程模型,目的是便於更多的技術人員參與開發。
開發人員可以通過 C/C 、Fortan 等高級語言來調用 CUDA 的 API,來進行並行編程,並進行高性能計算,這種生態系統的建立使得許多開發者依賴於 CUDA。
此前,黃仁勛向外界透露,CUDA 在全球已經擁有超過 400 萬開發者和超過 3000 個應用程序,CUDA 下載量累計達到 4000 萬次,全球 有40000 家大型企業正在使用英偉達的產品進行加速計算,已有 15000 家初創公司建立在英偉達的平台上。
龐大的數字折射出英偉達顯著的先發優勢,倘若其他對手想要推出新的硬體,則還需要考慮追趕這個已經形成的人工智慧創新生態系統。
交易的兩端,一端連著賣方,一端連著買方。
4 月份,「雙標」的馬斯克一邊聯名簽署禁止訓練 AI,一邊偷偷掃貨 1 萬張 GPU 來開發大模型,甚至還不忘在 X 上公開吐槽:「似乎每個人、每條狗都在購買GPU」。
上個月,甲骨文董事長在公開場合表示,甲骨文公司將斥資數十億美元購買英偉達的 GPU,以擴大針對新一波人工智慧公司的雲計算服務。
得算力者得天下,在你追我趕的生成式 AI 賽道上,國內也同樣蔓延著求「芯」若渴的焦慮。
在財報電話會議上,英偉達 CFO Colette Kress 稱:「我們預計,連續增長將主要由數據中心驅動,其中對中國客戶的銷售約占英偉達最新季度數據中心收入的 20%至 25%。」
此前,據英國《金融時報》報道,中國網際網路巨頭正爭相搶英偉達高性能 AI 晶片,今明兩年的訂單價值高達 50 億美元。
其中百度、騰訊、阿里巴巴以及字節跳動今年向英偉達下達的支付訂單金額合計 10 億美元,總共採購 10 萬張 A800,相當於每張 A800 晶片的價格達到 1 萬美元,明年再交付餘下的 40 億美元。
A800 本質上是 A100 的「閹割版」。由於去年 8 月份受到政策影響,英偉達只能面向中國大陸市場推出不受限制的替代版本。
不少行業人士認為,GPU 已經成為市場上公認的稀缺貨,一芯難求的局面在未來的一兩年內依舊難以緩解。
因此,在 GPU 供不應求的持續追捧下,英偉達的 GPU 甚至成為一些 AI 初創公司的硬通貨。
作為一家雲計算初創公司,CoreWeave 想要獲得創業貸款並不是一件容易的事情。得益於英偉達的投資人身份,CoreWeave 甚至可以將 H100 GPU 作為抵押物,輕易獲得了 23 億美元的貸款。
在貸款方看來,這自然不會是一筆虧本的買賣。
一方面,這筆貸款能夠讓 CoreWeave 的計算規模和實力得到快速擴張,增強償還貸款的能力,另一方面,英偉達明年將推出更多疊代的 GPU,憑藉與英偉達密切的合作關係以及這筆高額度貸款,CoreWeave 還可以在搶購明年上市的 GH200 GPU 上奪得先機。
正如前面所提到,既然頭部大廠在市場上都搶不到 GPU,那實力並不雄厚的 AI 初創公司的處境顯然更加堪憂。
一些聰明的 AI 初創公司只能選擇另闢蹊徑,抱團取暖,投入英偉達的懷抱。
今年 6 月份,人工智慧初創公司 Inflection AI 宣布,完成 13 億美元的新一輪融資,值得注意的是,嶄新的投資名單里首次出現英偉達的身影。
拿到融資後,Inflection 轉頭將從英偉達購買了 22000 個 H100 GPU,以打造一台先進的超級電腦,其中包括近 700 個Intel Xeon CPU的四節點機架伺服器
Inflection AI 表示,將和合作夥伴 CoreWeave 以及英偉達一起,構建世界上最大的 AI 集群。
看似歡喜的強強聯合更像是一種無奈的抉擇,Inflection AI CEO Mustafa Suleyman 接受《紐約時報》的採訪時表示:「公司沒有義務使用英偉達的產品,但競爭對手沒有提供可行的替代方案。」
今年是英偉達的「而立之年」,在五月的最後一天,英偉達成為全球第一家市值突破 1 萬億美元的晶片公司,這也是歷史上第九家躋身萬億市值俱樂部的科技公司。
今年 6 月,身穿畢業服的黃仁勛受邀參加了台灣大學的畢業演講,用過往的人生經驗寄語畢業生。
無論是什麼,像我們一樣全力以赴地追求它,跑吧!不要慢慢走。
不論是為了食物而奔跑,或不被他人當做食物而奔跑。
你往往無法知道自己正處在哪一種情況,無論如何,都要保持奔跑。
歷史的機遇稍縱即逝,GPU 的賽道可能又是一個是贏者通吃的賽道。
一直狂奔的黃仁勛抓住 AI 的機遇,讓誕生於路邊連鎖餐廳的英偉達成功躋身於萬億美元俱樂部,成為這波 AI 浪潮的最大贏家,或許還將繼續領跑下個時代。