OpenAI與Broadcom聯合發布專為大語言模型推理設計的晶片

OpenAI與老牌晶片供應商Broadcom近日宣布推出一款名為Jalapeno的全新晶片，專為數據中心場景下的大語言模型推理任務而設計。

贊助商廣告

兩家公司表示，該晶片將被部署於大型數據中心，並將其定位為一項長期合作項目的首代產品，未來還將持續疊代優化。

Broadcom介紹，這款專用集成電路（ASIC）完全從零開始設計，其研發過程充分融入了來自OpenAI研究人員的深度洞察，並參考了OpenAI針對未來模型與產品的技術路線圖。整個設計與生產周期歷時九個月。

相比現有數據中心推理系統所採用的通用晶片，Jalapeno專為當前大語言模型的實際需求量身打造，針對性更強。

OpenAI表示，"早期測試結果顯示，Jalapeno在每瓦性能表現上將顯著優於目前業界最先進水平"，但同時指出性能評估工作尚未完成，"詳細的技術報告將於未來數月內正式發布"。因此，目前外界所能獲取的技術細節仍然有限。

OpenAI此舉背後有著更宏觀的戰略考量。作為ChatGPT和Codex等產品的背後推手，該公司致力於掌控其模型與產品所依賴的完整技術棧，從而降低對英偉達 OpenAI與Broadcom聯合發布專為大語言模型推理設計的晶片等外部供應商的依賴，並通過垂直整合在性能或效率上獲得潛在優勢。

從行業大背景來看，OpenAI及其競爭對手普遍對定製晶片抱有濃厚興趣。在全球算力資源緊張、各方爭相搶占有限數據中心容量的背景下，定製晶片是提升整體算力供給的重要路徑之一。

Broadcom本已是一家成熟的晶片製造商，在算力基礎設施 OpenAI與Broadcom聯合發布專為大語言模型推理設計的晶片領域積累深厚。近年來，隨著AI浪潮興起，其為超大規模雲服務商及前沿模型研發團隊提供定製晶片的業務板塊持續擴張，發展勢頭強勁。

兩家公司均表示，Jalapeno晶片將於今年年底前完成數據中心部署。

Q&A

Q1：Jalapeno晶片和普通GPU有什麼區別？

A：Jalapeno是一款專用集成電路（ASIC），專門針對大語言模型推理任務設計，而非像GPU那樣面向通用計算場景。OpenAI早期測試顯示，Jalapeno在每瓦性能表現上將顯著優於當前業界最先進水平。由於它的設計完全基於OpenAI對未來模型的技術路線圖，理論上能夠更高效地滿足大語言模型推理的實際需求，而非依賴通用晶片來"湊合"完成任務。

贊助商廣告

Q2：OpenAI為什麼要和Broadcom合作自研晶片，而不是繼續用英偉達的產品？

A：OpenAI的目標是掌控其模型與產品背後的完整技術棧，減少對英偉達等外部供應商的依賴。通過垂直整合，OpenAI希望在性能或能效上獲得額外優勢。此外，當前全球算力資源較為緊張，各大AI公司都在爭搶有限的數據中心容量，自研定製晶片也是緩解算力壓力、提升整體供給能力的重要手段。

Q3：Jalapeno晶片什麼時候可以投入使用？

A：根據OpenAI和Broadcom雙方的表態，Jalapeno晶片計劃於2025年底前完成數據中心部署。不過，由於性能評估工作尚未完成，詳細的技術報告預計將在未來數月內發布，屆時外界才能獲得更完整的技術參數與測試數據。