既然AMD願意甚至說迫切希望斥資49億美元收購一家系統廠商(這一數字比其2024年數據中心GPU的全年預期銷售總額還要高),那自然意味著這買交易對其非常重要。對ZT Systems的交易就是如此。作為一家高性能系統的卓越製造商,ZT Systems總部位於新澤西州老牌數據中心小鎮西考卡斯。

要到達西考卡斯,我們需要從紐約市穿過哈德遜河,之後涉過梅多蘭茲的大片沼澤區域。多年來這裡發生過不少故事,既有巨人隊和噴氣機隊共用的體育場館,也有傳聞稱身陷爭議的美國勞工領袖吉米·霍法就在這裡遇害。美國開國元勛亞倫·伯爾和亞歷山大·漢密爾頓還在這裡完成了堪稱歷史上最具政治份量的槍械決鬥。
除此之外,西考卡斯還坐落著不少廣播電視發射塔和演播室。憑藉與華爾街之間的距離優勢,這裡很快成為1990年代高頻數據中心的熱門選址。最終,紐約證券交易所和納斯達克也將數據中心遷入到這裡,理由是西考卡斯的電價和地價都比曼哈頓便宜。Equinix、CyrusOne、QTS、Centersquare等其他公司也紛紛效仿,開始在離紐約市很近的地方建造數據中心。這些數據中心意義重大,但同時又遠離紐約市主城區,不太會受到自然和非自然災害的影響,因此更加安全穩定。
1994年,隨著高頻交易執法在新澤西的這版沼澤附近悄然興起,ZT Systems正在製造個人電腦和SMB伺服器,業務表現相當不錯。但到2004年,該公司決定轉型為金融服務企業提供高頻交易和其他金融科技客戶所必需的高性能伺服器。2010年,ZT Systems開始提供機架式基礎設施,並於2013年贏得首批超大規模基礎設施運營商及雲服務商客戶。現如今,ZT Systems在西考卡斯、德克薩斯州矯治敦(位於州首府奧斯汀郊外)和荷蘭阿爾梅洛(阿姆斯特丹以東)設有製造工廠,每年出貨數十萬台伺服器、創造了上百億美元收入。沒錯,這個數字背後可對應著一大批GPU伺服器。
也就是說,ZT Systems可能是最默默無聞的大規模伺服器製造商。雖然該公司也曾擁有不少金融科技客戶,而且時至今日仍在向他們銷售產品,但其絕大部分收入(具體來講,是其99%的收入)都來自ZT Systems多年間與十幾家超大規模基礎設施運營商和雲服務商之間的穩定業務往來。
在AMD完成對該公司的收購之後,ZT Systems創始人兼首席執行官Frank Zhang將繼續經營製造業務並履行公司對現有客戶的承諾。這項收購預計將於明年年初正式完成。與此同時,Zhang還將尋求機會將製造業務轉手賣出。這部分業務目前擁有約1500名員工,AMD對這塊伺服器製造和銷售業務並不感興趣,理由是不想跟自己的客戶直接競爭。這與我們熟知的另外一家知名GPU系統製造商完全不同……
此外,AMD還曾經與微伺服器創新廠商SeaMicro有過合作。2012年3月,AMD時任CEO Rory Read出手以3.34億美元收購了SeaMicro,而當時蘇姿豐已經從IBM Microelectronics部門跳槽到AMD,負責領導其全球業務部門。2015年4月,AMD關閉了SeaMicro,但在蘇姿豐出任總裁兼CEO之後AMD又重啟了伺服器業務。
AMD數據中心業務總經理、前戴爾定製伺服器業務負責人Forest Norrod在採訪中解釋稱,「很明顯,我們已經開始與所有OEM和ODM合作夥伴進行談判。而令人欣慰的是,所有這些對話都很好、態勢積極。人們立刻就明白了我們這樣做的意圖,也欣賞、理解並且相信我們無意與客戶直接競爭。AMD不想這樣做,也不會這樣做。我非常了解這兩塊業務,也對公司的決定很有信心。」

AMD的當務之急就是提高其系統架構和工程水平。據Norrod估計,目前AMD公司約有500名系統工程師,而ZT Systems這邊則有1100名員工從事相關工作。考慮到AMD的系統構建流程不是要遵循一種、而是多種標準,因此需要有更多人來幫助設計並構建未來的GPU加速系統,以便對其開展測試(而非用於製造生產),期間的難度可想而知。目前尚不清楚AMD在剝離ZT Systems製造業務之後能「回多少血」,但要想聚集到這1100名擁有豐富實踐經驗的系統工程師,可絕非花上幾十億美元就能輕鬆實現的。除了收購ZT Systems這樣的精品高性能系統製造商之外,幾乎沒有其他辦法能夠達成這一目標。
這個價碼明顯比收購Supermicro更便宜……而且雙方的系統工程師很可能水平相當。
以下是Norrod就此次交易做出的闡述和說明。我們則結合完整的報價,嘗試解讀AMD為ZT Systems砸下49億美元的理由——這相當於每位系統工程師445萬美元(當然,其中一部分將通過製造業務的拆分和出售來抵消)。Norrod如是說:
「我們一直在認真規劃發展路線圖,並意識到在系統設計領域保證性能和效率具備競爭力和市場主導地位是項極為複雜的任務。對於AI系統,每一位從業者都越來越感受到這波浪潮給設計這類具有特定功率水平、信號傳輸速率以及極高複雜程度的系統帶來的巨大挑戰。讓它們保持正常運行且可以管理將非常困難。」
「這方面有一系列現實問題需要解決,而滿足這些問題的要求早在晶片開發過程的早期就已經出現。我們熟悉其中的一些問題,因為它們跟開發超級電腦時的情況有一定重合。但著眼於AI系統的發展,大家就會發現其複雜度一直在迅速飆升,因此擁有足夠數量的世界級系統設計工程師將成為決定晶片開發在設計階段就能順利推進的關鍵性前提和必要因素。所以答案已經很明確,我們必須大幅提升自身的工程技術水平。」
「而讓情況變得更為複雜的是,隨著我們水平的持續提升,我們還希望堅持AMD長期遵循的開放生態與尊重客戶選擇的傳統——而不是以專有方式將成果封鎖起來。也就是說我們需要更多的人手。畢竟如果想做一套專有系統、讓世界上每個人都能用得上,通過它滿足自己的需求,那麼只要定下一套固定的模板就行,這對人手的要求還沒那麼高。而如果想要培養開放的生態系統並支持客戶的選擇和變化,那情況則會複雜得多,需要我們投入更多的系統工程師數量來保證產品的上市時間和高質量表現。」
所以總結來講,AMD目前最關心的就是如何保證產品的上市時間,同時提高系統設計與工程水平。AMD公司在開發優質CPU和GPU產品方面做得非常出色,但AI時代提出的要求是組裝一整套網路技術棧和系統板,再將它們全部安裝在經過大規模測試和驗證的機架級與集群級系統設計當中。也正因為如此,英偉達才會出手開發DGX系列產品。AMD當然理解這樣做的意義,但仍然選擇不會親自為客戶構建系統,也不會成為高性能計算(HPC)或者AI集群的主要承包商。這一點與英特爾不同——晶片巨頭曾經想要在HPC和AI集群領域一試身手,但在失敗後被迫退出。
Doug Huang曾經在Norrod領導下的戴爾數據中心解決方案部門擔任過工程總監。2013年1月,隨著ZT Systems開始向機架級系統轉型,他也應聘擔任平台工程副總裁。Huang隨後又晉升為ZT Systems的工程與全球製造業務主管,並於2023年1月被任命為公司總裁。Huang將繼續留在AMD,負責管理一支由約1600名系統設計師與工程師組成的聯合技術團隊。