過去兩年,如果要找一個在黃仁勛演講中出現頻率越來越高的詞,除了GPU,大概就是基礎設施。
從AI Factory到GB300,再到下一代AI集群,NVIDIA不斷描繪著同一個趨勢:算力規模仍在持續擴大。而每一次算力密度提升的背後,都伴隨著另一個數字同步增長——功耗。當單機櫃功耗向百千瓦邁進,散熱開始從數據中心後台的工程問題,變成影響算力部署規模的重要變量。
液冷因此走到了產業舞台中央。
圍繞液冷展開的新投資、新項目和新技術不斷湧現,伺服器廠商、數據中心運營商、暖通企業和設備供應商都在重新尋找自己的位置。
尼得科也是其中之一。
不過,與許多從製冷或熱管理領域切入液冷的企業不同,這家以電機起家的製造企業看到的,是另一條技術路徑。
「我們是以電機起家的企業,泵技術才是液冷的重要基礎之一。」在上海IDCExpo期間,尼得科株式會社小型馬達事業本部本部長,AI & IT事業部 部長,商品開發第二統括部部長 田中裕司這樣解釋道。
尼得科株式會社小型馬達事業本部本部長,
AI & IT事業部 部長,商品開發第二統括部部長 田中裕司
這句話背後,其實對應著AI基礎設施建設正在發生的變化。
過去,當液冷還只是少數高密度場景的選擇時,人們更關注冷板、換熱器和散熱能力本身。而隨著液冷逐漸走向規模化部署,系統可靠性、長期運行能力以及運維效率開始變得越來越重要。
對於擁有數千塊GPU的AI集群來說,把熱量帶走只是第一步。真正的挑戰在於,如何讓整個液冷系統在長期運行過程中始終保持穩定的流量、壓力和冷卻效率。
這恰恰是泵發揮作用的地方,也是尼得科最見長的領域。更是尼得科看待液冷市場的出發點。
對於一家長期從事電機和泵產品研發製造的企業來說,AI基礎設施帶來的液冷需求,並非全新的技術命題,而是原有能力在新應用場景下的一次釋放。
01 入局液冷賽道,尼得科的「兩張底牌」
對於尼得科而言,液冷並非「從零開始」的跨界。電機、泵、精密製造,以及長達20餘年的伺服器散熱領域經驗,這些能力早已存在。隨著AI基礎設施全面進入液冷時代,這些能力在同一場景下匯聚,而匯聚的第一個載體,正是CDU(冷量分配單元)。
尼得科的第一張牌,是把「車規級」的泵,放進數據中心。CDU的核心部件是泵,而泵的本質又離不開馬達,這恰好是尼得科最擅長的領域。
田中裕司透露,尼得科CDU中的核心泵體,沿用了車載零部件領域積累的車規級泵技術。
這背後的邏輯在於,汽車長期面對震動、高低溫變化以及持續運行等複雜工況,對零部件可靠性和壽命的要求往往高於恆溫恆濕的數據中心環境。換句話說,把原本為汽車場景設計的產品應用到機房,本身就是一種「能力降維」,經歷過更嚴苛考驗的系統,在相對穩定的環境中往往能夠獲得更大的可靠性餘量。
基於這一思路,尼得科將車規級無密封泵引入CDU,並結合自主開發的電機驅動與泵控技術,構建起液冷系統最核心的循環能力。相比單純採購標準水泵再進行系統集成,這種方案的優勢在於,泵體、驅動和控制系統從底層開始協同設計,能夠在長期運行中保持更穩定的流量控制和更高的系統可靠性。
而這種底層可靠性,最終會體現在整個液冷系統的設計餘量上。
以第二代In-Rack CDU為例,其4U機型最高可提供250kW散熱能力,單台設備即可覆蓋一整套NVIDIA HGX B300系統,而GB300機櫃實際冷卻需求也只有約144kW。也就是說,在滿足當前需求之外,系統仍保留了相當可觀的散熱空間,以應對未來硬體升級、負載波動,以及長期運行過程中可能出現的性能衰減。

同樣的高可用設計理念也體現在系統架構層面。尼得科在泵體、電源和控制板等關鍵部件上均採用冗餘設計,並支持熱插拔維護,從而在產品架構設計階段就實現了「不停機維護」的目標。
從車規級泵技術到系統級冗餘設計,尼得科將汽車產業積累數十年的可靠性工程經驗,遷移到AI數據中心液冷基礎設施之中。
第二張牌是把精密製造經驗搬進液冷系統。泵是液冷的心臟,決定系統能否運轉;而快接頭則是命門,它直接決定了機櫃裡動輒數千萬的GPU算力資產,會不會毀於滲液風險。
其實,液冷大規模部署的除了是散熱瓶頸,還有漏液風險。在這一環節,工程容錯率趨近於零,一旦快接頭出現問題,冷卻鏈路癱瘓,會將導致底層AI伺服器直接燒毀。
尼得科的解法是,利用自己最核心的硬碟馬達經驗。作為精密製造的「金字塔尖」,硬碟主軸馬達對微米級加工、極限密封與潔淨度有著嚴苛要求。尼得科將這套沉澱了數十年的重資產體系平移,Class 100級無塵車間、油壓密封工藝、高精度數控工具機,被悉數導入快接頭的產線。
結果上,數據也構成了有力的回應。目前,尼得科UQD和MQD系列快接頭累計出貨超 75 萬對,至今保持零漏液。
在生產上,為了讓零漏液的加工精度不出現任何批次誤差,尼得科選擇直接收購日本老牌工具機企業瀧澤(TAKISAWA)。「用自己的車床加工,才敢保證零泄漏。」田中裕司表達了尼得科的戰略思路。與其滿世界採購通用設備去死磕良率,不如直接把微米級加工的標尺牢牢捏在自己手裡。
當車規級電機的底座、硬碟產業的精密加工,與自研工具機托底的品控體系形成閉環時,一條高壁壘的護城河就此成型。

02 可堆疊CDU破解製冷「兩難」
理解了這些技術積累,再看尼得科首秀的重磅產品:STC 1.0樣機,不覺順理成章。
在液冷領域,數據中心運營商長期面對兩難的局面。一方面,AI晶片疊代太快,今天部署200kW的CDU,明年新一代GPU上架後製冷能力可能就開始吃緊。可是,如果一步到位上1MW級別設備,又容易出現過度配置情況。
STC 1.0解決的正是這個問題。
STC 1.0給出的思路是把CDU做成可堆疊的模組化架構。這款CDU符合OCP標準、最多支持5層堆疊的In-Rack CDU。用戶可以先部署單層模組滿足當前需求,隨著算力規模增長,再逐步增加新的製冷單元。

「我們的設計允許客戶按熱負荷靈活擴展。」田中裕司解釋。初期只需運行1層200kW模組,未來算力擴大,再通過熱插拔方式增加第2層、第3層,最高可堆疊至5層,實現1MW冷卻能力。通過定製機架規範,甚至能夠擴展至8層、1.6MW。
每層單元結構獨立,單層故障可單獨隔離而不影響其他模組;趨近溫度做到4℃,適配OCP ORV3標準機架,系統運行期間即可完成CDU單元更換。對於運營商來說,這意味著擴容和維護都不必再以停機為代價。
事實上,STC 1.0是尼得科In-Rack路線持續演進後的成果。
往前回看整條產品線,節奏其實非常清晰。EIA規格的Gen 1.0(200kW,對應NVIDIA HGX B200)、Gen 2.0(250kW,對應B300);OCP規格的Gen 2.5(250kW/160LPM,對應GB300 NVL72,支持51VDC母線輸入、兼容NVIDIA MGX);再到Gen 3.0(300kW/280LPM,適配OCP ORV3,支持最新GPU平台);最終發展到可堆疊擴展至1MW的STC 1.0。

一代接一代產品升級,對應的是GPU功耗不斷上升後,液冷系統在製冷能力和流量上的持續提升。
而當機架功率繼續向上時,僅靠In-Rack已經無法覆蓋所有場景,於是尼得科又把能力延伸到了In-Row產品。
尼得科NIR 2.5和Project Deschutes 5,都屬於2MW級列間CDU。前者達到2MW/2250LPM,後者達到2MW/1890LPM,並已經通過Google認證。換算到實際部署場景,一台設備就足以支撐10台NVIDIA NVL72機櫃,或者6台下一代超高密度Vera Rubin,NVL72機櫃的散熱需求。


某種程度上說,這一台CDU已經能夠承擔起一個小型AI算力集群的冷卻任務。
除了功率規模,兩款產品在運維設計上也延續了尼得科一貫的思路。
NIR2.5機身高度1.9米,占地面積相對緊湊,可適配集裝箱數據中心部署,最多支持10台CDU集群聯控,無密封結構泵體支持運行過程中完成濾網清潔和核心部件熱插拔。
Project Deschutes 5則進一步強化了系統穩定性。該產品配備符合IEEE 519標準的ULHD(超低諧波失真)VFD,用於保障供電質量,同時通過0.2μm旁路過濾系統持續維持冷卻液潔淨度。
03從「陪伴出海」到押注中國液冷市場
田中裕司展示的一張全球售後體系地圖,透露出了尼得科在全球市場的現狀。地圖中,藍色代表已經投入運營的服務網點,綠色代表規劃建設中的網點。中國區域目前仍顯示為綠色。

這並不意味著尼得科缺席中國市場。
事實上,尼得科已經與不少中國網際網路企業和伺服器廠商建立合作。只是現階段,這些合作更多發生在數據中心的出海項目中。甚至,尼得科很早就參與了中國企業的出海進程。
對於液冷行業而言,這樣的路徑並不難理解。
數據中心客戶採購的除了設備本身,還包括備件供應、故障響應、現場維護,以及長期運維能力。相比已經建立起成熟服務體系的海外市場,中國本土服務網路的建設顯然還有不少工作要完成。
不過,服務體系仍在建設,並不意味著尼得科在中國缺乏基礎。
依託原有小型馬達業務積累下來的製造能力,尼得科已經在中國建立了1個技術開發中心(大連技術開發中心)和 3個製造基地(尼得科電機浙江、尼得科電機韶關、尼得科電機東莞)
相比服務網路,更值得關注的是尼得科對中國算力市場變化的判斷。
過去幾年,全球液冷產業的發展路徑,很大程度上是圍繞NVIDIA GPU演進展開的。從H100到B200,再到GB300,伺服器架構和散熱需求雖然持續變化,但整體技術路線相對一致。
「而中國市場是另一種情況。」田中裕司如是說
隨著國產GPU逐步進入訓練和推理場景,越來越多本土廠商開始探索新的集群架構。而面對機櫃內部的管路設計、流量分配、壓力控制,以及熱點管理的變化,對液冷系統也提出了不同要求。
按照田中裕司的介紹,高密度冷板設計和±1℃級別的精準控溫能力,都是圍繞高密度GPU集群開發的。當一個節點裡堆疊的GPU越來越多,其挑戰便不只是產生了多少熱量,而是如何讓冷卻液均勻流經每一個節點,把熱量穩定帶走。
對於數據中心運營商來說,散熱能力是第一道門檻,運行成本同樣重要。
田中裕司提到,過去數據中心的一、二次側熱循環大量依賴冷水機組,雖然能夠提供穩定製冷能力,但能耗並不低。隨著液冷逐步普及,越來越多數據中心開始嘗試引入乾冷卻器等自然冷卻方案,希望進一步降低能源消耗。
但自然冷卻並不只是把冷水機組換掉這麼簡單。
當外部環境變化更大、系統調節空間變小時,CDU對於流量控制和溫度控制的要求反而會進一步提高。換句話說,越想降低能耗,越考驗液冷系統本身的穩定性。
按照尼得科提供的數據,傳統風冷數據中心的PUE通常在1.6至2.0之間,而液冷方案已經能夠做到1.1至1.2,整體能耗降幅約為40%。
當AI數據中心開始以數十兆瓦甚至上百兆瓦的規模部署時,PUE每下降0.1,最終都會體現在運營成本上。
除了降低能耗,尼得科也在嘗試解決液冷落地過程中的另一個現實問題:客戶如何驗證效果。
田中裕司分享了已經在日本落地的合作模式。具體來說,項目由尼得科提供CDU和液冷基礎設施,聯想日本提供伺服器平台,第三方數據中心運營商MC Digital提供真實機房環境。客戶可以直接在實際運行的數據中心裡觀察伺服器與液冷系統協同工作的狀態,並不僅僅依賴實驗室測試數據。
對於仍處於快速發展階段的液冷市場來說,這樣的驗證往往比參數表更有說服力。
按照尼得科的規劃,類似合作未來也將逐步擴展至中國及其他地區。






