這是"關鍵瓶頸"系列的最新一篇,該系列持續關注AI基礎設施擴張所面臨的核心挑戰。
弗吉尼亞州一個擬建數據中心園區在初期部署階段申請的用水量高達每日200萬加侖(MGD),未來需求峰值甚至可能達到每日800萬加侖。相關公用事業服務協議明確指出,該項目的預期需求已超出現有供水與污水處理規劃的承受範圍。文件深處還藏著另一項要求:"為保護關鍵運營所需的敏感設備,須持續進行蒸發冷卻。"
過去兩年,AI基礎設施的競爭焦點始終集中在電力系統上。公用事業公司不得不重寫負荷預測,電網運營商在海量併網申請的壓力下疲於應對,超大規模雲服務商爭相鎖定變電站、天然氣容量和輸電通道,以支撐日益耗電的AI集群。如今,同樣的壓力正向另一個本為緩慢穩定增長而設計的系統蔓延——市政供水基礎設施。
在多個地區,水資源正逐漸成為類似電網容量的選址限制因素,直接決定大型AI園區能否落地或擴建。隨著開發商向搭載密集GPU部署的超大園區邁進,公用事業公司和市政當局開始直面冷卻架構、再生水獲取、污水處理容量以及長期乾旱規劃等一系列問題。喬治亞州牛頓縣的一位水務局代表在面對某數據中心項目提出的每日600萬加侖用水申請時,直截了當地說:"我們根本沒有這麼多水。"這句話折射出一個更宏觀的現實:拿到電力供應,並不等於同時擁有足夠的冷卻用水、污水處理能力或市政支持。
在德克薩斯州,2027年州級供水規劃草案預測,即便人口增長超過50%,全州現有供水量到2080年仍可能下降約10%。州政府估計,未來50年可能需要約1740億美元的供水基礎設施投入,以滿足日益增長的AI需求並維持穩定供水。該規劃以歷史最嚴重乾旱為情景基準進行編制,而這恰恰是大型AI集群冷卻用水壓力最為集中的時段,但規劃並未將AI相關數據中心的需求單獨列為一個規劃類別。
AI熱潮背後的物理本質
供水系統從未為密集運行、熱負荷極高的AI集群而設計。業界對算力侃侃而談,但背後的物理規律始終圍繞著熱量排放展開。
加州大學河濱分校的研究人員在一篇研究AI用水足跡的論文中寫道:"伺服器消耗的能量幾乎全部轉化為熱量,必須從數據中心機房中排出,才能避免過熱。"
多年來,大多數數據中心主要依賴風冷散熱。AI的出現徹底改變了這一格局。現代GPU系統每個機架所產生的熱密度遠超傳統企業級硬體。運營商越來越多地部署晶片直接液冷(D2C)、背門熱交換器、冷凍水迴路和大型冷卻分配系統,以實現高效散熱。水泵、冷卻塔、處理系統、冷水機組、再生水系統和市政供水基礎設施,如今都直接嵌入散熱鏈路之中。
能源與用水的權衡取捨
冷卻方案的選擇迫使運營商在電力需求與耗水量之間尋求平衡。蒸髮式系統可降低電力需求,但會增加直接用水量。乾式或絕熱冷卻可減少用水依賴,但在極端高溫天氣下可能推高能耗。
德克薩斯大學奧斯汀分校專注於熱力系統、液冷及AI基礎設施用水研究的副教授Vaibhav Bahadur告訴《數據中心知識》:"從用水角度看,冷卻塔是最差的方案;乾式或絕熱冷卻是最優的。但這還必須結合能耗一併考量。"
加州大學河濱分校副教授、前述AI用水足跡論文共同作者Shaolei Ren在近期公開評論中指出,蒸發輔助冷卻在極端夏季條件下可將峰值冷卻功耗降低20%至60%,實際上是將部分基礎設施壓力從電網轉移到了市政供水系統。他還警告說,數據中心存在"兩種截然不同的用水依賴":一是直接冷卻需求,二是與發電相關的大量場外用水負擔。
AI高密度部署改變冷卻方程
蘿倫斯伯克利國家實驗室研究人員於2025年發布的一篇綜述論文發現,根據冷卻架構、電網用水強度、伺服器利用率、氣候帶和能效水平的不同,工作負載層面的用水量差異可超過10000倍。
UC河濱的論文指出,D2C液冷系統本身"不會蒸發或消耗水"。目前業界普遍強調封閉式液冷系統——冷卻液在密封管路和冷板中循環流動,而非在伺服器環境中蒸發。但封閉式系統並不能消除更宏觀的冷卻負擔,設施仍須將熱量排放至外部環境。
EkkoSense首席營銷官Justin Bluming在接受《數據中心知識》採訪時表示:"將熱量從數據大廳導出,不過是把它集中並轉移到別處。液冷改變的是熱量的傳輸方式,但設施最終仍須將其排放到外部環境。"
他補充說,隨著機架密度持續攀升、GPU集群愈加趨近滿負荷持續運行,監控的精細程度愈發重要。"AI機架的問題往往在接近最高負載時運行,其影響範圍可能更大。"
間接與直接用水
UC河濱的論文指出,晶片直接液冷系統本身"不會蒸發或消耗水"。
然而,大型AI集群仍需設施級熱量排放,根據設施設計和電力來源的不同,這可能通過冷卻塔、蒸發輔助系統或發電過程將用水需求轉移至其他環節。
隨著開發商轉向自建天然氣發電,以繞過電網併網瓶頸,這一區分將變得更加重要。場地自發電系統雖然可以減少對緊張輸電基礎設施的依賴,但根據發電技術和冷卻設計的不同,也可能增加區域整體用水量。
Bahadur表示:"隨著更優技術的採用和優化,直接用水量將有所下降,但間接用水可能成為一個重大問題。"
性能與熱裕量
儘管用水問題日益受到關注,運營商仍持續推進液冷部署,因為密集的AI工作負載已越來越難以靠傳統風冷系統應對。
一項近期對液冷與風冷8×英偉達
H100系統的基準測試研究發現,液冷配置在峰值負載下將GPU溫度維持在41至50攝氏度,而風冷系統則高達54至72攝氏度。更低的溫度使液冷系統在持續壓力測試中的吞吐量提升約17%。在實際AI工作負載下,液冷系統在高利用率時節點級功耗也低約1至1.5千瓦,同時保持同等甚至更優的訓練性能。這些優勢正推動整個行業轉向液冷,儘管其工程複雜性也隨之增加。
Bluming指出,能夠在更高水溫下運行的新一代D2C系統,也正在重塑AI基礎設施的地理分布格局。"過去一年,我們看到了在密西西比州、阿拉巴馬州和路易斯安那州的重大數據中心公告。在AI熱潮興起之前,這些地方並不是數據中心建設的熱門地區,而那裡的氣候顯然是非常炎熱潮濕的。"他還補充說,部分新型冷卻技術能夠在比傳統冷凍水系統高得多的水溫下運行,使大型AI部署在過去被認為冷卻條件惡劣的地區也具備了經濟可行性。
峰值需求的隱憂
來自UC河濱、加州理工學院和羅切斯特理工學院的研究人員認為,整個行業正撞上一個鮮為人知的限制——供水峰值容量。他們在題為《小瓶子,大管道》的論文中警告,許多公共供水系統缺乏足夠的冗餘容量,無法在極端夏季條件下吸收大規模AI冷卻負荷。
研究人員估計,若當前用水強度持續不變,到2030年美國數據中心可能需要每日6.97億至14.5億加侖的新增供水容量,大致相當於紐約市的日均供水量。這一壓力將集中落在承接地所在社區,而這些地區的公共供水系統本就不少已在老化或接近容量上限。
這種緊張態勢正在地方審批環節浮出水面,市政系統面臨的峰值需求場景,遠超其設計初衷。
Ren告訴《數據中心知識》,市政系統在項目審查中通常會收到最大需求申請,但許多規模較小的系統在極端夏季條件下,當下可能根本沒有這種峰值容量。當"本地系統在不影響其他用戶的前提下無法可靠支撐項目峰值需求"時,水資源就成為了選址的制約因素。
真正的難題是需求的波動性。與大多數市政用戶不同,數據中心的峰值係數往往異常高——即日最大用水量與日均用水量之比。論文估計,根據冷卻架構和氣候不同,許多數據中心的峰值係數在3至10之間,部分設施甚至超過30。論文中分析了威斯康星州一家面向AI的超大規模設施,該設施申請的供水容量約為每日70萬加侖,而實際日均用水量僅約2.3萬加侖,意味著峰值係數超過30。
市政系統的規劃基準並非年均用水量,而是一年中最炎熱的天氣。
研究人員明確揭示了這一權衡:"設施級冷卻在電力使用與用水之間存在根本性的取捨。"節水冷卻往往加重電力負擔;節電冷卻往往加重用水負擔。
再生水可減輕對飲用水供應的壓力,但同樣面臨自身的水力限制。
污水處理進入AI基礎設施堆棧
公眾對數據中心的討論通常聚焦於淡水消耗,但市政系統同樣承受著排污壓力。大型冷卻系統產生的濃縮礦物質和化學處理劑廢水,需由當地處理廠進行處理。隨著AI園區規模擴大,無論城市是否有所規劃,污水處理系統正越來越多地成為計算基礎設施堆棧的組成部分。
在水資源緊張的地區,運營商正積極尋求再生水協議,以減少對飲用水系統的依賴。
在北弗吉尼亞州,供水基礎設施已在數據中心冷卻需求的推動下持續擴張。勞登水務正將其Broad Run水資源回用設施的處理能力從每日1500萬加侖提升至3000萬加侖,同時擴建一條部分為"數據中心走廊"工業冷卻負荷配套建設的再生水分配管網。該系統包含約20英里的再生水管道,2025年已向用戶輸送超過7.45億加侖再生水。
在喬治亞州道格拉斯縣,谷歌利用經過處理的市政污水冷卻設施,再將剩餘水流排回查特胡奇河。即便是再生水系統也存在限制——勞登水務指出,隨著區域需求攀升,水力限制和容量分配可能制約新的再生水接入申請。
這一轉變正悄然將污水處理基礎設施改造為AI建設浪潮中的戰略性資源。歷史上各自為政的電力規劃、水務區、污水運營和經濟發展部門,正被AI基礎設施的需求強行整合到一起。
供水系統的擴張正在復刻電網擴張的軌跡:代價高昂、推進遲緩、政治博弈複雜、受制於地理條件。水庫、新水源開發、處理能力提升和污水系統升級,往往需要數年乃至數十年才能完成。這些時間周期與超大規模雲服務商爭分奪秒部署AI算力的節奏,正越來越多地產生衝突。
《小瓶子,大管道》的研究人員寫道:"並不存在什麼供數據中心隨意取用的'國家水庫'。"
為另一個時代建造的基礎設施
數據中心基礎設施的討論長期以電力為核心,而AI改變了問題的量級。大型GPU集群將巨大的熱負荷集中在相對有限的空間內,迫使運營商通過設施冷卻系統,以及最初按照較慢工業增速規劃的市政供水和污水管網,排出遠超以往的熱量。
市政公用事業公司如今須統籌規劃冷卻峰值需求、污水處理容量、抗旱韌性,以及節水型與節電型冷卻架構之間的權衡。與此同時,許多公共規劃框架仍難以將AI基礎設施作為一個獨立的基礎設施類別加以建模。
弗吉尼亞州那份公用事業協議將AI系統的不間斷運行與"持續蒸發冷卻以保護關鍵運營所需敏感設備"直接掛鉤,同一份文件也承認,該項目的預期需求已超出公用事業公司現有的長期規劃假設。
《小瓶子,大管道》所揭示的壓力表明,水資源是一項硬性基礎設施約束,將決定新的AI集群能否獲批落地。
Bluming表示,隨著機架密度持續攀升,行業的長期冷卻走向正愈發清晰。"如果500千瓦機架成為現實,那麼液冷就是物理規律所決定的必然。"
這一切都指向AI基礎設施的一個新現實:在許多市場中,下一個重大瓶頸或許不再是如何發出足夠的電力,而是如何獲取足夠的水——以及足夠的污水處理容量——來帶走熱量。
Q&A
Q1:AI數據中心為什麼會消耗大量水資源?
A:AI數據中心運行時,伺服器消耗的能量幾乎全部轉化為熱量,必須通過冷卻系統排出以防止過熱。傳統風冷已無法應對現代GPU集群的高熱密度,因此廣泛採用蒸發冷卻、冷卻塔等依賴大量水的系統。蒸髮式冷卻雖可降低電力消耗,但會大幅增加直接用水量。此外,數據中心還存在間接用水,即發電過程中消耗的水資源,兩者疊加導致總體用水需求極為龐大。
Q2:液冷技術能解決數據中心的用水問題嗎?
A:液冷,尤其是晶片直接液冷(D2C)系統本身不會直接蒸發或消耗水,但並不能從根本上消除用水需求。設施仍需通過冷卻塔或其他方式將熱量排放至外部環境,水的需求只是被轉移而非消除。液冷的優勢在於大幅提升散熱效率和GPU性能,測試顯示液冷配置可使吞吐量提升約17%,同時降低功耗,但整體水資源管理問題依然存在。
Q3:水資源短缺會如何影響AI數據中心的選址建設?
A:水資源正成為繼電力之後,影響AI數據中心選址的關鍵限制因素。部分地區的水務部門已明確表示無法滿足數據中心提出的每日數百萬加侖用水申請。研究預測,若當前用水強度不變,到2030年美國數據中心每日新增用水需求可能高達14.5億加侖。這意味著開發商在評估選址時,必須同時考慮供水容量、污水處理能力和長期抗旱規劃,而非僅僅關注電力供應。






