作為谷歌DeepMind推出的一款全新AI產品,GenCast對於天氣狀況的預測準確度已經能夠與傳統天氣預報比肩。根據最近發表的研究結果,在使用2019年的數據進行測試時,它的表現足以躋身領先的預報模型。
AI雖不可能在短期之內取代傳統預報系統,但卻能夠在天氣預測和嚴重氣象災害預警等方面為現有工具庫提供有力的支撐和充實。GenCast只是當前正在開發的多款AI天氣預報模型之一,相信它們的發展成熟將帶來更為準確的氣象預報能力。
DeepMind高級研究科學家Ilan Price指出:「我們生活中的方方面面幾乎都擺脫不開天氣的影響……因此天氣預測也成為一項重大科學挑戰。谷歌DeepMind矢志於推動AI科技造福人類。我認為天氣預測既是踐行這一使命的重要方式,也將為人類社會做出切實貢獻。」
Price和他的同事們將GenCast與ENS系統進行了對比測試。ENS系統是歐洲中期天氣預報中心(ECMWF)運營的全球頂級預報模型之一。根據本周發表在《自然》雜誌上的一項研究,GenCast的表現優於ENS的概率高達97.2%。
GenCast則是一款機器學習天氣預報模型,基於1979年至2018年間收集的天氣數據訓練而成。該模型學習並識別出過往四十年歷史數據中的模式,並運用這些模式預測未來可能發生的情況。也就是說從原理層面,GenCast與ENS等傳統模型的工作方式截然不同——後者仍然依賴超級電腦求解複雜議程來模擬大氣物理。在測試中,GenCast與ENS分別生成集合預報,給出一系列可能出現的天氣狀況。
例如在預測熱帶氣旋路徑時,GenCast平均可以提前12小時發出預警。GenCast在預測氣旋軌跡、極端天氣及風力等級等方面表現更好,最多可提前15天做出預測。
但需要注意的是,GenCast是針對舊版ENS進行對比測試,而目前實際運行的已經是解析度更高的新版ENS。這項同行評審研究將GenCast的預測結果與2019年版本的ENS進行了比較,旨在了解各模型對當年真實天氣狀況的判斷是否準確。ECMWF機器學習協調員Matt Chantry表示,ENS系統自2019年以來同樣迎來顯著改進,因此很難說GenCast當前的表現是否優於新版ENS。
但可以肯定的是,解析度並不是做出有力預測的唯一重要因素。ENS在2019年時的解析度就已略高於GenCast,但仍在對比測試中落敗。DeepMind方面指出,他們對2020年至2022年的數據也進行了類似的研究,得出的結果也基本相同,只是此項研究尚未經過同行評審。但由於拿不到相應數據,2023年未被納入測試範圍,而ENS系統正是在這一年開始以更高解析度運行。
GenCast將世界劃分成一套複雜的網格,以0.25度的解析度運行——也就是該網格上的每個單元格,對應四分之一緯度乘以四分之一經度的面積。相比之下,ENS在2019年時的解析度為0.2度,目前的解析度則進一步改進至0.1度。
儘管如此,Chantry在一封電子郵件聲明中宣稱,GenCast的發展仍然「標誌著天氣預報發展道路上的一個重要里程碑」。除了ENS之外,ECMWF表示他們也在運行自己的機器學習預報系統。Chantry稱該項目「從GenCast中汲取了一些靈感」。
GenCast的另一個優勢則體現在速度上。它可以在短短八分鐘之內使用單個Google Cloud TPU v5生成一份未來15天的預報。而像ENS這樣基於物理定律的模型可能需要幾個小時才能完成同樣的計算。GenCast繞過了ENS需要解決的所有方程式,因此能夠花費更少的時間、占用更低的算力資源以生成預測結果。
Price指出:「從計算角度來看,與GenCast這樣的模型相比,運行傳統預測的成本要高出幾個數量級。」
這樣的效率優勢,有望緩解人們對於高能耗AI數據中心對於環境影響的擔憂。此類數據中心已經導致谷歌公司近年來溫室氣體排放量的持續攀升。但單純著眼於預測階段的能耗還遠遠不夠,如果不計入機器學習模型訓練期間消耗的能源,就無法判斷GenCast與傳統基於物理定律的預報模型間到底存在多大的可持續性差異。
必須承認,GenCast仍有很大的改進空間,包括進一步擴展至更高解析度。此外,GenCast以12小時為間隔發布預測,而傳統模型往往能夠匹配更短的發布間隔。這往往會影響到預測結果在現實世界中的應用方式(例如評估風力等級可能達到怎樣的水平)。
佛羅里達大學氣象學助理教學教授Stephen Mullens(並未參與GenCast研究)表示:「我們希望了解一整天的風向走勢,而不僅僅是上午6點和下午6點各檢測一次。」
雖然人們對於如何使用AI來改善預報越來越抱有興趣,但AI模型仍需要更多實際表現來證明自己。Mullens表示:「人們的關注度正在升溫,但我認為其暫時還無法左右整個氣象界。我們都是受過專業訓練的科學家,習慣於用物理學的角度來思考問題……而AI從本質上就是在總結過往經驗和規律,所以我們需要認真考慮,這樣的方式到底好不好,以及背後的理由。」
天氣預報機構可以自行體驗GenCast,DeepMind已經發布了其開源模型的代碼。Price表示,如今GenCast乃至更多經過改進的AI模型正與傳統模型一同在現實場景下使用。「一旦這些模型被交付到從業者手中,將有助於進一步建立信任和信心。我們真心希望這能帶來一波廣泛且積極的社會影響。」