IBM和NASA近日發布了一款人工智慧模型,幫助研究人員更快地分析衛星數據。
該模型在Hugging Face上提供,這是一個類似GitHub的流行平台,用於共享開源神經網路。IBM和NASA的下一階段合作將重點把AI能力擴展到更多用例中,並與馬薩諸塞州伍斯特市的克拉克大學合作開展該計劃。
IBM研究院AI副總裁Sriram Raghavan表示:「開源技術加速了氣候變化等關鍵領域的發現。」
IBM表示,這種新模型旨在幫助研究人員識別美國大陸可能面臨洪水和野火風險的地區,並且分析地理空間數據的速度要比最先進的神經網路快四倍,訓練所需的數據也更少。
IBM把這種AI稱為一個基礎模型,或者說是一個可以執行各種高級計算任務的模型。它基於Transformer架構,一種流行的神經網路設計方法。Transformer模型在推理一段數據時可以考慮大量上下文資訊,這使其能夠比其他AI系統做出更準確的決策。
這項技術支撐著市場上許多先進的AI系統,其中就包括OpenAI最新的大型語言模型GPT-4。
IBM和NASA在名為Harmonized Landsat Sentinel-2的地理空間數據集上聯合訓練了他們的模型,這個數據集包括由NASA Landsat-8 衛星拍攝的地球表面圖像,以及來自歐洲航天局運營的衛星星座Sentinel-2的測量數據。
IBM使用其內部開發的Vela超級電腦訓練這個AI模型。今年早些時候IBM推出的這套系統採用了Nvidia的A100系列數據中心圖形晶片,Vela使用的是A100高端版本,具有特別大的板載內存池,用於存儲AI模型。
除了Nvidia的晶片之外,Vela超級電腦還配備了IBM開發的虛擬化軟體。虛擬化使某些AI開發任務變得更加容易,但這種簡單性是以降低處理能力為代價的,不過IBM表示,它將性能影響降低到了5%以下,研究人員將其描述為「我們所知業內最低的開銷」。
儘管IBM和NASA優化了他們的模型來檢測有洪水和野火風險的區域,但他們估計該模型也可以適用於其他用例,例如跟蹤森林砍伐行為,以及幫助研究人員監測碳排放並預測作物產量。
未來,IBM計劃進一步擴展AI功能,IBM已經在與NASA和克拉克大學的研究人員合作進行這項工作。
在該計劃中,IBM希望優化時間序列分割和相似性研究的模型,這是兩種主流的數據分析方法,不僅用於地理空間研究,還用於一系列其他任務,例如,時間序列分割可用於研究股票價格波動的原因。
IBM最終計劃通過Watsonx產品套件提供該模型的商業版本。Watsonx產品套件是在今年5月推出的,其中包括了一系列軟體工具,旨在幫助企業構建先進的AI模型並將其部署到生產中,此外還有針對各種用例進行優化的預打包神經網路。
Watsonx是由Red Hat OpenShift AI提供支持的,後者是IBM機器學習產品組合中最近推出的另一個組件,是OpenShift應用開發和部署平台的一個版本,專門針對AI工作負載進行了優化,簡化了監控生產中運行的機器學習模型的性能等任務。