在如今多元化的計算架構中,Arm架構正在從移動計算平台基礎架構向更廣泛的應用場景延展。
Arm高級副總裁兼終端事業部總經理Chris Bergey在2023上海世界移動通信大會(2023 MWC上海)上接受記者採訪時表示,現在各個領域對於計算的需求與日俱增,包括數據中心,自動駕駛汽車以及AI等。迄今為止,Arm的合作夥伴已經交付了超過2500億顆基於Arm架構的晶片。隨著AI計算的日益發展,這樣的趨勢會不斷加速。
賦能AI的加速發展
在Chris Bergey看來,AI應用將無處不在。
雖然目前大模型的訓練更多是在雲端進行,但是出於功率、隱私保護和延遲等多方面的考量,更多的AI應用和訓練都將在數據存在之處進行,也就是傳感器獲取數據的地方。
AI和傳感器結合在一起可以發揮非常強大的作用,比如應用於智慧城市的交通管理,可以減少交通擁堵,讓整個城市更加安全,降低更多能耗。
而Arm所提供的一系列多樣化的IP將賦能AI的加速發展,包括從Cortex-M到Cortex-A和Mali等這些針對筆記本電腦、智慧型手機等高端的CPU、GPU等。
目前,基於Arm架構運行的AI應用正不斷推陳出新,從智慧型手機(Google Pixel 7的實時字幕、虛擬助手)到家用自動化設備(Amazon Echo語音助手),再到集成AI功能的冰箱,可達到節能目標。
「我們打造了前所未有的軟體生態系統,1500萬名開發者基於Arm架構、為Arm架構應用進行開發。這一生態系統為更廣泛的社區提供平台,可以通過基於Arm的硬體一起打造AI解決方案。」Chris Bergey說。
據悉,Arm內部也在探索AI的應用,包括利用AI找出軟硬體的早期漏洞。另外,在EDA領域以及利用機器語言打造晶片工具方面,藉助AI更好地預測晶片的性能和物理特性等,支持產品研發工作。
終端設備的AI
現在終端上已經部署了很多機器學習功能,比如手機的面部識別、圖像增強、濾鏡、AR等等,都是AI推理應用在終端上的體現。隨著處理器性能的越發提升,更多類似的應用會應運而生。
不過,在移動設備上實現更好的移動AI體驗,我們面臨三方面的挑戰:高能效計算、內存帶寬、高效支持AI的軟體棧。
基於此,Arm推出了2023全面計算解決方案(TCS23),為智慧型手機推出性能最優異的移動計算平台。作為TCS23的一部分,全新Armv9 Cortex計算集群已連續三年實現兩位數的性能提升。其中,新的Cortex-X4是第四代Cortex-X核心,是Arm迄今為止打造的最快速的CPU,與Cortex-X3相比,其性能提高15%,基於相同工藝的全新高能效微架構可降低功耗達40%。
而Arm GPU迄今在全球範圍內的交付已經超過80億顆,其中,Arm Mali系列GPU是目前全球出貨量最大的面向移動終端的GPU。
「直播和影片會議等應用都對整體系統計算及計算效率提出了更高的要求。針對AI或者手機遊戲等下一代的用例,我們已經和軟體生態系統一起努力進行賦能,讓他們可以使用最新一代的軟體技術庫,更好地利用硬體能力,實現性能的提升。」Chris Bergey說。
與中國系統緊密合作
Arm全面計算解決方案是一個易於使用、高性能、高效且優化的整體解決方案,便於合作夥伴的實施和部署。同時,TCS23也支持合作夥伴的定製化,這樣他們可以開發不同的創新產品。
Chris Bergey表示,在過去的十年,Arm跟很多中國的頂級應用商店合作,助力他們遷移到64位系統應用開發,從而顯著地幫助他們提高性能及強化安全性。
毋庸置疑,中國是產生下一代應用最具有創新性的地方,成立30多年以來,Arm一直與中國的生態系統保持緊密的合作。
在人才培養方面,Arm與很多大學以及行業、合作夥伴主導的一些產業聯盟等機構合作,開展了很多人才聯合培養的項目,比如2023年的AICAS挑戰賽、開源之夏、百度飛槳黑客松。
Arm還參與了很多本地的開源社區和項目,比如TARS項目和龍蜥社區(OpenAnolis)等,通過參與全球開源社區的專業知識,推動本土的生態系統。
此外,Arm將一些全球技術進行本地化,讓中國的生態系統更易於採用。比如把Arm虛擬硬體(Arm Virtual Hardware,AVH)整合到百度飛槳的PaddlePaddle模型中。
Arm不斷賦能本地的創新能力,並宣布與聯想合作成立在中國第一個5G解決方案實驗室;Arm還與本土電信運營商等生態系統合作夥伴一起開展PoC項目。
「從雲到邊緣,我們看到所有領域對智能計算的需求都在呈指數級增長,而AI的普及應用,也將為此大大提速。當今,很多AI的應用已經運行在Arm架構,而未來也將如是發展。Arm一直非常重視本地生態系統的建設,我們將持續與中國的生態合作夥伴一起攜手努力。」Chris Bergey最後說。