AI人工智慧經過長達70年的進化,在最近幾年,趁著生成式AI的東風,迎來了一波史無前例的爆發。
僅僅在過去的18個月內,就有150多個基礎AI模型面世,涵蓋語音、圖像、文字與影片生成等等。
無論是雲側、邊緣側還是端側,AI已經無處不在,滲透到了我們生活、工作的每一個角落,顛覆了一個又一個行業領域。

在這場空前的變革中,Arm計算平台可以說扮演著非常核心的角色。
畢竟,無論是消費電子、智慧型手機、智能汽車、數據中心乃至是PC,Arm的身影無處不在,基於Arm架構的晶片累計出貨量已經超過3100億顆,遠超任何其他架構平台。
2025年台北電腦展前夕,Arm高級副總裁兼終端事業部總經理Chris Bergey發表了主題演講,並與聯發科技、NVIDIA兩大關鍵合作夥伴進行了深入探討。

Bergey指出,現階段,AI的演化速度是空前的,僅僅在過去一年的變化就令人驚嘆。歸納起來可以發現三個顯著的趨勢:
一是AI模型變得更高效、更聰明、更專精。
不再一味追求更龐大的參數量,也不再一味吃掉更強大的硬體算力,即便是小尺寸模型也能勝任不同工作。
二是雲側AI正迅速向邊緣側、端側延伸。
尤其是在端側高效運行AI、利用AI,已經毋庸置疑,而且雲邊端AI的融合日漸深入、難分彼此。
三是AI智能體大規模湧現,實體AI也衍生出了新的機遇。
AI智能體已經出現了非常成功的商業落地項目,尤其是AI編程、AI客服最為典型,甚至有的創業公司在不到100人的情況下,利用AI就實現了上億美元的營收;
實體AI方面,具身機器人、機器狗、配送機器人等快速崛起,雖然距離人類智能水平還差很遠,但已經在某種程度上可以自主運行。

當然,AI以各種形式在各行各業的應用,都離不開強大的底層基礎架構,而對於構建AI系統的基礎要素,Arm認為有三個關鍵因素:
一是雲邊端無處不在的獨特平台。
AI的運行往往不限於某一個範圍,比如在端側、邊緣側越來越流行,但很多工作負載又離不開雲側,或者兼而有之,因此一個高度可移植的平台對於推動AI發展的靈活性是至關重要的。
二是更高的能效比。
AI對於電力能源的消耗有目共睹,尤其是在數據中心的大規模AI訓練,能耗已經從兆瓦級(MW)躍升至吉瓦級(GW),而其中50%以上來自機架和半導體設備。如何提高能效、降低能源消耗,已經是生死攸關的話題。
三是軟體開發生態。
沒有強大、優秀的軟體生態,再好的AI硬體性能也無法釋放出來,無法形成生產力而真正服務於人。

說到軟體生態,Arm無疑擁有獨特的優勢,坐擁全球最大的開發生態,匯聚了超過2200萬名軟體開發者,同時基於Arm架構晶片出貨量迄今已超過3100億顆。
如此級別的軟硬體規模,就帶來了一個良性循環:大量基於Arm架構的硬體設備推動了豐富的Arm軟體生態,而反過來,強大的軟體生態又進一步催生了更多的硬體發展機會。

去年,Arm進一步推出了Kleidi軟體庫,讓開發者能在各種AI模型與工作負載上,無論是音頻、圖像、文字、影片,都能獲得最佳的性能表現。
尤其是,它可以讓AI工作負載利用最新的Armv9架構加速運行,同時具備面向未來硬體架構的可持續性。
迄今為止,Arm Kleidi已經在搭載Arm架構的設備上累計安裝超過80億次,還在持續增長中。
值得一提的是,Kleidi也與大量全球主流的AI框架進行了集成,包括ExecuTorch、PyTorch、Angel、llama.cpp、MediaPipe、MNN、ONNX Runtime等等,以及中國騰訊混元的Angel機器學習框架。

說回到硬體,此前Arm在數據中心領域的布局或許還不為大眾所熟知。
事實上,Arm已經在數據中心領域深耕了10多年,取得了相當的成果。
比如全球最大的雲服務提供商亞馬遜雲科技(AWS),早就開發了基於Arm架構的Graviton處理器,並演化多代。AWS此前表示,在他們去年部署的CPU中,超過50%是基於Arm架構的Graviton。
在這其中,既有相當一部分AWS自家的工作負載,也有大量的外部客戶。AWS曾表示,其超過90%的重要客戶(不包括 Amazon)都在使用Arm的先進架構,並受益於其更高的能效。
這些客戶都是業界耳熟能詳的企業,比如SAP、Epic Gams、Discovery等等。

除了AWS Graviton,還有大量的數據中心處理器採用了Arm架構,比如微軟Cobalt、谷歌Axion、Ampere AmpereOne(甲骨文持股)、NVIDIA Grace、阿里倚天,等等。
在這些Arm計算平台的加持之下,不但大量的雲服務商將自家的工作轉移到Arm平台,還有越來越多的第三方廠商將其服務轉向了Arm平台,帶來了超過40%的能效提升。
預計在2025年,出貨到頭部超大規模雲服務提供商的算力中,有近50%將基於Arm架構。

而在這裡有一款產品尤為值得一提,那就是NVIDIA DGX Spark,一台桌面級的AI超級電腦,體積只有一台迷你機大小,是全球最小的同類產品。
它搭載了一顆超級晶片NVIDIA GB10,基於NVIDIA Blackwell GPU 和Grace CPU。
其中,CPU部分包含來自Arm的10個Cortex-X925核心、10個Cortex-A725核心,GPU部分則具備高達1PFlops的AI算力,也就是每秒1千萬億次浮點運算。
此外,它還有超高帶寬的NVLink-C2C片間互連,通過針對AI所需的帶寬、I/O密度進行深度優化,實現了更高效的計算性能,還為之搭配了128GB LPDDR5高帶寬高能效內存、4TB SSD高速存儲。
有了這樣的超高算力,DGX Spark可以在本地運行多達2000億參數的AI模型。
在今年的台北電腦展上,NVIDIA宣布聯合宏碁、華碩、戴爾、技嘉、惠普、聯想、微星等品牌,共同打造DGX Spark、DGX Station系統。
NVIDIA還分享了Grace CPU的最新發展勢頭,在埃克森美孚(ExxonMobil)、Meta等實現了一系列的實際部署,大大提升了AI工作負載的性能和效率。

在消費級市場上,2025年將有超過40%的PC、平板都運行在Arm架構之上。
比如NVIDIA、聯發科技聯合打造的N1系列處理器正蓄勢待發,並得到了華碩、戴爾、聯想、惠普、微星等眾多品牌的支持。
聯發科技近期還推出了Kompanio Ultra SoC處理器,更進一步提升了Chromebook設備的性能水平,使得新一代Chromebook Plus筆記本具備先進的AI與多媒體處理能力。
生態方面,Arm PC也取得了飛速發展,目前全球大多數主流應用都已經推出了原生適配Arm的版本。

目前,全球99%的智慧型手機都採用Arm架構,因此Arm計算平台的每一步發展,都影響深遠。
比如去年發布的超大核Arm Cortex-X925,具備業內最高水平的IPC性能與進步幅度,相比上代提升了多達15%。
IPC對於處理器而言是至關重要的一個參數,因為IPC與頻率的乘積,決定了整個平台的性能。
相較於單純依賴提高頻率來提升性能容易造成功耗與能效的失衡,提升IPC可以更高效地實現性能、能效的雙重增強,而對於移動設備而言,控制功耗無疑是一個關鍵考量因素。
聯發科技天璣9400系列就是Cortex-X925落地的典型代表,配合全大核設計,帶來了無可比擬的性能與能效。
小米最新發布的玄戒O1,作為第一款國產3nm手機晶片,同樣採用了Cortex-X925。

最後,Arm官方預告了將在今年稍晚推出的Arm Lumex CSS 解決方案,該方案將集成兩款面向移動端市場的新一代CPU和GPU產品。
其中CPU代號「Travis」,定位旗艦CPU,將再次帶來兩位數的IPC性能提升,同時通過最新的SME(可伸縮矩陣擴展),進一步加速AI處理能力。
GPU代號「Drage」,將進一步提升圖形渲染能力,帶來更沉浸的長時間遊戲體驗,還有更豐富的多媒體處理能力。

可以說,當下這個AI蓬勃發展的時代是一場千載難逢的機會,必將重新定義科技如何影響世界。
要想真正讓這場革命落地到人們生活、工作的方方面面,真正實現AI的價值,離不開持續的科技創新,以及世界級生態系統的深度合作。
從雲到邊緣再到端,從手機平板、PC到汽車、物聯網、數據中心,Arm計算平台正處於這場革命轉型的核心。
作為未來的基石,Arm不但推動著AI無處不在,更將一步步塑造、變革AI的未來。