宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

蘋果全新Foundation Models詳解:端側AI、雲端AI及其全面解析

2026年06月12日 首頁 » 熱門科技

在WWDC26主題演講中,蘋果發布了第三代Apple Foundation Models(AFM),此次陣容共包含五款模型,其中部分在本地端運行,部分基於雲端部署,還有一款運行於谷歌伺服器之上、依託英偉達蘋果全新FoundationModels詳解端側AI雲端AI及其全面解析晶片提供算力支持。以下將對這一體系的運作方式進行詳細拆解。

回顧起點:從端側到雲端

蘋果最初於2024年發布基礎模型時,產品線涵蓋一款參數量約為30億的端側語言模型,以及一款"更大規模的伺服器端語言模型,可通過Private Cloud Compute訪問,運行於蘋果自研晶片伺服器之上"。

Private Cloud Compute是一項頗具雄心的技術舉措,旨在提供雲端AI能力的同時,保障與端側處理相同級別的用戶隱私。

也正因如此,將整套系統保持在蘋果生態內部至關重要。Private Cloud Compute運行於蘋果自建數據中心、搭載蘋果自研晶片的伺服器之上,且其隱私保障機制可供獨立第三方安全研究人員進行驗證。

然而,隨著蘋果在AI領域的推進遭遇瓶頸,公司轉而與谷歌展開合作,將Gemini作為新一輪AI戰略的核心支撐。相關成果已於本周WWDC26主題演講中正式亮相。

五款模型全覽

第三代AFM共包含五款模型:AFM 3 Core與AFM 3 Code Advanced為端側模型;AFM Cloud、ADM 3 Cloud(Image)與AFM 3 Cloud Pro則為伺服器端模型。其中ADM 3 Cloud(Image)中的"D"代表擴散(Diffusion)技術。

除AFM 3 Cloud Pro外,其餘所有模型均基於蘋果自研晶片設備運行。AFM 3 Cloud Pro則運行於託管在谷歌雲平台的英偉達GPU之上。

這一部署得以實現,源於蘋果首次將Private Cloud Compute架構延伸至第三方基礎設施,同時"保持蘋果強大的安全與隱私保護能力"。

以下是蘋果對各模型的說明:

重點解析:AFM 3 Core Advanced與AFM 3 Cloud Pro

先看AFM 3 Core Advanced,這款端側模型擁有200億參數,規模相當可觀。面向大眾市場的端側模型通常參數量僅在數十億級別的低位徘徊。

為確保AFM 3 Core Advanced高效運行,蘋果採用了稀疏架構設計,可根據不同的輸入提示,每次激活最多40億參數,而非採用密集架構將200億參數全量保持激活狀態。

這一機制在概念上與混合專家(Mixture of Experts)方法相似,但其選擇性激活策略依託的是蘋果自主研發的技術,具體細節已在一年前發布的研究論文《面向大語言模型的指令跟隨剪枝》中詳細闡述。

再看AFM 3 Cloud Pro,這是此次部署於外部基礎設施的模型。蘋果本周在其安全部落格中發布了關於這一架構擴展的技術細節,其中最值得關注的部分如下:

蘋果與谷歌在此基礎上攜手構建了一系列能力,其完備程度遠超傳統保密計算部署的範疇。

訓練數據與評估體系

蘋果在其機器學習研究部落格中表示,五款模型"在分化為各自架構與應用場景之前,共享同一初始基礎,並在此基礎上擴展了多模態能力,涵蓋音頻、圖像理解、長上下文推理以及高質量視覺生成"。

蘋果還說明,訓練數據"涵蓋公開可用資訊、經許可或購買的第三方數據、開源數據、專項研究獲取的數據,以及合成數據"。蘋果同時強調,訓練過程未使用任何用戶數據或交互記錄,且網頁發布者可選擇退出基礎模型訓練。

人工評估結果

蘋果對第三代基礎模型進行了大規模人工評估,內部評審人員從指令遵循能力、真實性、呈現效果及圖像理解等多個維度對模型響應進行評分。

各模型均與前代版本進行了對比評估(適用時),部分結果如下:

在針對通用文本能力的人工同步評估中,AFM 3 Core與AFM 3 Cloud相較前代模型的優選響應占比。結果分四個地區語言組呈現,以體現各國際版本的一致表現。"English"代表全球英語評估集,"PFIGSCJK"、"DNNSTV"與"AFIHHMPRTU"則代表其餘受支持的全球語言區域。

在英語圖像理解能力的人工同步評估中,AFM 3 Core與AFM 3 Cloud相較2025年前代模型的優選響應占比。

在聽寫任務的人工同步評估中,AFM 3 Core Advanced相較蘋果現有生產級聽寫系統在七個質量維度上的綜合表現。AFM 3 Core Advanced在整體質量上展現出正向勝率,且在所有格式化與理解維度上的優勢均保持一致。

如需深入了解第三代Apple Foundation Models的更多技術細節,歡迎訪問蘋果官方技術部落格查閱完整內容。

Q&A

Q1:蘋果第三代Apple Foundation Models包含哪些模型?

A:第三代AFM共包含五款模型。其中端側模型為AFM 3 Core與AFM 3 Code Advanced,可直接在蘋果設備本地運行;伺服器端模型包括AFM Cloud、ADM 3 Cloud(Image)和AFM 3 Cloud Pro。值得注意的是,AFM 3 Cloud Pro運行於谷歌雲平台託管的英偉達GPU之上,是蘋果首次將Private Cloud Compute架構延伸至第三方基礎設施的成果。

Q2:AFM 3 Core Advanced的200億參數是如何在端側設備上高效運行的?

A:蘋果為AFM 3 Core Advanced採用了稀疏架構設計,並非將200億參數全量激活,而是根據每次輸入的提示內容,動態激活最多40億參數。這與混合專家(Mixture of Experts)方法在概念上有相似之處,但蘋果使用的是自主研發的技術,並在論文《面向大語言模型的指令跟隨剪枝》中進行了詳細闡述,從而大幅降低了端側運行的資源開銷。

Q3:蘋果第三代基礎模型的訓練數據來源有哪些?是否使用了用戶數據?

A:蘋果表示,訓練數據來源多元,涵蓋公開可用資訊、經許可或購買的第三方數據、開源數據、專項研究數據以及合成數據。蘋果明確強調,訓練過程中未使用任何用戶數據或用戶交互記錄。此外,網頁發布者還可選擇主動退出基礎模型訓練,以保護自身內容不被用於模型訓練。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2026 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新