生成式AI、大模型、ChatGPT等話題持續走紅,除了如「明星」般的應用之外,打造「基石」的晶片企業也不可忽視。
英特爾院士、大數據技術全球首席技術官戴金權在接受記者採訪時表示,英特爾致力於將生成式AI普適化,讓各行各業,以及普通的消費者都可以使用。
生成式AI無處不在
為了實現這樣的願景,一方面,作為滿足生成式AI和大語言模型的算力需求的重要組成部分,軟體算法設計的多樣化必不可少。英特爾擁抱開源以及AI開放社區,比如與TensorFlow、PyTorch、Hybrid Bonding、OpenAI等展開合作,在開源AI的軟體工具和軟體基礎架構上有所作為,自動生成底層的、最優的針對不同硬體平台的代碼,實現上層的框架、算法更高效的開發。同時,英特爾與Hugging Face在開放的大語言模型上也有合作。
另一方面,英特爾通過對算力優化、計算能力的提升來支撐生成式AI無所不在。不管是GPU,還是類似Gaudi 2的AI加速器,還有最新發布的第四代英特爾至強可擴展處理器加入了專門針對矩陣運算的加速器(英特爾AMX),以加速神經網路運算。
此前,Hugging Face曾展示,Stable Diffusion在內置英特爾高級矩陣擴展(英特爾AMX)的第四代英特爾至強可擴展處理器上運行的平均速度提高了3.8倍。而且,這種加速是在不更改任何代碼的情況下實現的。
戴金權指出,XPU架構是趨勢,通過XPU技術與英特爾的軟硬體優化,英特爾能夠讓生成式AI無所不在,甚至是消費級的計算設備上提供AI能力。「我們可以讓客戶在搭載12代酷睿i5的筆記本上運行開源的7B(70億參數)和13B(130億參數)的入門級大語言模型。」
除了大語言模型之外,英特爾可以將Stable Diffusion運行在12代酷睿筆記本上,不需要任何獨立顯卡,直接利用集成顯卡,就可以在二、三十秒的時間裡生成一張圖片,用戶體驗良好。
總之,在整個計算領域,面向本地端、雲端、邊緣端,從小尺寸的設備擴展到大規模的數據中心,英特爾提出了「軟體定義、晶片增強」的策略,即用戶需要藉助軟體定義自身需要什麼樣的計算能力,然後再從硬體角度進行更好的增強和支持。面對不同的應用、場景,英特爾通過提供全方位的「智能計算」能力支持生成式AI的應用。
負責任的AI
英特爾並沒有滿足於讓AI無處不在,其實大語言模型不止是優化生產力的流程,還會帶來數據安全和隱私問題。
在引入新技術,特別是AI時,必須有科學和數據基礎,並且通過治理引導全過程。英特爾提出了負責任的AI( Responsible AI),在整個開發生命周期中執行嚴格的多學科評審,包括建立多元化的開發團隊以減少偏見,開發遵循倫理原則的AI模型,同時從技術和人文的角度廣泛評估結果,並與行業夥伴合作減少AI潛在的負面影響。
戴金權表示,無論是數據、模型、應用,英特爾內部制定了一個「負責任的AI」的流程,其中定義了如何消除偏見、如何使用正確的數據等。
英特爾致力於打造負責任的AI,在數據安全和隱私計算方面做了很多相關工作。藉助英特爾硬體級的安全技術,比如英特爾TDX、英特爾SGX可以避免數據出域,降低數據泄露風險,加上軟體層構建的面向大數據分析和機器學習的隱私計算平台(BigDL PPML,Privacy Preserving Machine Learning),再結合大語言模型和Stable Diffusion,就可以從數據和模型兩方面保護生成式AI的應用,確保數據安全和隱私性。此外,英特爾還通過算法判定機器生成內容,確保內容真假。
戴金權表示,在筆記本上運行例如Stable Diffusion的大語言模型,這不僅降低了AI的使用門檻,讓消費者可以使用這些生成式AI,另一方面也大大保護了數據模型的隱私,因為你可以把整個生成式AI、大語言模型部署在本地,算法、應用、數據都在本地,不需要跟其他人分享。
總而言之,英特爾的目標是秉承負責任的態度和原則,與整個行業密切協作,支持包括生成式AI在內的各種AI模型。
「我們的願景是讓AI無所不在,將開源的大語言模型和英特爾的計算能力相結合,我們可以給用戶提供全新、優秀的生成式AI使用體驗。」戴金權最後說。