宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

Intel Vision 2024大會:全面擁抱AI 英特爾全新軟硬體平台已經就緒

2024年04月18日 首頁 » 熱門科技

眾所周知,生成式AI的浪潮由ChatGPT發端,並擴展到各行各業。

有數據顯示,預計2026年,80%的企業將會使用生成式AI,預計有50%的企業在邊緣計算將會部署各種不同的機器學習或者是深度學習,從而提升企業競爭力。而企業在生成式AI的投資,預計在今年會達到400億美金的規模,到2027年會達到1510億的規模。

2023年可以說是生成式AI的元年,有10%的企業在自身的生意模型中部署了生成式AI。其中,大概有一半以上的企業認為他們需要部署生成式AI,但都在硬體或軟體等方面遇到了不同的難題。特別是企業的私有數據和通用模型結合在一起就變成了一個很大的挑戰。

英特爾公司市場營銷集團副總裁、中國區數據中心銷售總經理、中國區運營商銷售總經理莊秉翰告訴記者,英特爾提出企業AI的概念,即通過開放的生態,能夠更開放地、更有規模性地、更可靠地幫助企業釋放AI潛力,這是英特爾企業AI最基本的核心。

例如算力層面,英特爾在數據中心、邊緣和終端提供多元算力,而且這些算力不僅能夠帶來性能上的提升,還具備隱私性。

在面向客戶和合作夥伴的英特爾on產業創新大會上,英特爾宣布了英特爾至強6處理器的全新品牌,推出英特爾Gaudi 3加速器,以高性能、開放性和靈活性助力企業推進生成式AI創新,並發布了涵蓋全新開放、可擴展系統,下一代產品和一系列戰略合作的全棧解決方案,以加速生成式AI落地。

全新至強6

莊秉翰說,以往每一代至強的發布基本上都是某一款產品,而至強6則是一個產品組合可以解決數據中心在性能、功耗,以及多元工作負載等方面的各種不同問題。至強6是基於兩個不同的微架構,即一個更強調性能的性能核(P-core),和一個更強調功耗比的能效核(E-Core),而且這兩個核是軟體堆棧兼容,這也有利於企業在工作負載和IP設計的通用。

Intel Vision 2024大會:全面擁抱AI 英特爾全新軟硬體平台已經就緒

配備能效核(E-cores)的英特爾至強6處理器將於2024年第二季度推出,提供卓越的效率,配備性能核(P-cores)的英特爾至強6處理器將緊隨其後推出,帶來更高的AI性能。

Intel Vision 2024大會:全面擁抱AI 英特爾全新軟硬體平台已經就緒

配備能效核的英特爾至強6處理器(代號為Sierra Forest)與第二代英特爾至強處理器相比,每瓦性能提高2.4倍,機架密度提高2.7倍。

配備性能核的英特爾至強6處理器(代號為Granite Rapids)包含了對MXFP4數據格式的軟體支持,與使用FP16的第四代英特爾至強處理器相比,可將下一個令牌(token)的延遲時間最多縮短6.5倍,能夠運行700億參數的Llama-2模型。

從全新至強6我們可以看到企業AI的幾個典型特點:開放、易部署、可擴展、可靠。英特爾公司市場營銷集團副總裁、中國區雲與行業解決方案部總經理梁雅莉表示,當一個新的技術潮流來臨、新一代技術的應用擴展之時,開放、可靠和易部署的策略對終端用戶來說極為關鍵,這也是英特爾在以往每一次技術疊代過程中,與OEM、ODM、ISV、SI等在內整個生態系統合作的基礎。技術並非為技術而生,而是為落地而生。

例如英特爾與金山雲合作,在其第七代性能保障型雲伺服器X7中引入了第四代至強可擴展處理器進行了針對性優化。同時,在Stable Diffusion、Llama2、ChatGLM2三款十分流行的大模型基礎上進行了調優,並發布優化的模型鏡像。

相較優化之前的模型,英特爾AMX優化後的文生圖大模型Stable Diffusion,其推理性能提升高達4.96倍。在常用的開源大語言模型Llama2和ChatGLM2 模型上,優化後的模型推理性能也分別取得了2.62倍和2.52倍的顯著提升。

對於企業來講,在面對不同選擇之時,他們會考慮以下幾點。第一是「可及」,即該算力是能夠購買、能夠獲取的,也是通用的;第二是追求不錯的性能;第三則是在易部署的情況下,能夠擁有可靠的保障。

「最重要的並非是擁有大模型,而是AI技術該如何落地,並且為客戶帶來真正的價值,這是英特爾一直致力於探索的方向。」梁雅莉說。

CPU可以運行大模型其實打開了全新的想像空間,比如現在全國各地在積極建設智算中心,這對成本和功耗、運維都提出了新的挑戰。而採用CPU進行大模型的推理,可以兼顧已有的工作負載,其實這會讓數據中心建設更加平滑。

網路與邊緣

無論是推理還是訓練,人工智慧的很多實踐場景往往是需要一個分布式的並行系統,滿足模型處理所需要的要求。在並行處理過程當中,數據傳輸的能力至關重要。

英特爾中國網路與邊緣事業部首席技術官、英特爾高級首席AI工程師張宇表示,如何更好解決網路擁塞的問題是制約大模型性能提升以及規模擴張的核心要素。

超級以太網聯盟(UEC)的宗旨就是定義新一代增強的以太網技術,以一種開放的方式來面對新時代大模型對整個網路的要求。

通過超以太網聯盟(UEC),英特爾正在驅動面向AI高速互聯技術(AI Fabrics)的開放式以太網網路創新,並推出一系列針對AI優化的以太網解決方案。這些創新旨在革新可大規模縱向(scale-up)和橫向(scale-out)擴展的AI高速互聯技術,以支持AI模型的訓練和推理,這些模型的規模日益龐大,每一代都會增長一個數量級。英特爾的產品組合包括英特爾AI網路連接卡(AI NIC)、集成到XPU的AI連接芯粒、基於Gaudi加速器的系統,以及一系列面向英特爾代工的AI互聯軟硬體參考設計。

張宇說,scale-up主要是一個計算節點內部不同加速卡之間的互連,scale-out更多是不同計算節點之間的互連。不管是協議定義,還是產品的形態,InfiniBand比較封閉,能夠供貨的供應商相對來說都是比較有限。以太網的生態非常龐大,而且產品選擇種類非常多。

談到網路,我們就不得不說邊緣。到2030年整個邊緣服務市場規模會達到4450億美元,其中AI是第一大邊緣工作負載。張宇說,邊緣應用直接面向客戶多樣化的需求,這就要求邊緣系統往往是一個異構架構系統。第二,邊緣應用的特點是碎片化非常明顯。不同的應用對算力有不同的要求,為了滿足邊緣用戶對算力的綜合要求,英特爾實際上提供了非常豐富的產品,滿足用戶對媒體處理、人工智慧處理、數據傳輸等多方面的要求。

面向零售、工業製造和醫療等關鍵領域,英特爾擁有英特爾酷睿Ultra、英特爾酷睿、英特爾凌動處理器和英特爾銳炫顯卡系列產品在內的全新邊緣晶片。

英特爾公司市場營銷集團副總裁、英特爾中國網路與邊緣及渠道數據中心事業部總經理郭威表示,英特爾會深入行業,了解行業的需求和痛點,支持好、服務好客戶,打造合適的產品解決行業痛點。

軟體的力量

軟體無處不在,未來軟體的作用是加速企業AI的發展。雖然企業現在已經從傳統架構轉向了雲架構,但是大模型的出現讓企業需要全新的AI架構。

英特爾公司副總裁、英特爾中國軟體和先進技術事業部總經理李映表示,在底層,英特爾軟體能夠保證硬體性能可以得到充分釋放。更重要的是讓各種不同的硬體架構之間實現互聯互通,共同協作,以及提供很好的、安全的、及時的、高性能的功能,能夠讓無論是原來企業傳統應用還是AI應用共同發展。

英特爾積極推動基於AI的軟體創新,讓整個AI軟體框架變得更加開源、開放。oneAPI就是一個很典型的例子,根據最新的數據,oneAPI已經超過100萬次的下載量。

英特爾聯合Anyscale、Articul8、DataStax、Domino、Hugging Face、KX Systems、MariaDB、MinIO、Qdrant、RedHat、Redis、SAP、VMware、Yellowbrick和Zilliz共同宣布,將創建一個開放平台助力企業推動AI創新。這一凝結全行業力量的計劃旨在開發開放的、多供應商的生成式AI系統,通過RAG(檢索增強生成)技術,提供一流的部署便利性、性能和價值。RAG可使企業在標準雲基礎設施上運行的大量現存專有數據源得到開放大語言模型(LLM)功能的增強,加速生成式AI在企業中的應用。

英特爾院士、大數據技術全球首席技術官、大數據分析和人工智慧創新院院長戴金權說,開源開放的好處顯而易見,同一個生態系統中的創新可以相互促進,激發更多應用和技術,比如開源大模型的訓練方法、數據、算法可以互通。

英特爾打造開放的軟體生態,為開發者打造統一的開發平台。英特爾開發者雲平台不僅能幫助開發者最早接觸到最新的無論是至強還是Gaudi,可以讓開發者更早地熟悉和使用這些硬體,更重要的是能夠保證各種開源框架、組件在一個環境中的兼容性,以及為開發者提供更好的用戶體驗,使用這些開發框架,實現整個開發效率的提升。

針對中國市場,英特爾與openEuler和龍蜥等社區緊密合作,通過本土的工程師,優化英特爾技術,保證英特爾產品在用戶真實環境的工作負載中,實現更好的的性價比和性能,

用於AI訓練和推理的Gaudi 3

除了CPU、網路和邊緣、軟體等更新,英特爾Gaudi 3 AI加速器通過以太網的通用標準連接多達數萬個加速器,打造高性能、經濟實用、節能的處理器所打造的可快速部署的解決方案。並且,Gaudi 3還能滿足複雜性、成本效益、碎片化、數據可靠性和合規性等需求。

Intel Vision 2024大會:全面擁抱AI 英特爾全新軟硬體平台已經就緒

與上一代產品相比,英特爾Gaudi 3將帶來4倍的BF16 AI計算能力提升,以及1.5倍的內存帶寬提升。該加速器將為尋求大規模部署生成式AI的企業帶來AI訓練和推理方面的重大飛躍。

英特爾Gaudi 3預計可大幅縮短70億和130億參數Llama2模型,以及1750億參數GPT-3模型的訓練時間。此外,在Llama 7B、70B和Falcon 180B大語言模型(LLM)的推理吞吐量和能效方面也展現了出色性能。

Intel Vision 2024大會:全面擁抱AI 英特爾全新軟硬體平台已經就緒

英特爾Gaudi 3提供開放的、基於社區的軟體和行業標準以太網網路,允許企業靈活地從單個節點擴展到擁有數千個節點的集群、超級集群和超大集群,支持大規模的推理、微調和訓練。英特爾Gaudi 3將於2024年第二季度面向OEM廠商出貨。

結語

英特爾面向開放的、可擴展的AI系統的戰略,包括硬體、軟體、框架和工具。英特爾讓廣泛的AI開放生態系統參與者,如設備製造商、資料庫提供商、系統集成商、軟體和服務提供商等,能夠提供滿足企業特定生成式AI需求的解決方案。與此同時,亦讓企業與他們已知、信任的生態系統合作夥伴展開合作並採取相應解決方案。

Intel Vision 2024大會:全面擁抱AI 英特爾全新軟硬體平台已經就緒

英特爾始終致力於讓AI更易於使用、更開放、更安全,從而滿足全球企業的不同需求。通過Intel Vision 2024大會上公布的全新合作和解決方案,英特爾將在AI浪潮中全力引領創新,讓AI為各行各業帶來前所未有的價值。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2025 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新