大模型技術突破到產業落地,中國AI產業的底層邏輯,正在進入新一輪變革周期。
過去,AI基礎設施更多承擔的是資源支撐角色,為模型訓練和應用運行提供算力、儲存和網路,但隨著AI訓練、推理和Agent應用快速增長,AI產業開始越來越重視算力最終能夠轉化出多少Token,以及如何持
續提升Token的生產效率。
於是,Token逐漸成為衡量AI價值創造的重要單位,基礎設施的角色也在發生變化。其正在演變為一套圍繞Token生產效率運行的生產系統。這種變化的背後,本質上是中國AI產業對基礎設施提出了新的要求:從資源供給走向價值生產,從能力支撐走向效率驅動。
率先感受到這一變化的,正是身處產業鏈核心位置的基礎設施提供商。聯想正是其中的先驅者!
過去幾年,聯想持續推進AI基礎設施戰略升級。從異構智算平台、AI算力基礎設施
,到詞元工廠(Token Factory),其價值錨點已經不再局限於伺服器產品本身,而是通過打通從算力、數據到模型和應用的完整鏈路,將分散的AI能力轉化為可規模化複製的生產能力。而聯想對於自身的定位,也從基礎設施提供商,轉變為AI算力基礎設施與Token生產體系的構建者。
也正是在這樣的背景下,聯想問天近期完成品牌煥新,並提出新的發展目標。聯想集團副總裁、中國基礎設施業務群總經理陳振寬透露,到2027年,聯想中國基礎設施業務群將錨定1000億元目標,並向中國伺服器市場第一發起衝擊。

聯想集團副總裁、中國基礎設施業務群總經理陳振寬
目標之外,當AI產業的價值導向開始從消耗算力走向生產Token時,聯想又是如何完成這場換新升級的?
01 研發範式遷徙,從「穩態」規劃到「敏態」創新
聯想給出的第一個答案,來自研發體系的重構。
今天回頭看,AI帶來的變革並不僅僅是算力需求的爆發,更重要的是打破了基礎設施產業長期形成的研發節奏。過去適用於通用計算時代的方法論,越來越難以適應AI技術快速疊代的現實。
三年前,聯想問天品牌剛剛發布時,伺服器行業的運作邏輯依然呈現出顯著的『穩態』特徵。
在當時,通用計算與超算(HPC)占據著算力市場的主導地位。在這樣的產業環境下,產品規劃的核心錨點是上游晶片廠商相對清晰的三到五年技術路線圖。伺服器廠商則圍繞這些長期規劃制定產品疊代節奏,並投入近18個月甚至更長時間完成龐大的交叉驗證矩陣,以確保產品能夠滿足大規模、普適化部署的需求。
但是,這種模式建立在一個重要前提之上。聯想中國基礎設施業務群伺服器事業部總經理周韜指出,彼時產業鏈各環節的發展節奏相對穩定且可預測。無論是處理器更新周期,還是企業客戶的採購需求,整體都遵循著較長周期的演進規律。因此,研發工作的核心任務是保證產品穩定性、兼容性和規模化交付能力。
聯想中國基礎設施業務群伺服器事業部總經理 周韜
但AI的出現改變了這一切。
大模型快速發展,尤其是GPU技術進入高頻疊代周期,基礎設施產業開始面對前所未有的變化速度。周韜表示,過去可以提前數年規劃的技術路線,如今往往在數月時間內就會迎來新的變量。與此同時,模型架構、訓練框架,以及推理場景也在持續演進,使得市場需求變得更加複雜且難以預測。
而對於基礎設施廠商而言,挑戰已經不僅來自底層晶片的快速疊代,更來自上層模型與應用需求的持續變化。過去動輒數年的研發周期,開始難以跟上AI技術演進的速度。
換句話說,過去強調「做對產品」,如今更重要的是「更快的做對產品」。
這意味著,傳統以長期規劃和全覆蓋驗證為核心的研發模式,已經難以滿足AI時代的需求。
面對這種變化,聯想選擇主動調整研發範式。
在深入客戶需求調研的過程中,聯想發現了一個重要現象。周韜坦言,雖然AI產業整體變化迅速,但真正進入訓練與推理場景後,客戶對於基礎設施配置的需求並非是無限發散的,而是逐漸向少數高頻組合集中。例如,在GPU伺服器部署中,客戶實際採用的往往是三到四種主流配置方案,內存規格、網路配置,以及加速卡組合也呈現出明顯的集中趨勢。
這一發現改變了聯想對於研發資源配置的思路。
往往,伺服器廠商需要針對海量軟硬體組合進行全面驗證,以確保覆蓋儘可能廣泛的市場需求,而現在,更高效的方式則是聚焦最具代表性的主流場景,將研發資源集中投入到客戶最關注的配置組合之中。
基於這一思路,聯想開始精簡傳統的大規模交叉驗證流程,並與產業鏈頭部合作夥伴建立更緊密的協同機制。通過聚焦核心場景和主流配置,研發團隊能夠在更短時間內完成產品定義、原型開發和客戶驗證。
周韜透露,過去需要一年甚至更長時間才能完成驗證並推向市場的產品,如今往往可以在幾個月內完成樣機開發,並直接進入客戶真實業務環境進行測試和疊代。
研發邏輯也由此發生變化。從以往的「驗證充分後再上市」到如今的「快速驗證、快速疊代、快速交付」。
這種「敏態」創新所帶來的直接結果,是創新效率的顯著提升。周韜透露,目前聯想已經能夠同時推進10至15個前沿產品項目的探索與開發,相比傳統研發模式,新技術從驗證到落地的周期被大幅縮短,產品疊代速度也顯著提升。
這種變化除了發生在研發體系內部,也進一步影響了聯想的生態合作策略。聯想中國基礎設施業務群戰略總監黃山表示,隨著國內AI產業快速發展,越來越多GPU及相關技術創新企業湧現出來。面對不斷擴大的技術生態,企業不可能對所有方向投入同等資源,因此如何選擇合作夥伴,本身也成為基礎設施廠商的重要能力。

聯想中國基礎設施業務群戰略總監 黃山
而聯想的選擇是,聚焦關鍵方向,與最具技術潛力和產業價值的夥伴建立更深層次協同。
不難理解,相比廣泛布局,聯想更傾向於圍繞客戶實際需求構建聯合創新能力,共同完成產品驗證、方案優化以及場景落地,從而讓新技術能夠更快轉化為可規模化部署的生產力。
從穩態到敏態,從長周期規劃到快速疊代,從追求全面覆蓋到聚焦核心場景,這場研發範式的轉變也反映出聯想對於AI時代基礎設施創新邏輯的重新理解。
對於聯想而言,研發體系的重構,是這場轉型的起點。
02 價值體系升維,構建高能效「Token工廠」
研發體系完成敏捷化改造後,聯想開始進一步思考,如何讓這些不斷疊代的技術,最終轉化為更高效的價值產出。
黃山的答案是,把基礎設施的優化目標從硬體能力延伸到生產效率本身。在他看來,當產業開始以Token衡量價值時,決定競爭力的不再是單一設備性能,而是整個系統的綜合效率。這一判斷,也被系統性地寫進聯想近期首發的產業專著《詞元工廠:詞元經濟的財富生產範式》中,該專著由黃山等主創撰寫、中國科學院院士領銜推薦,圍繞「詞元工廠」「智能產能」「有效算力」「安全可控」四大核心概念,解構了AI基礎設施從算力支撐走向智能生產系統的底層邏輯

在這一導向指引下,聯想內部也提出了極具挑戰性的目標:通過軟硬協同優化,持續降低Token生產成本,推動每百萬Token的硬體成本降低到1元以內。
目標背後,考驗的是一整套系統工程能力。
為此,聯想也發布了萬全異構智算平台V5.0和超節點解決方案,並構建了覆蓋計算、緩存、容錯、供電、通信和散熱六大環節的優化體系。
首先是計算效率。為了進一步釋放算力性能,聯想將優化深入到算子、計算框架,以及算子編譯系統等底層軟體棧。黃山透露,聯想團隊近期在芯模編譯優化方向的研究成果獲得IEEE論壇優秀論文獎,也從側面反映出其在底層工程優化上的持續投入
僅有算力並不意味著高效率。對於大模型推理而言,緩存系統同樣決定著整體吞吐能力。圍繞KV Cache(鍵值緩存),聯想重點優化緩存命中率和緩存量化技術,以提升推理效率。
而當訓練和推理規模持續擴大,系統穩定性開始成為影響產出的另一項關鍵因素。為此,聯想構建了相應的容錯機制,以保障模型訓練過程中的MFU(模型算力利用率),並確保96卡級推理池能夠長期穩定運行。
除了計算系統本身,基礎設施底層同樣存在大量優化空間。隨著單機櫃功率不斷攀升,供電效率的重要性日益凸顯,而聯想則引入了800V高壓直流垂直供電技術,通過提升電壓、降低電流的方式減少能量損耗和發熱,為高密度計算提供更高效的電力支撐。
與此同時,由於GPU集群規模越大,通信效率的重要性也越突出。黃山透露,聯想計劃在未來一年進一步推進光互聯技術應用,並在軟體層面研發自主計算通信庫,以實現不同GPU平台之間更高效的協同通信。
而在散熱系統上,依託聯想「海神」全冷板液冷技術,讓高功耗AI設備能夠獲得更加穩定的散熱保障,從而支撐更高密度部署需求。
六大環節的優化體系看似分布在不同層面,實則共同構成了一條完整的效率優化鏈條,也為聯想的「Token工廠」打下了基礎。
03 從資源調度到產業交付:讓「Token工廠」的飛輪轉起來
六大環節的優化,能解決通用訓練與推理場景下的效率問題,那麼把這套體系推向極限的,是今年以來快速規模化崛起的Agent應用。
與前兩年以問答式交互為主的大模型應用相比,Agent承擔的是真實任務的執行工作。其不僅需要理解用戶意圖,還要自主完成任務拆解、工具調用、多輪推理以及結果反饋。
這種變化帶來的是計算鏈路的顯著拉長。系統需要同時管理更多並發任務、更複雜的上下文,以及更長周期的資源占用。
換句話說,同樣一套底層優化能力,在Agent場景下面臨的是全新的壓力:計算資源如何分配、任務如何調度、緩存如何復用,成為影響整體吞吐量和響應效率的核心要素。
針對這些新的運行壓力,聯想在優化體系之上,給出了三個更具針對性的解法。
在安全治理方面,針對企業私有化部署場景,聯想與火山引擎等合作夥伴共同打造安全能力體系,將公有雲環境積累的大規模安全經驗引入企業側部署環境,相關產品預計於7月正式推出。
對於並發管理問題,聯想引入了開源測試工具PinchBench,對辦公、編程等典型Agent場景進行模擬測試,通過持續優化系統調度策略,提高複雜任務環境下的並發處理能力。
在緩存資源管理方面,針對多Agent同時運行帶來的KV Cache占用問題,聯想在Harness
層之上增加了獨立監控與調度機制,實現了緩存資源的動態分配和釋放,從而提升整體資源利用率。
而當底層能力逐漸成熟,聯想的下一步「落子」,便是如何讓不同類型的客戶真正用起來。
對此,聯想構建了三種差異化的交付模式。
第一類是面向地方政府和產業園區的城域級公共Token中心。通過建設區域性AI基礎設施平台,為產業提供統一的算力服務能力。
第二類是面向大型企業的私有化「Token工廠」。針對數據安全、行業模型,以及業務定製化需求較高的客戶,聯想能夠將算力系統與企業現有數據中心基礎設施進行聯動,實現更精細化的資源與能耗管理。
第三類是面向中小企業的訂閱制服務。依託聯想百應等平台,中小企業無需大規模的前期投入,即可獲得算力、儲存、網路,以及PaaS能力,且還能根據業務發展逐步擴展使用規模。
「對於算力服務而言,我們在底層提供的技術棧與核心能力是一致的,改變的只是為契合不同客戶需求而設計的交付形式。」黃山如是說。
04 寫在最後
在AI技術普惠的時代交匯點,聯想的這次「換新升級」的深層含義,是對底層範式的一次重新定義。
從敏態研發的流程重構,到六大環節的系統工程優化,再到面向千行百業的多元交付,聯想的每一步都在印證其對AI產業邏輯變遷的精準洞察。面對日益龐大的算力需求與複雜多變的Agent場景,聯想依託生態協同與前沿創新能力,正在重塑行業價值標尺,推動算力基礎設施從傳統「資源支撐載體」向高效能的「Token生產系統」躍遷。
穿越AI的演進周期,以Token生產效率為核心的新紀元已經到來。而聯想傾力打造的這座千億級「Token工廠」,是對自身業務增長的重新錨定,更是在新一輪算力變革浪潮中,為中國AI產業的規模化落地,築牢堅實底座!






