宅中地 - 每日更新
宅中地 - 每日更新

贊助商廣告

X

邁向Token經濟時代,F5以「AI賦能交付」築基智能新生態

2026年06月06日 首頁 » 熱門科技

這也是AI應用落地進入新階段後出現的關鍵變化。過去,企業關注的是模型能否生成結果。而現在,企業還需要解決推理請求如何在異構算力之間高效調度、首Token時延如何進一步壓縮、GPU利用率如何持續提升、AI應用如何在多雲和跨區域環境下實現安全、穩定、合規運行等問題。

圍繞這一變化,F5 給出的思路是將其長期積累的應用交付能力,進一步延伸至AI應用交付與安全平台。其核心邏輯是通過其ADSP平台,基於Token的負載均衡方案TBLB(Token Based Load Balancing),以及 「AI紅隊」「AI護欄」與自動化修復能力,把算力、應用、Token和安全納入同一套交付體系,進行統一治理。

01  Token經濟改寫應用交付邏輯

其實,F5三十年的發展始終隨著應用形態變化而演進。

1996年,F5推出BIG-IP,圍繞網際網路應用的穩定性、擴展性和訪問性能,推動ADC應用交付控制能力的發展。

進入雲計算階段後,應用加速雲化、API化和微服務化,F5的能力也擴展到私有雲、公有雲和多雲環境,進入ADC 2.0階段。

到了AI時代,應用形態再次變化。大模型、智能體、數據、API和算力基礎設施邁向Token經濟時代F5以AI賦能交付築基智能新生態共同構成新的應用體系。「如今,企業需要處理的不再僅僅是傳統訪問流量,更多的是模型調用、推理排隊、Token生成、AI安全防護和跨雲協同等問題。」F5北亞區總裁黃彥文指出。

邁向Token經濟時代F5以AI賦能交付築基智能新生態

F5北亞區總裁 黃彥文

應用交付對象發生變化後,衡量交付效率的單位也隨之變化。F5中國區產品及解決方案總經理陳亮提到,目前中國每天產生的Token規模已達到約140萬億,折算約為每秒16億Token。當交付規模進入這一量級後,Token 已不再只是模型輸出的計量單位,而開始直接對應計算成本、資源消耗、用戶體驗以及最終的業務價值。

換句話說,每一次Token的生成、調度與交付效率,都會影響企業的AI投入產出比。

圍繞Token經濟,陳亮提出了四個核心支柱。其一,AI 集群的高並發供給能力決定 Token的生產能力,是整個系統的產能底座;其二,首Token 時延與端到端響應流暢度直接影響用戶體驗;其三,單位Token的 ROI 決定企業的經濟效益;其四,全鏈路安全能力與長期運行穩定性,決定AI應用能否實現持續、可靠交付。

本質上來看,這是一套圍繞Token構建的交付體系,覆蓋生成、傳輸、調度到安全防護的完整生命周期。

02 TBLB解決異構算力的調度難題

當Token成為新的治理對象,算力調度的複雜性也被進一步放大。尤其在中國市場,很多企業會同時使用NVIDIA、AMD、華為、寒武紀邁向Token經濟時代F5以AI賦能交付築基智能新生態、海光資訊等不同品牌、不同代際的算力資源。

邁向Token經濟時代F5以AI賦能交付築基智能新生態

這種部署方式雖然提升了靈活性,但也帶來了模型適配和調度的複雜度。

原因在於,AI推理請求並不像普通Web請求,其代碼重構、影片生成、圖像生成、文檔總結等任務,對後端GPU、模型和推理引擎的消耗並不相同。如果調度系統只能基於連接數、請求數或伺服器狀態進行分發,就容易出現部分GPU節點擁塞、部分節點低負載的情況。

這也正是F5提出TBLB的背景。在這一機制中,Token除了作為模型輸出的計量單位,更作為資源調度的核心對象。系統會結合大模型服務(LLM)運行狀態、算力負載、請求排隊情況、Token時延,以及推理成功率等資訊,實時完成任務分發與資源匹配。

邁向Token經濟時代F5以AI賦能交付築基智能新生態

其關鍵邏輯在於,讓不同類型、不同優先級的推理任務,匹配更合適的算力資源,從而在保障響應體驗的同時,提高整體資源利用效率。

從具體場景來看,TBLB的價值體現在提升既有資源的使用效率上。

就比如,某汽車行業客戶採用6塊NVIDIA A40與8塊L20的混合部署,通過F5的賦能,在未增加額外算力投入的情況下,實現了首Token生成速度提升30.3%,端到端訪問速度提升48.68%;某運營商客戶基於華為Ascend 910B算力資源,引入F5能力後,並發用戶承載能力提升至少75%,首Token生成速度提升99%。另一家銀行業的客戶,採用3塊阿里平頭哥PPU與3塊NVIDIA H20的異構架構,優化後首Token生成速度提升42.2%,Token輸出流暢度提升7.1%。

F5亞太區首席技術官Mohan Veloo從成本視角解釋了這一能力的意義。在他看來,企業建設AI工廠往往意味著數十億美元級別的算力投入,因此,即便GPU綜合利用率僅提升20%,也足以釋放可觀的經濟價值。尤其在GPU採購成本持續增加、供給周期較長、硬體疊代不斷加速的背景下,相比持續追加採購,更可持續的路徑,是優先激活並釋放既有算力資源的潛力。

F5亞太區首席技術官 Mohan Veloo

03 同步推進AI安全閉環與本土創新

如果說TBLB解決的是AI推理階段的交付效率問題,那麼F5圍繞AI應用交付平台提供的「AI紅隊」(AI Red Teaming)與「AI護欄」(AI Guardrails)能力,解決的則是AI應用規模化後的安全治理問題。前者負責主動發現風險,後者負責在運行時防護,兩者共同構成AI應用交付過程中的安全閉環。

原因在於,隨著Token交付鏈路不斷延長、模型調用場景持續複雜化,AI系統暴露出的攻擊面也在快速擴大。企業面對的風險,開始延伸至模型輸入、推理過程與輸出結果的全鏈路安全。

Mohan Veloo指出,AI正在改變攻防關係。攻擊者已經能夠藉助AI更快生成攻擊載荷、發現漏洞並實現自動化利用,而許多企業的防禦體系仍停留在依賴人工研判與靜態規則的階段。這種「攻擊自動化、防禦人工化」的能力失衡,正在持續放大安全壓力。

對此,F5的策略是,通過引入AI能力,形成「發現—防護—修復」的完整閉環。

具體來說,AI紅隊承擔了發現風險的角色,通過AI智能體模擬真實用戶行為和攻擊路徑,對提示詞注入、數據泄露、越權訪問、越獄攻擊等風險進行持續探測。AI護欄則部署在模型調用鏈路中,對輸入、輸出以及上下文交互過程進行實時語義分析、策略控制與風險攔截,實現運行時治理。

進一步地,AI紅隊發現的問題還能夠自動調用為AI護欄策略,並結合虛擬補丁能力完成持續修復,在不中斷業務運行的前提下緩解安全風險,從而形成從發現到治理再到修復的閉環能力。

從第三方評測結果來看,在SecureIQLab測試中,F5 的AI護欄面對約2萬次攻擊取得98.36%的總體安全得分。其中,直接提示詞注入防禦達到99.3%,過度代理防護達到98.7%,敏感數據泄露防護達到99.0%。

邁向Token經濟時代F5以AI賦能交付築基智能新生態

針對中文應用場景,F5還基於清華大學公開發布的中文大模型安全數據集進行了驗證。材料顯示,在髒話侮辱、違法犯罪、偏見歧視等多類敏感內容識別,和指令型攻擊場景下F5整體保持領先。

安全能力之外,F5也將AI用於自身服務體系建設。

陳亮介紹,F5已在內部服務體系中引入大模型能力,並命名為ServiceGPT。通過該系統可以打通產品開發體系、知識庫、案例系統,輔助服務團隊快速完成問題定位與根因分析,使問題研判效率提升約23%,平均定位時間縮短至約0.8天。

這些能力建設,也對應著F5中國戰略方向的調整。

黃彥文提到,F5中國戰略已從「創新中國,服務中國」升級為「創新中國,鏈接全球」。TBLB、ServiceGPT,以及新成立的F5 AI應用工程部,都是中國團隊推動形成的本土創新成果。這也意味著,中國市場正在成為原創能力向全球輸出的重要節點。

在生態層面,F5北亞區區域副總裁及解決方案資深架構諮詢師張振倫補充表示,F5將持續投入全球及中國開源生態建設,NGINX也將繼續保持開源版本疊代更新。面向中國AI生態,F5計劃兼容國內主流推理引擎、開源組件與開發平台,幫助開發者和企業用戶更順暢地接入AI創新能力與安全能力。

此外,針對Kubernetes生態中部分入口控制器後續維護策略調整帶來的影響,陳亮表示,作為CNCF黃金會員,F5將持續投入技術與資源,為用戶提供成熟、平滑的遷移替代路徑。

宅中地 - Facebook 分享 宅中地 - Twitter 分享 宅中地 - Whatsapp 分享 宅中地 - Line 分享
相關內容
Copyright ©2026 | 服務條款 | DMCA | 聯絡我們
宅中地 - 每日更新