邁向Token經濟時代，F5以「AI賦能交付」築基智能新生態

這也是AI應用落地進入新階段後出現的關鍵變化。過去，企業關注的是模型能否生成結果。而現在，企業還需要解決推理請求如何在異構算力之間高效調度、首Token時延如何進一步壓縮、GPU利用率如何持續提升、AI應用如何在多雲和跨區域環境下實現安全、穩定、合規運行等問題。

贊助商廣告

圍繞這一變化，F5 給出的思路是將其長期積累的應用交付能力，進一步延伸至AI應用交付與安全平台。其核心邏輯是通過其ADSP平台，基於Token的負載均衡方案TBLB（Token Based Load Balancing），以及「AI紅隊」「AI護欄」與自動化修復能力，把算力、應用、Token和安全納入同一套交付體系，進行統一治理。

01 Token經濟改寫應用交付邏輯

其實，F5三十年的發展始終隨著應用形態變化而演進。

1996年，F5推出BIG-IP，圍繞網際網路應用的穩定性、擴展性和訪問性能，推動ADC應用交付控制能力的發展。

進入雲計算階段後，應用加速雲化、API化和微服務化，F5的能力也擴展到私有雲、公有雲和多雲環境，進入ADC 2.0階段。

到了AI時代，應用形態再次變化。大模型、智能體、數據、API和算力基礎設施邁向Token經濟時代F5以AI賦能交付築基智能新生態共同構成新的應用體系。「如今，企業需要處理的不再僅僅是傳統訪問流量，更多的是模型調用、推理排隊、Token生成、AI安全防護和跨雲協同等問題。」F5北亞區總裁黃彥文指出。

F5北亞區總裁黃彥文

應用交付對象發生變化後，衡量交付效率的單位也隨之變化。F5中國區產品及解決方案總經理陳亮提到，目前中國每天產生的Token規模已達到約140萬億，折算約為每秒16億Token。當交付規模進入這一量級後，Token 已不再只是模型輸出的計量單位，而開始直接對應計算成本、資源消耗、用戶體驗以及最終的業務價值。

換句話說，每一次Token的生成、調度與交付效率，都會影響企業的AI投入產出比。

圍繞Token經濟，陳亮提出了四個核心支柱。其一，AI 集群的高並發供給能力決定 Token的生產能力，是整個系統的產能底座；其二，首Token 時延與端到端響應流暢度直接影響用戶體驗；其三，單位Token的 ROI 決定企業的經濟效益；其四，全鏈路安全能力與長期運行穩定性，決定AI應用能否實現持續、可靠交付。

贊助商廣告

本質上來看，這是一套圍繞Token構建的交付體系，覆蓋生成、傳輸、調度到安全防護的完整生命周期。

02 TBLB解決異構算力的調度難題

當Token成為新的治理對象，算力調度的複雜性也被進一步放大。尤其在中國市場，很多企業會同時使用NVIDIA、AMD、華為、寒武紀邁向Token經濟時代F5以AI賦能交付築基智能新生態、海光資訊等不同品牌、不同代際的算力資源。

這種部署方式雖然提升了靈活性，但也帶來了模型適配和調度的複雜度。

原因在於，AI推理請求並不像普通Web請求，其代碼重構、影片生成、圖像生成、文檔總結等任務，對後端GPU、模型和推理引擎的消耗並不相同。如果調度系統只能基於連接數、請求數或伺服器狀態進行分發，就容易出現部分GPU節點擁塞、部分節點低負載的情況。

這也正是F5提出TBLB的背景。在這一機制中，Token除了作為模型輸出的計量單位，更作為資源調度的核心對象。系統會結合大模型服務（LLM）運行狀態、算力負載、請求排隊情況、Token時延，以及推理成功率等資訊，實時完成任務分發與資源匹配。

其關鍵邏輯在於，讓不同類型、不同優先級的推理任務，匹配更合適的算力資源，從而在保障響應體驗的同時，提高整體資源利用效率。

從具體場景來看，TBLB的價值體現在提升既有資源的使用效率上。

就比如，某汽車行業客戶採用6塊NVIDIA A40與8塊L20的混合部署，通過F5的賦能，在未增加額外算力投入的情況下，實現了首Token生成速度提升30.3%，端到端訪問速度提升48.68%；某運營商客戶基於華為Ascend 910B算力資源，引入F5能力後，並發用戶承載能力提升至少75%，首Token生成速度提升99%。另一家銀行業的客戶，採用3塊阿里平頭哥PPU與3塊NVIDIA H20的異構架構，優化後首Token生成速度提升42.2%，Token輸出流暢度提升7.1%。

F5亞太區首席技術官Mohan Veloo從成本視角解釋了這一能力的意義。在他看來，企業建設AI工廠往往意味著數十億美元級別的算力投入，因此，即便GPU綜合利用率僅提升20%，也足以釋放可觀的經濟價值。尤其在GPU採購成本持續增加、供給周期較長、硬體疊代不斷加速的背景下，相比持續追加採購，更可持續的路徑，是優先激活並釋放既有算力資源的潛力。

贊助商廣告

F5亞太區首席技術官 Mohan Veloo

03 同步推進AI安全閉環與本土創新

如果說TBLB解決的是AI推理階段的交付效率問題，那麼F5圍繞AI應用交付平台提供的「AI紅隊」（AI Red Teaming）與「AI護欄」（AI Guardrails）能力，解決的則是AI應用規模化後的安全治理問題。前者負責主動發現風險，後者負責在運行時防護，兩者共同構成AI應用交付過程中的安全閉環。

原因在於，隨著Token交付鏈路不斷延長、模型調用場景持續複雜化，AI系統暴露出的攻擊面也在快速擴大。企業面對的風險，開始延伸至模型輸入、推理過程與輸出結果的全鏈路安全。

Mohan Veloo指出，AI正在改變攻防關係。攻擊者已經能夠藉助AI更快生成攻擊載荷、發現漏洞並實現自動化利用，而許多企業的防禦體系仍停留在依賴人工研判與靜態規則的階段。這種「攻擊自動化、防禦人工化」的能力失衡，正在持續放大安全壓力。

對此，F5的策略是，通過引入AI能力，形成「發現—防護—修復」的完整閉環。

具體來說，AI紅隊承擔了發現風險的角色，通過AI智能體模擬真實用戶行為和攻擊路徑，對提示詞注入、數據泄露、越權訪問、越獄攻擊等風險進行持續探測。AI護欄則部署在模型調用鏈路中，對輸入、輸出以及上下文交互過程進行實時語義分析、策略控制與風險攔截，實現運行時治理。

進一步地，AI紅隊發現的問題還能夠自動調用為AI護欄策略，並結合虛擬補丁能力完成持續修復，在不中斷業務運行的前提下緩解安全風險，從而形成從發現到治理再到修復的閉環能力。

從第三方評測結果來看，在SecureIQLab測試中，F5 的AI護欄面對約2萬次攻擊取得98.36%的總體安全得分。其中，直接提示詞注入防禦達到99.3%，過度代理防護達到98.7%，敏感數據泄露防護達到99.0%。

針對中文應用場景，F5還基於清華大學公開發布的中文大模型安全數據集進行了驗證。材料顯示，在髒話侮辱、違法犯罪、偏見歧視等多類敏感內容識別，和指令型攻擊場景下F5整體保持領先。

贊助商廣告

安全能力之外，F5也將AI用於自身服務體系建設。

陳亮介紹，F5已在內部服務體系中引入大模型能力，並命名為ServiceGPT。通過該系統可以打通產品開發體系、知識庫、案例系統，輔助服務團隊快速完成問題定位與根因分析，使問題研判效率提升約23%，平均定位時間縮短至約0.8天。

這些能力建設，也對應著F5中國戰略方向的調整。

黃彥文提到，F5中國戰略已從「創新中國，服務中國」升級為「創新中國，鏈接全球」。TBLB、ServiceGPT，以及新成立的F5 AI應用工程部，都是中國團隊推動形成的本土創新成果。這也意味著，中國市場正在成為原創能力向全球輸出的重要節點。

在生態層面，F5北亞區區域副總裁及解決方案資深架構諮詢師張振倫補充表示，F5將持續投入全球及中國開源生態建設，NGINX也將繼續保持開源版本疊代更新。面向中國AI生態，F5計劃兼容國內主流推理引擎、開源組件與開發平台，幫助開發者和企業用戶更順暢地接入AI創新能力與安全能力。

此外，針對Kubernetes生態中部分入口控制器後續維護策略調整帶來的影響，陳亮表示，作為CNCF黃金會員，F5將持續投入技術與資源，為用戶提供成熟、平滑的遷移替代路徑。