面向企業的邊緣AI擴展：構建終極多模型多路流安全系統

核心成就：在2.5 PetaOPS算力支撐下，實現跨多路8K影片流的實時AI嫌疑人識別與威脅檢測

贊助商廣告

技術棧：Voyager SDK + Axelera Metis + Intel Xeon

未來展望：下一代Europa架構將帶來3倍性能提升

在ISC West展會上，企業領導者普遍反映，邊緣AI的"試點階段"已然結束。現階段的核心挑戰在於規模化落地——不再局限於單一模型處理單路影片流，而是要以商業可行的成本，在多路影片流上協同調度數十個AI模型。

2026年回歸ISC West展會，Axelera帶來了迄今最具野心的互動體驗，旨在充分展示實時、多模型、高解析度多路流安全系統的極限能力。

去年，Axelera率先展示了8K AI推理方案。如今，Voyager SDK進一步擴展了安全相關功能，涵蓋嫌疑人識別、告警與可視化框架，旨在縮短操作員響應時間，尤其是在展廳現場檢測到潛在武器時。此次聯合四家ISV合作夥伴打造的安全演示，充分呈現了客戶如何便捷地訓練、部署自定義模型，並將其集成至端到端軟體流水線，實現規模化即插即用AI解決方案，同時彰顯了Voyager SDK的成熟度。

Voyager SDK與Metis AIPU的核心能力

基於Axelera Metis AIPU與Voyager SDK進行開發，可獲得一整套開箱即用的高並發多路流AI工作負載編排能力，具體包括：

硬體加速解碼：同步採集並解碼多路4K/8K影片流，確保低延遲與高吞吐量。

基於切片的預處理：將高解析度影片流切分為相互重疊的圖像塊，保障AI對小目標的高精度檢測，同時通過透視變換對不同攝像機角度進行歸一化處理。

並發分析：並行運行多個模型，實時檢測並追蹤人員、面部特徵點及目標物體。

模型級聯：將檢測器輸出傳遞至下游模型，例如將人臉檢測器的興趣區域輸出傳入識別模型。

自定義流水線邏輯：集成用戶自定義代碼，實現條件邏輯以篩選特定幀或興趣區域，傳遞至下游模型。

智能邊緣編排：僅將關鍵元數據/事件上傳雲端以優化頻寬，同時在本地保留原始高解析度影片供取證存檔。

贊助商廣告

Voyager SDK新增功能：支持在流水線中嵌入自定義C++與Python邏輯，為現代高性能應用提供所需的架構靈活性。

嫌疑人追蹤流水線

在真實環境中識別和追蹤嫌疑人面臨重重挑戰：目標可能穿行於人群之中，被遮擋物遮蔽，或刻意規避攝影機。系統還須應對光線不足、運動模糊、面部角度多變等複雜條件。

人臉識別模型對輸入質量極為敏感，若不加區分地處理模糊、偏角或局部遮擋的人臉，不僅會增加漏識（未能識別已知目標）和誤識（錯誤匹配）的概率，還會浪費寶貴的AI算力。

為此，系統需要從逐幀識別轉向更精細的時序處理。在檢測器後引入追蹤器，開發者可在多幀中識別同一個體，並為每個追蹤ID構建姿態質量緩衝區。結合條件邏輯，系統可篩選出質量最高的檢測裁圖，在提升準確率的同時節省算力資源。

隨著被追蹤人員在場景中移動，其對應的姿態質量緩衝區會依據姿態角度、像素密度和光照等指標，持續填充最優興趣區域。每個新興趣區域僅在評分高於緩衝區最弱幀時才會替換之。隨著時間推移，劣質角度與模糊幀被逐步過濾，確保輸入識別模型的數據始終可靠。

系統檢測到的首個高質量興趣區域可立即級聯至識別模型，在姿態質量緩衝區持續填充的同時完成初步身份識別。一旦緩衝區達到預設閾值，系統隨即執行批量處理以精化結果。識別輸出通過貝葉斯更新進行融合，生成累積置信度評分，有效將多個低置信度匹配結果疊加轉化為單一高確定性識別結論。

從數學角度來看，兩個相互獨立的70%匹配結果所提供的確定性，高於單個90%的匹配結果。這一架構設計確保了時序穩定性，並對噪聲和異常值具有較強抗干擾能力——一旦通過多幀高質量圖像確立高置信度身份，來自模糊幀或短暫遮擋的瞬時數據將不會推翻已有的累積證據。

系統還設有覆蓋門控機制，專門處理目標僅在單幀中清晰出現的情況。若某個傳入興趣區域同時滿足高質量正面姿態與高置信度匹配，系統將立即判定識別結果可靠，觸發即時告警，並可配置為覆蓋現有的低質量數據緩衝區。該機制有效避免了時序盲區，確保即便對目標的高質量捕捉僅曇花一現，也能成功完成身份識別。

贊助商廣告

嫌疑人追蹤與武器檢測聯合流水線

接下來，系統將嫌疑人追蹤器與實時武器檢測相結合，專為多模型並發場景而設計，開發者可通過並行運行多種分析模型輕鬆擴展系統功能。

為最大化檢測可靠性，每名目標以人體與人臉檢測對的形式呈現。系統在每幀上並行運行人體與人臉檢測模型，構建雙路徑追蹤：當身體被人群或物體遮擋時仍可識別人臉，當人臉不可見時仍可追蹤人體。應用程式通過動態映射重疊檢測結果，為每名目標維持持久化身份標識。

流水線配置確保不丟幀：若新幀到達時識別任務尚未完成，剩餘任務將被異步調度至後續檢測中，使系統能夠隨時間推移對整個場景進行疊代掃描與解析，同時不影響攝影機吞吐量（類似人類處理場景的方式，但速度快得多）。

整套方案遵循"快速提交、持續精化"的設計理念：以第一個高質量匹配結果建立低延遲初始身份，同時維護姿態質量緩衝區以持續提升確定性，配合覆蓋門控機制確保即便是短暫的高質量捕捉也能成功識別。

在界面管理方面，系統以高解析度興趣區域網格（全景視圖）展示所有被追蹤人員。藉助完整的3300萬像素解析度，操作員可對遠距離目標保持清晰可見，避免在普通顯示器上因解析度降採樣而導致目標丟失。界面採用雙向聯動設計：將光標懸停於網格中的某人時，系統會在原始影片流中畫線標註其位置，反之亦然。操作員可一鍵切換，在每人的實時畫面與姿態質量緩衝區最優截圖之間自由切換。

武器檢測演示方案

考慮到在展廳展示真實武器既不現實也存在風險，本次演示選用了一款來自更古典時代的"武器"——光劍。具體而言，選取了Count Dooku的獨特彎柄光劍作為檢測目標，其獨特的彎曲手柄設計高度還原了戰術警棍、刀刃武器或槍支消音器的幾何形態特徵，能夠在真實多攝影機8K原生推理環境中實現高精度檢測，兼具視覺衝擊力與零風險的特點。

贊助商廣告

Axelera監控方案配置（ISC West 2026展示版本）：

嫌疑人監控名單：Axelera員工作為嫌疑人身份追蹤的主要目標進行註冊登記

武器檢測：基於Ultralytics YOLOv8l訓練的定製光劍檢測模型充當武器檢測器

8K攝影機配置：兩台Axis Q1809-LE 8K IP攝像機部署於展台頂部，俯瞰展廳全景

8K顯示屏：75英寸8K顯示器左側展示兩路主影片流（降採樣），右側展示全景視圖網格

焦點視圖單元：網格內設置大面積區域用於突出顯示高優先級武器告警；無告警時，該區域切換為展台內部4K攝影機實時畫面，供訪客互動

個人防護裝備（PPE）合規驗證：當4K展台攝影機檢測到身著完整PPE服裝的人員時，界面亮起綠色盾牌圖標以示合規

邊緣至雲端編排：檢測觸發展台現場告警的同時，自動向ServiceNow推送事件工單，供遠程響應處理

此次演示融合了多方合作成果：Digica提供人臉檢測與識別模型；Innowise利用Synthera合成數據與真實圖像混合數據集開發光劍檢測模型；SpanIdea貢獻了能夠區分普通參觀者與建築工人的PPE檢測模型。

硬體配置與性能表現

為實現多路8K影片流的多模型實時推理，系統採用ORIGIN L-Class V2工作站，搭載Intel Xeon W7-3565X 32核處理器，並配備獨立GPU負責視覺流水線處理（解碼與8K渲染）。

計算核心由三塊Axelera 4晶片Metis卡構成，共提供48個AIPU核心，峰值並行處理能力達2.5 PetaOPS，足以支撐高解析度切片處理與模型推理所需的算力。系統通過Ubiquiti Switch Pro XG 24 PoE交換機接入展台基礎設施，為AXIS 8K攝像機提供高頻寬數據傳輸與供電保障。

在8K解析度下運行監控方案，對實時響應能力提出了極高的吞吐量要求，系統關鍵性能指標如下：

切片吞吐量：完整配置方案下，系統處理速度達288塊/秒。

模型並發數：每塊4晶片Metis卡最多並行執行16個模型實例。

系統總容量：三塊卡合計在48個核心上運行5個主模型和1個輔助模型，綜合吞吐量不低於1440次模型推理/秒，確保所有影片流穩定推理，無熱降頻或性能劣化。

贊助商廣告

能效表現：在保持高處理速率的同時，Metis架構維持高效的功耗水平，每塊卡典型功耗僅為30至58瓦。

未來展望：Europa架構與生態系統演進

Axelera始終保持持續創新。下一代Europa架構性能較Metis提升3倍，集成片上影片解碼與向量引擎以加速預處理，為下一代監控系統提供充裕的AI算力餘量。

與此同時，Voyager流水線對自定義Python邏輯的支持，標誌著邁向Python友好型Pipeline Builder API的重要第一步，賦予開發者充分自由，以高性能執行方式構建複雜且線程安全的流水線，直接踐行Axelera讓AI普惠大眾的使命。

Axelera不斷壯大的生態系統為客戶提供了日益豐富的模型與能力選擇，可靈活集成至各類解決方案中。Axelera藍圖支持開發者將官方模型庫與ISV合作夥伴模型自由組合，實現超越簡單告警的自主邊緣響應——在本地發起實時防禦協議，同時大幅降低軟體成本並加速產品上市進程。

Axelera在三項核心需求上實現了獨特突破：

易用性：可針對嵌入式、桌面及企業級硬體進行快速參數化定製。

靈活性：在單一模組化流水線內管理多樣化任務與複雜數據流需求。

性能：Voyager SDK負責處理底層繁雜工作，包括跨攝像機、解碼器、主機CPU與Metis硬體的多流線程、緩衝區共享與同步。

通過提供這些基礎硬體與軟體構建模組，Axelera AI正在推動高性能安全系統的規模化落地，助力客戶從容應對持續演進的安全威脅。

——Doug Watt，Axelera AI應用工程總監

Q&A

Q1：Axelera Metis AIPU在多路8K影片流處理中的性能表現如何？

A：三塊Axelera 4晶片Metis卡共提供48個AIPU核心，峰值並行處理能力達2.5 PetaOPS。系統在完整配置下可達到288塊切片/秒的處理速度，綜合推理吞吐量不低於1440次模型推理/秒，每塊卡典型功耗僅30至58瓦，在保持高性能的同時兼顧能效表現。

Q2：Voyager SDK的姿態質量緩衝區機制是如何提升人臉識別準確率的？

贊助商廣告

A：系統為每個追蹤ID構建姿態質量緩衝區，依據姿態角度、像素密度和光照等指標持續填充最優興趣區域。新幀僅在評分高於緩衝區最弱幀時才會替換。識別結果通過貝葉斯更新融合，生成累積置信度評分，有效將多個低置信度匹配轉化為高確定性識別結論，顯著降低漏識與誤識率。

Q3：Axelera下一代Europa架構相比Metis有哪些提升？

A：Europa架構性能較Metis提升3倍，集成了片上影片解碼與向量引擎，可加速預處理流程，為下一代監控系統提供更充裕的AI算力餘量。同時，Voyager流水線將引入Python友好型Pipeline Builder API，賦予開發者更大的自由度，以高性能方式構建複雜且線程安全的流水線。