核心成就:在2.5 PetaOPS算力支撐下,實現跨多路8K影片流的實時AI嫌疑人識別與威脅檢測
技術棧:Voyager SDK + Axelera Metis + Intel Xeon
未來展望:下一代Europa架構將帶來3倍性能提升
在ISC West展會上,企業領導者普遍反映,邊緣AI的"試點階段"已然結束。現階段的核心挑戰在於規模化落地——不再局限於單一模型處理單路影片流,而是要以商業可行的成本,在多路影片流上協同調度數十個AI模型。
2026年回歸ISC West展會,Axelera帶來了迄今最具野心的互動體驗,旨在充分展示實時、多模型、高解析度多路流安全系統的極限能力。
去年,Axelera率先展示了8K AI推理方案。如今,Voyager SDK進一步擴展了安全相關功能,涵蓋嫌疑人識別、告警與可視化框架,旨在縮短操作員響應時間,尤其是在展廳現場檢測到潛在武器時。此次聯合四家ISV合作夥伴打造的安全演示,充分呈現了客戶如何便捷地訓練、部署自定義模型,並將其集成至端到端軟體流水線,實現規模化即插即用AI解決方案,同時彰顯了Voyager SDK的成熟度。
Voyager SDK與Metis AIPU的核心能力
基於Axelera Metis AIPU與Voyager SDK進行開發,可獲得一整套開箱即用的高並發多路流AI工作負載編排能力,具體包括:
硬體加速解碼:同步採集並解碼多路4K/8K影片流,確保低延遲與高吞吐量。
基於切片的預處理:將高解析度影片流切分為相互重疊的圖像塊,保障AI對小目標的高精度檢測,同時通過透視變換對不同攝像機角度進行歸一化處理。
並發分析:並行運行多個模型,實時檢測並追蹤人員、面部特徵點及目標物體。
模型級聯:將檢測器輸出傳遞至下游模型,例如將人臉檢測器的興趣區域輸出傳入識別模型。
自定義流水線邏輯:集成用戶自定義代碼,實現條件邏輯以篩選特定幀或興趣區域,傳遞至下游模型。
智能邊緣編排:僅將關鍵元數據/事件上傳雲端以優化頻寬,同時在本地保留原始高解析度影片供取證存檔。
Voyager SDK新增功能:支持在流水線中嵌入自定義C++與Python邏輯,為現代高性能應用提供所需的架構靈活性。
嫌疑人追蹤流水線
在真實環境中識別和追蹤嫌疑人面臨重重挑戰:目標可能穿行於人群之中,被遮擋物遮蔽,或刻意規避攝影機。系統還須應對光線不足、運動模糊、面部角度多變等複雜條件。
人臉識別模型對輸入質量極為敏感,若不加區分地處理模糊、偏角或局部遮擋的人臉,不僅會增加漏識(未能識別已知目標)和誤識(錯誤匹配)的概率,還會浪費寶貴的AI算力。
為此,系統需要從逐幀識別轉向更精細的時序處理。在檢測器後引入追蹤器,開發者可在多幀中識別同一個體,並為每個追蹤ID構建姿態質量緩衝區。結合條件邏輯,系統可篩選出質量最高的檢測裁圖,在提升準確率的同時節省算力資源。
隨著被追蹤人員在場景中移動,其對應的姿態質量緩衝區會依據姿態角度、像素密度和光照等指標,持續填充最優興趣區域。每個新興趣區域僅在評分高於緩衝區最弱幀時才會替換之。隨著時間推移,劣質角度與模糊幀被逐步過濾,確保輸入識別模型的數據始終可靠。
系統檢測到的首個高質量興趣區域可立即級聯至識別模型,在姿態質量緩衝區持續填充的同時完成初步身份識別。一旦緩衝區達到預設閾值,系統隨即執行批量處理以精化結果。識別輸出通過貝葉斯更新進行融合,生成累積置信度評分,有效將多個低置信度匹配結果疊加轉化為單一高確定性識別結論。
從數學角度來看,兩個相互獨立的70%匹配結果所提供的確定性,高於單個90%的匹配結果。這一架構設計確保了時序穩定性,並對噪聲和異常值具有較強抗干擾能力——一旦通過多幀高質量圖像確立高置信度身份,來自模糊幀或短暫遮擋的瞬時數據將不會推翻已有的累積證據。
系統還設有覆蓋門控機制,專門處理目標僅在單幀中清晰出現的情況。若某個傳入興趣區域同時滿足高質量正面姿態與高置信度匹配,系統將立即判定識別結果可靠,觸發即時告警,並可配置為覆蓋現有的低質量數據緩衝區。該機制有效避免了時序盲區,確保即便對目標的高質量捕捉僅曇花一現,也能成功完成身份識別。
嫌疑人追蹤與武器檢測聯合流水線
接下來,系統將嫌疑人追蹤器與實時武器檢測相結合,專為多模型並發場景而設計,開發者可通過並行運行多種分析模型輕鬆擴展系統功能。
為最大化檢測可靠性,每名目標以人體與人臉檢測對的形式呈現。系統在每幀上並行運行人體與人臉檢測模型,構建雙路徑追蹤:當身體被人群或物體遮擋時仍可識別人臉,當人臉不可見時仍可追蹤人體。應用程式通過動態映射重疊檢測結果,為每名目標維持持久化身份標識。
流水線配置確保不丟幀:若新幀到達時識別任務尚未完成,剩餘任務將被異步調度至後續檢測中,使系統能夠隨時間推移對整個場景進行疊代掃描與解析,同時不影響攝影機吞吐量(類似人類處理場景的方式,但速度快得多)。
整套方案遵循"快速提交、持續精化"的設計理念:以第一個高質量匹配結果建立低延遲初始身份,同時維護姿態質量緩衝區以持續提升確定性,配合覆蓋門控機制確保即便是短暫的高質量捕捉也能成功識別。
在界面管理方面,系統以高解析度興趣區域網格(全景視圖)展示所有被追蹤人員。藉助完整的3300萬像素解析度,操作員可對遠距離目標保持清晰可見,避免在普通顯示器上因解析度降採樣而導致目標丟失。界面採用雙向聯動設計:將光標懸停於網格中的某人時,系統會在原始影片流中畫線標註其位置,反之亦然。操作員可一鍵切換,在每人的實時畫面與姿態質量緩衝區最優截圖之間自由切換。
武器檢測演示方案
考慮到在展廳展示真實武器既不現實也存在風險,本次演示選用了一款來自更古典時代的"武器"——光劍。具體而言,選取了Count Dooku的獨特彎柄光劍作為檢測目標,其獨特的彎曲手柄設計高度還原了戰術警棍、刀刃武器或槍支消音器的幾何形態特徵,能夠在真實多攝影機8K原生推理環境中實現高精度檢測,兼具視覺衝擊力與零風險的特點。
Axelera監控方案配置(ISC West 2026展示版本):
嫌疑人監控名單:Axelera員工作為嫌疑人身份追蹤的主要目標進行註冊登記
武器檢測:基於Ultralytics YOLOv8l訓練的定製光劍檢測模型充當武器檢測器
8K攝影機配置:兩台Axis Q1809-LE 8K IP攝像機部署於展台頂部,俯瞰展廳全景
8K顯示屏:75英寸8K顯示器左側展示兩路主影片流(降採樣),右側展示全景視圖網格
焦點視圖單元:網格內設置大面積區域用於突出顯示高優先級武器告警;無告警時,該區域切換為展台內部4K攝影機實時畫面,供訪客互動
個人防護裝備(PPE)合規驗證:當4K展台攝影機檢測到身著完整PPE服裝的人員時,界面亮起綠色盾牌圖標以示合規
邊緣至雲端編排:檢測觸發展台現場告警的同時,自動向ServiceNow推送事件工單,供遠程響應處理
此次演示融合了多方合作成果:Digica提供人臉檢測與識別模型;Innowise利用Synthera合成數據與真實圖像混合數據集開發光劍檢測模型;SpanIdea貢獻了能夠區分普通參觀者與建築工人的PPE檢測模型。
硬體配置與性能表現
為實現多路8K影片流的多模型實時推理,系統採用ORIGIN L-Class V2工作站,搭載Intel Xeon W7-3565X 32核處理器,並配備獨立GPU負責視覺流水線處理(解碼與8K渲染)。
計算核心由三塊Axelera 4晶片Metis卡構成,共提供48個AIPU核心,峰值並行處理能力達2.5 PetaOPS,足以支撐高解析度切片處理與模型推理所需的算力。系統通過Ubiquiti Switch Pro XG 24 PoE交換機接入展台基礎設施,為AXIS 8K攝像機提供高頻寬數據傳輸與供電保障。
在8K解析度下運行監控方案,對實時響應能力提出了極高的吞吐量要求,系統關鍵性能指標如下:
切片吞吐量:完整配置方案下,系統處理速度達288塊/秒。
模型並發數:每塊4晶片Metis卡最多並行執行16個模型實例。
系統總容量:三塊卡合計在48個核心上運行5個主模型和1個輔助模型,綜合吞吐量不低於1440次模型推理/秒,確保所有影片流穩定推理,無熱降頻或性能劣化。
能效表現:在保持高處理速率的同時,Metis架構維持高效的功耗水平,每塊卡典型功耗僅為30至58瓦。
未來展望:Europa架構與生態系統演進
Axelera始終保持持續創新。下一代Europa架構性能較Metis提升3倍,集成片上影片解碼與向量引擎以加速預處理,為下一代監控系統提供充裕的AI算力餘量。
與此同時,Voyager流水線對自定義Python邏輯的支持,標誌著邁向Python友好型Pipeline Builder API的重要第一步,賦予開發者充分自由,以高性能執行方式構建複雜且線程安全的流水線,直接踐行Axelera讓AI普惠大眾的使命。
Axelera不斷壯大的生態系統為客戶提供了日益豐富的模型與能力選擇,可靈活集成至各類解決方案中。Axelera藍圖支持開發者將官方模型庫與ISV合作夥伴模型自由組合,實現超越簡單告警的自主邊緣響應——在本地發起實時防禦協議,同時大幅降低軟體成本並加速產品上市進程。
Axelera在三項核心需求上實現了獨特突破:
易用性:可針對嵌入式、桌面及企業級硬體進行快速參數化定製。
靈活性:在單一模組化流水線內管理多樣化任務與複雜數據流需求。
性能:Voyager SDK負責處理底層繁雜工作,包括跨攝像機、解碼器、主機CPU與Metis硬體的多流線程、緩衝區共享與同步。
通過提供這些基礎硬體與軟體構建模組,Axelera AI正在推動高性能安全系統的規模化落地,助力客戶從容應對持續演進的安全威脅。
——Doug Watt,Axelera AI應用工程總監
Q&A
Q1:Axelera Metis AIPU在多路8K影片流處理中的性能表現如何?
A:三塊Axelera 4晶片Metis卡共提供48個AIPU核心,峰值並行處理能力達2.5 PetaOPS。系統在完整配置下可達到288塊切片/秒的處理速度,綜合推理吞吐量不低於1440次模型推理/秒,每塊卡典型功耗僅30至58瓦,在保持高性能的同時兼顧能效表現。
Q2:Voyager SDK的姿態質量緩衝區機制是如何提升人臉識別準確率的?
A:系統為每個追蹤ID構建姿態質量緩衝區,依據姿態角度、像素密度和光照等指標持續填充最優興趣區域。新幀僅在評分高於緩衝區最弱幀時才會替換。識別結果通過貝葉斯更新融合,生成累積置信度評分,有效將多個低置信度匹配轉化為高確定性識別結論,顯著降低漏識與誤識率。
Q3:Axelera下一代Europa架構相比Metis有哪些提升?
A:Europa架構性能較Metis提升3倍,集成了片上影片解碼與向量引擎,可加速預處理流程,為下一代監控系統提供更充裕的AI算力餘量。同時,Voyager流水線將引入Python友好型Pipeline Builder API,賦予開發者更大的自由度,以高性能方式構建複雜且線程安全的流水線。






