2025年12月10日,英偉達發布全新可視化GPU集群監控方案,旨在幫助雲服務合作夥伴精準計算GPU正常運行時間,提升資源管理效率。

該方案由用戶自願選擇並自行安裝,通過開源客戶端軟體代理實現實時監控,可追蹤功耗峰值、集群利用率、內存帶寬及互聯狀態,並具備錯誤檢測與熱控制預警功能,有效避免過熱降頻和組件老化風險。

英偉達特別強調,其GPU產品不包含任何硬體追蹤技術、遠程終止開關或後門,充分保障用戶安全與隱私。 此外,公司計劃將客戶端軟體代理開源,以提供更高的透明度和可審計性。該軟體僅提供只讀遙測數據,無法修改GPU配置或底層運作方式,由客戶完全掌控並支持按需定製。






