AMD宣布,推出Instinct MI350P PCIe加速卡,屬於標準風冷伺服器使用的雙槽厚度擴展卡,用於推理工作負載,適配當前數據中心的電力、散熱和機架基礎設施,旨在為代理型AI時代做好準備。這也是AMD時隔四年再次帶來PCIe AIC形態的加速卡,期間同類產品採用的是OAM外形規格。

Instinct MI350P PCIe基於CDNA 4架構,採用了N3P工藝的加速器複合核心(XCD)和N6工藝的I/O核心(IOD),整體規格是在MI350X基礎上減半。新款GPU包含了有4個XCD模組,每個XCD模組32組計算單元,共計128組,512個矩陣核心,每個XCD配置2MB L2緩存,最高頻率達2200MHz;IOD提供有64通道HBM3E顯存接口與128MB容量的AMD Infinity緩存;搭配的HBM3E顯存採用4堆棧結構,每個堆棧為12層堆疊的36GB,共144GB容量,頻率為8Gbps,可提供4TB/s的顯存頻寬;整卡功耗為450W,可最高配置至600W,通過單個12V-2×6接口供電。

Instinct MI350P PCIe原生支持MXFP4和MXFP6等低精度格式,這兩者的算力都可以達到4.6 PFLOPs,並為主流8位和16位精度提供稀疏加速。由於英偉達沒有推出基於Blackwell架構的B200 PCIe版本,只停留在Hopper架構的H200 NVL,AMD的新品可以說是最強同類PCIe產品。按照AMD的說法,Instinct MI350P PCIe相比於H200 NVL,FP64性能高出20%,FP16性能高出43%,FP8性能高出39%。

AMD表示,Instinct MI350P PCIe可組建由八張加速卡組成的系統,採用風冷散熱,非常適合用於推理和RAG流水線的小型、中型和大型AI模型。目前新產品已經通過合作夥伴銷售,可支持完整的ROCm開放軟體棧。






