本文内容是参考华为公开资料形成的个人观点,无侵权行为,内容仅供学习!

昇腾910是华为的AI训练卡,基于7nm EUV工艺,其中有16个基于ARMv8定制的CPU,32个Ascend-Max AI加速器,使用4*6的无缓存NoC Mesh进行互联,使用HBM(High Bandwidth Memory)进行存储,提供128通道的视频译码器。

指标:

  • 四个HBM总带宽1.2TB/s
  • 相邻节点(我的理解是Ascend-Max核)带宽为1024bit*2GHz=256GB/s
  • 昇腾910每秒提供256万亿次fp16浮点运算,512万亿次int8运算
  • LLC总吞吐量为4TB/s