跪久了,看到站着会生气的
会上PPT显示,Asend 910基于达芬奇(Da Vinci)核心架构,采用7nm增强版EUV工艺打造,单Die内建32颗达芬奇核心,半精度高达256TFOPs,功耗350W。Ascend 910 的运算密度超越了竞品NVIDIA Tesla V100和谷歌TPU v3,华为还设计了拥有2048个节点的AI运算服务器,整体性能多达512 Peta Flops(2048 x 256)。
另据华为官方微信,达芬奇主要由核心的3D Cube、Vector向量计算单元、Scalar标量计算单元等组成,3D Cube针对矩阵运算做加速,大幅提升单位功耗下的AI算力,每个AI Core可以在一个时钟周期内实现4096个MAC操作。同时,Buffer L0A、L0B、L0C则用于存储输入矩阵和输出矩阵数据,负责向Cube计算单元输送数据和存放计算结果。