华为最近可是个大动作,推出了昇腾910B芯片和Atlas 300I Pro新一代算力加速卡,性能直接给咱们拉满,快到了H20的三倍呢。接下来咱们仔细唠唠这款芯片和加速卡的参数还有商业应用。 先说说昇腾910B芯片,它可是华为自研的达芬奇架构,核心数达到了32个。支持的FP16精度能达到256 TFLOPS,INT8精度也能跑到512 TOPS。这次还支持FP4混合精度计算,效率和精度都有保障。芯片制程用的是7nm EUV工艺,GPU内存带宽超1 TB/s。功耗只有310W,算力功耗比更是超越了不少竞品。 再看Atlas 300I Pro加速卡,也是用的昇腾910B芯片。峰值算力和昇腾910B一样给力。峰值FP16算力达到了256 TFLOPS,INT8算力512 TOPS。显存容量也是32GB的HBM2e。 这次还带了个Atlas 300V Pro卡做对比呢,硬件参数也是一样的给力。支持PCIe 4.0 x16接口和双端口ROCE v2技术。散热设计上还能根据用户需求选风冷或者液冷。 这个产品商用进展也很迅速。华为云这边用千卡集群支持了像盘古大模型这样的大模型训练和推理任务。还有像招商银行、中国移动这些大企都在用Atlas 300做金融风控和通信网络AI平台。智慧城市和工业质检也都在应用中呢,比如宁德时代电池检测效率提升了40%。医疗影像方面联影医疗也在用这个系统辅助诊断。 ISV方面也有好消息了,超图软件、东方国信等超过50家ISV已经完成了适配工作。还有高校合作方面也很给力,清华、浙大这些学校都有开设昇腾AI开发课程。开源社区MindSpore框架装机量超过200万了,兼容性也很强支持PyTorch和TensorFlow模型呢。 对比一下竞品也不错啊,昇腾910B + Atlas 300和NVIDIA A100 80GB比起来,在FP16算力上差不多都是256 TFLOPS级别,但是能效比更给力呢。还有安全方面的优势也是很明显的。 未来技术方面还要继续迭代呢,预计2024年会推出3nm工艺的下一代芯片呢。目标是要把FP16算力推到400 TFLOPS以上。还会加强软件生态建设,比如CANN 7.0支持自动分布式切分。MindSpore 3.0还要强化科学计算能力。边缘场景方面也要扩展到Atlas 300I Mini卡上去覆盖智能车载和机器人场景呢。 这次发布的产品通过高性能算力加上全栈国产化的优势已经在金融、制造、政务等关键领域实现规模化商用了。随着大模型推动AI算力需求爆发以后呢,它在高能效比和安全合规方面的特性肯定会加速替代进程的步伐吧?