之前摩尔线程的MTT S5000 GPU已经完全适配了阿里最新推出的Qwen3.5-397B-A17B模型,这次给大家带来的好消息是,它也把Qwen3.5系列中的另外三款中等规模模型都搞定了。这三款模型分别是Qwen3.5-35B-A3B、Qwen3.5-122B-A10B和Qwen3.5-27B(Dense)。摩尔线程是第一时间把这三款新模型全部搬上了自己的旗舰级AI训推一体全功能GPU上,现在开发者只要有这个硬件就能直接用起来。这次适配过程中,摩尔线程给开发者吃了颗定心丸:现在用MUSA C写内核开发特别方便,开发者不用大费周章去迁移CUDA项目;熟悉Triton语法的朋友也能通过Triton-MUSA后端把高性能算子无缝跑在MTT S5000上。 底层技术方面,针对Qwen3.5多模态模型用到的那种混合注意力机制,摩尔线程直接把muDNN计算库和MATE开源算子库结合起来用。这一举动让长序列处理变得更高效,成功在MTT S5000上实现了高性能推理。这次适配不仅让开发者能更轻松地利用Qwen3.5进行开发,也展示了MUSA生态的强大能力。想了解更多详细内容,大家可以去GitHub上查看具体的代码和说明。