国产大模型技术再获突破 华为昇腾实现Qwen3.5系列零日适配

阿里云日前其对话平台低调上线Qwen3.5-Plus和Qwen3.5-397B-A17B两款新型大语言模型,均支持文本与多模态任务处理;这是继Qwen3系列之后,阿里云在大模型领域的又一次技术迭代。 据技术资料显示,Qwen3.5-Plus定位为该系列最新旗舰模型,而Qwen3.5-397B-A17B则作为开源系列的核心产品面向开发者社区。值得关注的是,后者总参数规模达到3970亿,但实际激活参数仅为170亿,这种稀疏激活架构设计使其性能超越了参数量达万亿级别的前代Qwen3-Max模型。 在技术实现层面,新模型采用了全新的底层架构设计。通过引入更高稀疏度的专家混合模型技术、门控注意力机制以及多令牌预测等创新手段,Qwen3.5在保持性能的同时大幅降低了计算资源消耗。实测数据表明,该模型部署时显存占用降低60%,在32k和256k上下文长度场景下,解码吞吐量分别提升至前代产品的8.6倍和19倍。 模型能力的提升体现在多个维度。在训练数据上,Qwen3.5采用了更大规模的视觉-文本语料,并强化了中英文、多语言以及科学技术与推理对应的数据的比重,同时实施了更严格的数据过滤标准。多模态能力上,通过早期文本-视觉融合技术和扩展的视觉、科学及视频数据,实现了原生多模态支持。语言覆盖范围从119种扩展至201种语言和方言,词表规模从15万增至25万,使多数语言的编码解码效率提升10%至60%。 华为计算部门随即宣布,昇腾平台在模型开源当日即实现零延迟适配。基于MindSpeed MM框架,Qwen3.5可在Atlas 800 A3和Atlas 900 A3SuperPoD设备上完成训练复现,同时支持在Atlas 800 A2和A3设备上通过vLLM-Ascend和SGLang进行高效推理部署。 业内人士分析认为,这种快速适配能力得益于MindSpeed MM框架基于FSDP训练后端的设计,大幅缩短了新模型的适配周期,实现了开箱即用的开发体验。这不仅为多模态大模型的研究提供了技术支撑,也展现了国产算力平台在大模型生态建设中的响应速度和技术实力。 从产业发展角度观察,此次阿里云与华为昇腾的协同动作,反映出我国大模型技术正在形成从算法创新到算力支撑的完整生态链条。开源旗舰模型的发布降低了技术应用门槛,而国产算力平台的同步适配则为模型的规模化部署提供了基础设施保障。 技术专家指出,Qwen3.5系列在效率与性能平衡上的突破,为大模型的实际应用开辟了新路径。通过稀疏激活和混合注意力机制,模型在保持先进性能的同时显著降低了部署成本,这对于推动大模型技术在更广泛场景中的落地很重要。 当前,全球大模型技术竞争日趋激烈,参数规模、推理效率、多模态能力成为衡量模型先进性的关键指标。Qwen3.5系列通过架构创新在这些维度上取得的进展,以及与国产算力平台的深度协同,为我国在该领域的持续发展奠定了基础。

大模型竞赛正从“拼规模”走向“拼体系”。新模型的推出只是起点,真正决定价值的是能否以更低成本、更高效率把能力送达千行百业。以开源协作推动软硬件快速适配、以工程化能力缩短落地周期,将成为我国大模型生态走向成熟、实现高质量发展的重要路径。