一、技术突破:架构革新提升性能 在人工智能大模型竞争日益激烈的背景下,阿里巴巴在农历除夕开源了千问Qwen3.5-Plus。该模型总参数规模达3970亿,但仅激活170亿参数,以较低计算资源消耗超越了千问3-Max万亿参数模型的性能,显存占用减少60%,推理效率提升。 性能提升的关键在于千问团队对Transformer架构的创新。团队研发的门控技术曾获2025年NeurIPS最佳论文,该技术被应用于千问3.5的混合架构中。通过结合线性注意力机制和稀疏混合专家模型架构,千问3.5在保持高效的同时降低了推理成本。在32K上下文场景中,推理吞吐量提升8.6倍;256K超长上下文场景下,最大吞吐量提升达19倍。 二、代际升级:从文本到多模态 与前代产品相比,千问3.5最大的变化是训练范式的转变。该模型首次采用视觉与文本混合标记进行预训练,并扩充了中英文、多语言及理工科数据,增强了逻辑推理能力。 这种多模态训练带来了视觉能力的全面提升。在多模态推理、视觉问答、文本识别、空间智能等多项测试中,千问3.5均表现优异。该模型支持长达两小时视频的直接输入,适用于长视频分析与摘要生成。此外,它还能将手绘草图转化为前端代码,通过截图定位界面问题,实现了视觉编程的实际应用价值。 三、基础设施:云平台助力训练 千问3.5的多模态训练依托阿里云基础设施完成。通过技术创新,其混合数据训练吞吐量已接近纯文本模型水平,降低了多模态训练门槛。 团队采用FP8与FP32混合精度策略,在数十万亿标记规模的训练中,激活内存减少50%,训练速度提升10%,有效节约了成本。这表明国内云计算已具备支撑顶级大模型研发的能力。 四、应用拓展:智能体框架落地 千问3.5基于强大的视觉能力,在智能体应用上取得突破。该模型可操作手机和电脑完成日常任务:在移动端支持更多主流应用;在PC端能处理跨应用数据整理、自动化流程等复杂操作。 团队还构建了可扩展的智能体异步强化学习框架,端到端效率提升3至5倍,支持百万级插件式智能体扩展,为商业化应用奠定了基础。 五、市场策略:开源与价格优势 千问3.5-Plus接口调用价格低至每百万标记0.8元,约为国际同类产品的1/18。持续的开源策略降低了开发者和企业的使用门槛,加速了大模型技术的行业应用。用户也可通过官方应用免费体验涉及的功能。
在全球数字经济格局调整的背景下,千问3.5的突破展示了中国科技企业的创新能力,揭示了通过架构创新而非算力堆砌实现技术超越的新路径。这场效率革命可能重塑行业竞争规则,为实体经济智能化转型提供更可持续的技术方案。未来,将技术优势转化为产业优势将成为衡量创新价值的关键。