除夕开源新一代“千问3.5”：原生多模态与高效推理加速大模型落地

一、技术突破：架构革新提升性能在人工智能大模型竞争日益激烈的背景下，阿里巴巴在农历除夕开源了千问Qwen3.5-Plus。该模型总参数规模达3970亿，但仅激活170亿参数，以较低计算资源消耗超越了千问3-Max万亿参数模型的性能，显存占用减少60%，推理效率提升。性能提升的关键在于千问团队对Transformer架构的创新。团队研发的门控技术曾获2025年NeurIPS最佳论文，该技术被应用于千问3.5的混合架构中。通过结合线性注意力机制和稀疏混合专家模型架构，千问3.5在保持高效的同时降低了推理成本。在32K上下文场景中，推理吞吐量提升8.6倍；256K超长上下文场景下，最大吞吐量提升达19倍。二、代际升级：从文本到多模态与前代产品相比，千问3.5最大的变化是训练范式的转变。该模型首次采用视觉与文本混合标记进行预训练，并扩充了中英文、多语言及理工科数据，增强了逻辑推理能力。这种多模态训练带来了视觉能力的全面提升。在多模态推理、视觉问答、文本识别、空间智能等多项测试中，千问3.5均表现优异。该模型支持长达两小时视频的直接输入，适用于长视频分析与摘要生成。此外，它还能将手绘草图转化为前端代码，通过截图定位界面问题，实现了视觉编程的实际应用价值。三、基础设施：云平台助力训练千问3.5的多模态训练依托阿里云基础设施完成。通过技术创新，其混合数据训练吞吐量已接近纯文本模型水平，降低了多模态训练门槛。团队采用FP8与FP32混合精度策略，在数十万亿标记规模的训练中，激活内存减少50%，训练速度提升10%，有效节约了成本。这表明国内云计算已具备支撑顶级大模型研发的能力。四、应用拓展：智能体框架落地千问3.5基于强大的视觉能力，在智能体应用上取得突破。该模型可操作手机和电脑完成日常任务：在移动端支持更多主流应用；在PC端能处理跨应用数据整理、自动化流程等复杂操作。团队还构建了可扩展的智能体异步强化学习框架，端到端效率提升3至5倍，支持百万级插件式智能体扩展，为商业化应用奠定了基础。五、市场策略：开源与价格优势千问3.5-Plus接口调用价格低至每百万标记0.8元，约为国际同类产品的1/18。持续的开源策略降低了开发者和企业的使用门槛，加速了大模型技术的行业应用。用户也可通过官方应用免费体验涉及的功能。

在全球数字经济格局调整的背景下，千问3.5的突破展示了中国科技企业的创新能力，揭示了通过架构创新而非算力堆砌实现技术超越的新路径。这场效率革命可能重塑行业竞争规则，为实体经济智能化转型提供更可持续的技术方案。未来，将技术优势转化为产业优势将成为衡量创新价值的关键。