智谱开源发布GLM-4.7-Flash并上线免费调用 30B混合思考模型瞄准轻量化部署新需求

当前大模型产业面临一个核心矛盾：用户需要功能强大的模型，但部署成本和资源消耗成为制约因素。

在这一背景下，智谱推出的GLM-4.7-Flash模型直指这一痛点，通过混合思考架构实现了参数规模与实际性能的优化组合。

从技术层面看，该模型采用了30B总参数量的设计，但通过精细化的参数激活机制，仅需3B的激活参数即可完成推理任务。

这种架构设计在保证模型能力的同时，大幅降低了计算资源消耗，为企业和开发者提供了轻量化部署的新路径。

相比传统的参数堆砌方案，这种混合思考模式体现了当代大模型设计的精细化趋势。

在基准测试表现上，GLM-4.7-Flash在SWE-bench Verified、τ²-Bench等主流评测中的综合成绩超越了gpt-oss-20b、Qwen3-30B-A3B-Thinking-2507等同级别模型，获得开源领域的SOTA（最优）水平。

特别是在编程任务的前后端实测中表现出色，这表明该模型在代码理解、生成、调试等复杂认知任务上具有竞争力。

同时，模型在中文写作、翻译、长文本处理以及情感和角色扮演等通用场景中也展现出良好表现，说明其在多模态能力上有较为均衡的发展。

从应用层面看，智谱将GLM-4.7-Flash纳入其开放平台BigModel.cn，并提供免费调用服务。

这一举措打破了高性能模型的使用壁垒，让更多开发者和企业能够获得先进的AI能力，有利于推动开源生态的繁荣。

该模型将替代此前的GLM-4.5-Flash版本，体现了智谱对产品迭代和性能提升的持续投入。

从产业竞争格局看，开源大模型的性能不断逼近商业闭源模型，这一趋势对整个AI产业产生了重要影响。

智谱等国内企业通过技术创新和开源策略的结合，正在缩小与国际领先企业的差距。

轻量化模型的发展也为边缘计算、移动端应用等新场景打开了可能性，预示着AI应用将进一步走向普及和多元化。

值得注意的是，混合思考架构的推出反映了当前大模型发展的一个重要方向：从单纯追求参数规模向追求效率和效能的转变。

这种转变既符合可持续发展的理念，也更符合实际应用的需求。

随着这类高效模型的不断涌现，AI技术的成本门槛将进一步降低，这将加速AI在各行业的普及应用。

当全球科技竞争进入深水区，GLM-4.7-Flash的诞生不仅是一次技术迭代，更是我国坚持自主创新道路的生动实践。

其"高性能+轻量化+本土化"的三维突破，既回应了市场需求，也为构建安全可控的技术生态提供了新范式。

在数字经济浪潮中，此类核心技术的持续突破，正悄然重塑着全球人工智能产业格局。