算力承压导致调用波动 智谱推出GLM Coding Plan限量发售并加强管理

智谱近日发布公告,宣布对GLM Coding Plan实行限售,以缓解近期算力资源紧张带来的压力。该调整也折射出国内大模型应用快速扩张过程中不可回避的现实难题。问题的出现与产品迭代密切涉及的。自GLM-4.7版本上线后,性能提升带动大量新用户涌入,Coding Plan用户规模迅速增长。另外——算力需求陡增——系统高峰时段出现并发限流、响应变慢等情况,影响部分用户的正常使用体验。类似的供需错配在大模型商业化初期并不罕见,也暴露出企业在扩张节奏与资源承载之间的压力。为应对这一情况,智谱推出了多项措施。首先是调整供给策略,通过限量发售优先保障存量用户。公司将日销售量控制在当前水平的20%,以释放更多算力资源,尽量保证既有用户的编程体验。限售自1月23日10时起执行,随后每日10时刷新可用额度;已开通自动续订的用户不受影响。这一做法意在在增长与服务稳定性之间做出取舍,优先把体验波动降到最低。其次是强化平台治理。智谱表示将加强对违规账号的监测与处置,遏制恶意流量和资源滥用等不合理占用算力的行为,以提升整体使用效率。供给侧上,智谱也在推进技术优化与基础设施扩容。公司近期发布并开源GLM-4.7-Flash模型,这是一款混合思考型大模型,总参数量30B、激活参数量3B,在保持竞争力的同时降低计算成本与部署门槛,为开发者提供更轻量的选择。轻量化模型的推出有助于分担算力压力,也能覆盖更多差异化应用场景。从行业视角看,智谱的这多项举措具有一定代表性。当前大模型产业正从技术验证走向规模化应用,企业需要在增长速度与服务质量之间持续校准。限售可能在短期内影响新增用户,但通过优先稳定体验来维护口碑与信任,更符合长期经营逻辑;而开源轻量化模型降低使用门槛,也说明了建设开放生态的方向。智谱表示,停止限售的具体时间将另行通知,取决于算力扩容进展。公司正在研发更高效的模型,并加快推进算力基础设施建设,后续将推出更优化的服务。

在技术红利与资源约束并存的背景下,智谱AI的应对为行业提供了一个可参考的案例;如何在技术迭代、用户体验与商业可持续之间保持动态平衡,将成为人工智能服务商下一阶段必须面对的问题。此次事件也提醒行业,算力基础设施建设需要与技术创新同步推进,才能支撑人工智能产业的长期稳健发展。