新模型带动需求激增致订阅服务“售罄”与体验波动 智谱致歉并推出退款延期与扩容方案

智谱近日因新模型上线引发的服务压力问题向开发者致歉,反映出当前国内大模型产业面临的深层次挑战。 问题的根源于GLM-5的性能表现超出预期。根据测试数据,该模型在代码能力、智能体表现等关键领域的开源模型评分中达到业界先进水平,在真实编程场景的使用体感已接近Claude Opus 4.5,特别是在复杂系统工程与长程Agent任务上表现突出。这个突破性进展使得GLM Coding Plan订阅服务上线即售罄,这在行业中属于罕见现象。 供需失衡直接冲击了用户体验。智谱在致歉信中坦诚,GLM-5发布后流量超出预期,公司扩容节奏未能及时跟进。同时,灰产号池和黄牛党的恶意占用深入加剧了资源紧张局面。为应对这一困境,公司被迫采取分级灰度策略,按照Max、Pro、Lite的顺序逐步开放GLM-5访问权限。目前Max用户已全面开放,Pro用户虽已开放但高峰期可能遭遇限流,Lite用户则需等待节后非高峰期的逐步灰度。 为修复用户信任,智谱推出了针对性的补偿方案。受影响的Lite和Pro用户可自主申请退款,已使用GLM-5的用户及继续选择智谱的用户统一获得15天使用期延期。这一举措表明公司对服务质量的重视,也反映出大模型企业在快速扩张中面临的现实困境。 更深层的解决方案指向算力基础设施的突破。智谷在春节期间启动了"算力合伙人"招募计划,涵盖三个维度:与芯片厂商合作开放核心技术接口进行底层优化;与算力伙伴和推理服务商共建高并发、低延迟的推理网络;探索其他形式的算力合作。这一战略调整表明,单靠自身扩容已难以满足需求,需要通过生态合作来突破算力瓶颈。 不容忽视的是,智谱已在国产芯片适配上取得进展。公司已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等7家主流国产芯片平台的深度推理适配与算子级优化,能够在国产算力集群上实现高吞吐、低延迟的稳定运行。这为后续的算力扩展奠定了技术基础。

智谱科技此次服务调整事件既揭示了AI行业快速发展带来的运营挑战,也展现了国内企业在核心技术突破后的市场号召力。如何在技术创新与用户体验之间寻求平衡,将成为所有AI服务提供商必须面对的课题。随着国产算力生态的持续完善,中国AI产业有望在自主可控的道路上实现更高质量发展。