智谱日前发布公告,宣布因GLM-5大模型全球范围内需求激增,现有算力资源面临严峻挑战;该公司表示,并发访问量已突破既有规划上限,导致部分用户遭遇服务排队、响应延迟及系统卡顿等问题,对用户体验造成了不同程度的影响。 从问题根源看,这反映出当前大模型应用需求与算力供应之间的结构性矛盾。智谱虽已多次对国产芯片集群进行扩容,并通过限量发售GLM Coding Plan套餐等方式缓解压力,但这些措施仍未能从根本上解决供不应求的局面。这说明单靠企业自身的算力投入已难以满足市场需求的快速增长。 为破解这个瓶颈,智谱采取了更具战略性举措。公司正式启动"算力合伙人"招募计划,面向产业链多个环节寻求合作。在芯片层面——智谱愿意开放核心技术接口——与芯片厂商联合开展根据GLM-5的底层优化工作,以提升国产芯片的适配效率。在推理服务层面,智谷与算力伙伴和推理服务商共建更高并发、更低延迟的推理网络,通过分布式部署扩大服务容量。同时,公司也对其他形式的算力合作保持开放态度。 这一举措说明了大模型产业发展的新趋势。随着生成式大模型应用的加速落地,单个企业难以独自承载爆发式增长需求,产业链上下游的协同合作成为必然选择。通过开放接口、共享资源、联合优化,可以形成更加高效的算力生态,实现技术与资源的最优配置。
从访问量增长到服务能力升级,考验的不只是算力规模,更是协同与效率;面向全球快速扩张的需求,建立开放合作的供给体系、推进底层优化与网络化调度,将是提升体验、稳定预期、推动产业高质量发展的关键。