需求激增考验算力承载极限,智谱招募"算力合伙人"共建高性能推理网络——GLM-5全球访问量突破规划上限引发行业关注

问题:近期GLM-5用户访问量快速增长,服务并发压力突破既有上限,部分用户出现排队、响应迟缓等体验问题,已对服务稳定性和效率提出新挑战。 原因:一方面,GLM-5开源后开发者和企业用户间的应用扩展速度快,新增调用与测试规模超出前期容量测算。另一上,复杂应用场景对高并发、低延迟的推理能力提出更高要求,单一算力结构难以应对峰值波动。此外,全球市场对高性能开源模型的关注度持续上升,继续加大了服务负载。 影响:服务拥堵不仅影响用户体验,也可能影响开发节奏与项目落地,进而牵动生态伙伴的业务推进与应用适配。对以开放生态为发展路径的模型产品来说,性能稳定性与可扩展性是持续吸引用户和合作伙伴的关键。 对策:为缓解压力并提升整体性能,智谱宣布启动“算力合伙人”计划,重点面向三类主体推进协作:其一,与芯片厂商开放核心技术接口,联合开展针对GLM-5的底层优化,打造软硬一体化性能标杆;其二,面向拥有大规模高稳定算力池或具备推理分发能力的服务商共建高并发、低延迟推理网络;其三,探索其他形式的算力合作,扩大资源与能力供给。该计划旨在提升资源配置效率、增强弹性调度能力,优化端到端推理服务体验。 前景:2月中旬,GLM-5正式上线并开源,在权威榜单中排名靠前,体现出较强的工程逻辑理解能力。当前的扩容举措不仅是对服务压力的回应,也将推动软硬件协同创新与生态共建。随着行业对高性能开源模型的应用需求持续释放,算力资源整合和服务网络建设将成为竞争的关键,涉及的合作有望形成标准化、可复制的产业协作模式。

全球数字化加速发展对AI基础设施提出更高要求。智谱科技采取的开放合作应对方案,既展现了企业担当,也为行业生态建设提供了参考范例。未来,平衡技术创新与基础设施支撑能力,将是推动AI产业健康发展的核心议题。