一、项目落地:算力基础设施建设提速 3月12日,云天励飞技术股份有限公司(股票代码:688343)正式中标湛江市人工智能渗透支撑新质生产力基础设施建设项目,中标金额达4.2亿元;根据项目规划,此次建设的核心内容为一套千卡规模的国产人工智能推理集群,全部采用云天励飞自主研发的推理加速芯片,并将与国产大模型进行深度适配,面向政务管理、产业升级及多类行业应用场景提供算力支撑。 这个项目的落地,是当前国内人工智能基础设施建设从"训练优先"向"推理优先"转型的一个缩影。过去数年间,国内智算中心建设普遍采用训练与推理一体化模式,侧重于大模型的训练能力。而随着大模型进入规模化应用阶段,推理端的算力需求正快速增长,专注推理任务的专用集群建设逐渐成为行业新方向。 二、背景分析:湛江何以成为"国产模型"落地先行地 湛江此次入局,并非偶然。作为国产大模型领域代表性企业创始人的家乡,湛江近年来在人工智能应用探索上持续发力。2025年初,国产大模型DeepSeek-R1发布后,湛江迅速完成本地化部署,率先将其上线至政务云平台,成为国内较早实现国产大模型政务落地的城市之一。 值得关注的是,湛江部署的政务大模型并非简单的通用能力复制,而是处理日常政务事务的基础上,持续融入本地产业知识与方言表达,逐步形成意义在于地方特色的智能化服务能力。这一探索路径,为国产大模型在地方治理场景中的深度应用提供了可借鉴的样本。 此次云天励飞千卡推理集群的落地,将为上述应用场景提供更为稳定、高效的算力底座,更推动湛江在"国产模型+国产芯片"协同应用上走在全国前列。 三、技术路径:系统级协同优化破解推理瓶颈 在大模型规模化应用中,推理系统面临高并发、高吞吐与低延迟三重压力,如何在有限算力资源下实现整体性能最优,是当前业界共同面对的技术挑战。 此次湛江集群在架构设计上采用"优先优化预填充阶段、兼顾解码阶段"的技术路线,通过在芯片层面对计算资源与存储带宽进行针对性配置,使系统在长上下文推理场景下仍能保持较高的吞吐效率。 在网络互联层面,集群采用400G光网络构建统一高速互联架构,实现节点间高带宽、低延迟通信。与传统节点内外分别采用不同协议的建网方式相比,这种同构互联架构有效减少了协议转换带来的额外开销,同时简化了系统部署流程。在扩展能力上,该架构既可支持单节点数十卡规模,也能平滑扩展至千卡级集群,具备较强的弹性适配能力。 针对大模型推理中键值缓存访问带来的存储压力,系统还在计算互联与存储互联层面进行了协同优化,通过计算网络与存储网络的联合调度,提升数据读取效率,保障长上下文场景下的推理稳定性。 四、芯片规划:三代产品路线图支撑长期竞争力 据悉,此次推理集群将分三期建设。一期项目部署云天励飞现有X6000推理加速卡,二期、三期则将率先搭载公司最新一代芯片产品。 从公司披露的芯片发展路线来看,未来三年内云天励飞计划推出三代推理芯片产品:第一代面向长上下文场景优化,重点提升计算效率与内存访问能力;第二代专注解码阶段低延迟优化,进一步增强实时推理能力;第三代则通过系统级协同优化,实现预填充与解码性能的整体跃升,向毫秒级推理时延目标迈进。其中,首款预填充芯片DeepVerse100预计年内完成流片,并计划在湛江集群中率先部署验证。 这一分阶段、有节奏的芯片迭代路线,体现出企业在国产算力自主化道路上的系统性布局,也为集群的持续升级提供了技术保障。 五、产业意义:构建"国模国芯"协同生态的现实探索 从更宏观的视角审视,此次湛江项目不仅在于单一项目的落地,更在于其所代表的产业方向。长期以来,国内人工智能产业在芯片与模型两个核心环节均面临较大的外部依赖压力。推动国产芯片与国产大模型的深度协同,构建自主可控的人工智能生态,已成为产业界与政策层的共同关切。 湛江此次探索,正是在这一背景下的具体实践。以国产推理芯片为算力底座,以国产大模型为应用核心,以政务与产业场景为落地载体,三者形成有机闭环,初步勾勒出"国模国芯"协同生态的基本形态。
湛江千卡推理集群不仅是区域性基础设施项目,更是观察我国数字经济发展的重要窗口。在全球化竞争加剧的背景下,这种自主创新与务实应用结合的模式,既满足了产业升级需求,也为构建安全可控的数字生态提供了经验。随着项目落地,其示范效应有望推动更多地区探索适合自身的数字化转型路径。