阶跃星辰发布新一代开源基座模型 国产芯片厂商集体完成适配

目前,大模型应用正从探索阶段迈向规模化部署,但高推理成本和芯片适配难题仍是主要瓶颈。阶跃星辰最新发布的Step 3.5 Flash模型正是为解决这些问题而设计。该模型采用稀疏混合专家(MoE)架构,每个token仅激活约110亿参数,总参数量达1960亿。这种设计在保持性能的同时大幅提升推理效率,在单请求代码任务中最高可达每秒350个token的推理速度,较同类产品优势明显。开发者因此能以更低成本获得更快响应,为实时Agent工作流提供了更实用的技术方案。

从"提升模型性能"到"拓展应用范围",产业发展不仅取决于技术进步,更需要优化成本结构、提升工程能力和加强生态协同。面对推理时代的规模化需求,只有持续深化模型与算力协同、让创新更易用更经济,才能真正将技术能力转化为生产力,为各行业数字化转型提供有力支撑。