中国大模型创业公司阶跃星辰给社区放了个大招,把step3.5 flash 这个智能体基座的base和midtrain

中国大模型创业公司阶跃星辰今天给社区放了个大招,把Step3.5 Flash这个智能体基座的Base和Midtrain预训练权重全都公开了,还给配套的Steptron训练框架也一并送上。就在大模型开源开始变得越来越保守的时候,他们这次行动可以说是相当彻底,一下子把热度都炒起来了。 大家都知道Step3.5 Flash用了稀疏的MoE架构,参数加起来一共有1960亿,不过运行的时候其实只用上了约110亿个。就是这部分活跃的参数,让这个模型在推理速度上特别有优势,单请求代码任务下最高能跑到350TPS。这种设计主要是为了搞复杂的推理和长链任务,官方直接夸下海口说,它的推理深度能跟某些顶级闭源模型一较高下。 除了Step3.5 Flash,他们还把刚才提到的那些配套工具给了出来。为了配合这次的Step3.5 Flash发布,阶跃星辰一口气就冲上了OpenClawTop2榜单的第二名。这次开放的东西不仅有Base和Midtrain,还有专门的训练框架Steptron。 无论是给开发者提供预训练权重还是训练工具,阶跃星辰这次都算是做到了家。把参数总量控制在1960亿、同时把激活参数压到110亿这一手确实厉害,让推理效率大幅提升。这样的技术实力让他们在当前的竞争环境中很能打,也让其他玩家看到了中国团队的实力。