阶跃星辰给中国的大模型创业圈投下了一颗重磅炸弹,一下子把Step3.5 Flash推上了OpenClawTop排行榜的第二名。不仅如此,他们干脆把这个Agent用的基座模型的预训练权重(Base)、中训练权重(Midtrain),还有专门用来训练的Steptron框架都给开源了,让大家伙儿都能摸得到。在现在大家都不太爱大方把模型开源的时候,这举动显得特别实在。 Step3.5 Flash用的是那种稀疏MoE的结构,虽然参数量有1960亿那么多,但干活的时候其实只激活了大约110亿的参数。这就好比是个精简高效的大脑,在做推理这种事情的时候特别快。拿单请求的代码任务来说,它的速度能跑到350TPS。这个模型就是专门为了处理智能体这类复杂推理的场景设计的,官方还说它在长链任务里表现很棒,连推理深度都能跟一些顶级的闭源模型比划比划。