章鹏:企业级ai 到底好不好用token 效能会成为核心标准

3月26日这天,蚂蚁数科的总经理章鹏在中关村论坛上提到了一个大方向:以后衡量企业级AI到底好不好用,Token效能会成为核心标准。这个指标啥意思?就是看每一个Token能不能带来实打实的效果。就在前不久,像OpenClaw这样能自己干活的智能体突然火起来了,这事儿很说明问题,说明大家现在对那种光会说话、不会干活的AI已经不太满意了。大家都开始加速往这个方向走,但真正落地的时候,大家也很担心,比如算力浪费得厉害,还有安全合规这些事都挺让人头疼。怎么才能让智能体真正跑起来、能长期用?这就成了大家现在最关心的一个点。 章鹏觉得,OpenClaw这次爆发给产业带来了一次范式革命。以前大家比拼的是谁的模型参数大,现在要转变成比谁单位Token产生的价值高。现在市面上的智能体虽然火了,可在实际干活的时候却出了不少状况。因为它们不懂行业规矩和具体流程,执行复杂任务的时候总是不停地来回调用工具,结果Token消耗比真正产生的效果高太多。有数据显示,在一些高频调用的场景里,OpenClaw消耗的成本可能是那种集成式Agent的几十倍甚至上百倍。这种高投入低产出的情况让它在大规模应用中很难长久持续下去。 说到这里就得说说大小模型结合的事了。现在很多公司都在喊要降本增效,可传统的大模型虽然推理能力强,但在处理金融领域那种高频低时延的任务时就显得有点笨重。举个例子,比如快速识别意图、提取关键信息这些工作,就像“杀鸡用牛刀”,既费钱响应又慢。企业真正想要的是那种在专业、合规的前提下既便宜又快的解决方案。大模型擅长做复杂的分析推理,小模型在处理高频小任务时速度快、成本低。所以把这两种模型结合起来才是最经济高效的办法。 在论坛上蚂蚁数科还发布了一个新东西——Ling-DT-Fin-Mini-2.5,这是他们Ling DT系列大模型的首款轻量级模型。这个模型是基于MoE架构搞出来的,针对金融行业那些高并发、低时延的需求做了专门优化。它把推理成本压缩到了能大规模部署的水平。跟市面上那些同样能力的通用模型比起来,它的推理速度能快100%,硬件成本也明显降低了很多。 最近行业里也是这个趋势了。最近OpenAI也推出来两款小模型GPT-5.4 mini和nano,主打低延迟和高性价比。大家都在朝着这个方向走的时候其实就意味着一点:技术最终还是要回归到产业对效率的理性要求上来。章鹏表示接下来的竞争核心就在Token效能上了。蚂蚁数科也会继续深耕企业级AGI这块领域,推出更多像百灵企业版这样的产品来加速智能体在复杂场景中的落地工作。