罗福莉:arl-tangram 系统让我对未来充满信心

大家好,我是罗福莉,现在是小米MiMo大模型团队的负责人。2024年10月,我和北京大学合作开展了一项研究,这项研究的成果就是现在的ARL-Tangram统一资源管理系统。这个系统利用了统一动作级公式和弹性调度算法,能够有效应对不同类型的硬件资源,从而大幅提高了智能体强化学习的效率。 我们做了一个实验,把平均动作完成时间ACT提升到了4.3分。这个结果相当不错,训练步骤的时间也缩短了至少1.5倍。更关键的是,我们还节省了高达71.2%的外部资源成本。这不仅为企业优化资源利用提供了新的思路,也为AI的大规模部署铺平了道路。 我加入小米后已经发布了两个重要成果,另一个就是在MoE架构上做了一些研究。这次发布ARL-Tangram论文也是一个重要的里程碑。我们的研究显示了小米在基础技术上的持续投入和战略布局。 2025年小米人车家全生态合作伙伴大会上我第一次公开亮相,分享了一些感受。我相信未来智能会从语言拓展到物理世界。现在我在XiaomiMiMo团队里和一群有创造力的研究员一起工作,努力实现AGI的梦想。 这个ARL-Tangram系统让我对未来充满信心。它不仅仅是一个技术突破,也展示了产学研合作的巨大潜力。我期待未来能有更多这样的创新来推动智能科技的发展。