在2024年10月,小米的AI团队就和北京大学合作,搞出了个把MoE架构跟强化学习混一块儿的新论文。到了2025年,罗福莉又带着自己的团队整出了个新活儿。她现在是小米MiMo大模型团队的头头,之前还在DeepSeek干过。罗福莉和北京大学的科研人员一块儿攻关,搞出了个叫ARL-Tangram的统一资源管理系统。这个系统用了动作级公式这种新招数,专门解决不同类型计算资源没法好好协调的老毛病。核心就在于把弹性调度算法给优化了。 他们通过建立一个统一的数学模型,让系统能随时根据不同的情况来调整。这样一来,动作完成时间(ACT)最高能提升4.3分。实验数据看着挺猛,在强化学习训练场景里,单步训练的时间被压缩到了原来的66.7%,同时外部资源的调用需求也少了71.2%。这一下子把算力效率提上去了,成本也跟着降下来了。这是罗福莉在小米这儿干的第二个大成果。 早在这次之前,罗福莉就在2024年10月作为核心作者参与了小米和北大的合作。这次的系统出来之后,更坐实了她在AI基础设施这块的学术地位。罗福莉最近在小米人车家全生态合作伙伴大会上第一次以小米研究员的身份露面了。她在社交平台上分享了自己的感悟,说大家正在见证智能技术突破语言边界、真正融入物理世界的那一刻。她还提到MiMo团队的科研人员们都在一块儿画画AGI的实践蓝图。 据技术白皮书说,ARL-Tangram系统现在已经进了小米的内部测试环节了。首批应用的场景都挺有代表性的,像自动驾驶训练、智能家居优化这些跨领域的活儿都在用。这个系统模块化设计得很灵活,能很快适配各种业务需求。它把资源调度的效率提上来之后,给大规模AI模型的工业化部署提供了关键支撑。