小米的机器人团队这几年一直在布局,2021年他们就发布了那个四足机器人CyberDog,大家当时还叫它铁蛋。后来到了2022年,他们又推出了全尺寸的人形机器人CyberOne,也就是铁大,这就奠定了关节控制和动力输出的底子。这次他们把这套技术用到了工厂里的工业机器人上,还在那里给它安排了一次实习。 这个身高177cm的机器人,在工厂的压铸后地板装配线上工作。他们给机器人的任务是把螺母给拧紧。这个过程得在76秒内搞定,它得先从送钉设备那儿把螺母抓过来,再准确地放到定位工装上。这个过程挺复杂的,它得两边手臂一起配合着干活,而且还要应对螺母里面那个花键结构带来的抓取难度,还有定位销轴磁吸力带来的干扰。以前用传统的编程方式根本搞不定这些复杂的情况。 为了突破这个难关,小米技术团队用了自主学习的方法。他们基于Xiaomi-Robotics-0通用的VLA基座模型来做事情。这个模型给了机器人一些基本的操作常识,然后又通过强化学习的方式让它在实际操作中不断优化自己的行为。这样一来,机器人就不用去依赖大量的真实遥操作数据了,训练效率提升了3倍多。 运动控制这块也做得挺精细。他们弄了一个分层架构系统,底层的控制器响应速度特别快,能处理平衡和安全这些基本需求;上层的强化学习控制器则专门用来应对极端干扰的情况。这种设计让机器人在快要摔倒的时候能自己调整姿势。算法上也做得很聪明,实现了零样本迁移到真实设备上,这样适配工厂环境的时间就大大缩短了。 为了让机器手更灵巧点,团队还开发了一个TacRefineNet模型。这个模型利用指尖的高精度触觉传感器来做微调工作,甚至不用视觉辅助就能把东西抓稳。这个模型的Zero-shot部署能力特别强,能快速适应不同产线的需求。 现在小米把机器人业务单独拿出来运营了,在北京亦庄小米汽车工厂建了个研发制造一体化的基地。除了这次展示的螺母安装工站外,他们还在搞料箱搬运和前徽标安装这些场景的测试工作。这些新场景主要是为了看机器人能不能在移动中配合干活,还有灵巧手能不能提高装配效率。 为了让大家都能用上这项技术,Xiaomi-Robotics-0模型已经开源了。行业里的开发者可以基于这个框架去开发自己的解决方案。像这次任务里用到的300N·m峰值扭矩模组和40%的指尖触觉阵列密度提升都是针对产线需求专门优化过的。这样一来就能给更多的企业提供支持了。