机器人“零样本适应”智能生活

新春佳节期间，天津大学的深度强化学习实验室里热闹非凡，团队成员们忙着把今年的算法成果集成到机器人身上。具身团队自主研发的具身基座模型R1.5版顺利上线，给多种型号的机器人装上了新“大脑”。这是郑岩团队攻关多时的成果，他们还因此拿下了2025年中国图象图形学学会科技进步奖一等奖。在这个特殊的春节，张守信老师带着新媒体学院的同学也加入了进来，帮着把复杂的代码转化成直观的视频。记者雷风雨来到现场看到，实验室里被布置得像居家生活一样温馨。实验室青年骨干汤宏垚副研究员拿起扫帚让机器人清扫地面垃圾，接着又让它去操作台做奶茶。这一系列动作都由马亿副教授和汤宏垚设计的“大脑+小脑”架构来指挥。大脑是多模态大模型负责理解指令和规划路径，小脑则是基于强化学习的决策控制模块负责精准执行。如今这些机器人不仅能做奶茶，还能擦花瓶、给手机充电、冲咖啡甚至打包礼盒。哪怕面对没见过的新场景，它们也能“零样本适应”。大家把这种文工交叉的模式称为“文工交叉”。大家都是为了一个目标不回家过春节，就是要把算法成果呈现出来让更多人看到。郑岩说他们要让智能生活最温柔的一面走进千家万户。