聊起人形机器人,两年后的事儿王晓刚已经想到了。作为商汤的联合创始人兼大晓机器人董事长,他在博鳌亚洲论坛时就觉得,这行业很快就能像ChatGPT那样爆发,毕竟底层技术框架马上就成熟了。现在阻碍它的最大问题,其实是机器人不够聪明,太依赖人工操作真机去收集数据,而且采集的量实在太少。统计显示,过去五年一共才攒下10万小时的数据,跟想要的千万小时相比差得太远。 为了打破这个僵局,王晓刚的公司弄出了个“环境式数采”的新招儿。这个法子不怎么麻烦人,让保洁员戴着智能眼镜干活,再搭配上那些第三视角的传感器。只要有1000个人这么干一天,就能自然产生1万小时的有效数据,效率比以前提升了百倍。公司计划到2027年前把数据储量做到1000万小时,之后还打算往亿小时的目标上冲。 在怎么用好这些数据方面,王晓刚也有自己的算盘。他把机器人落地这件事,比作是当年的自动驾驶发展。他说家庭服务机器人必须得达到L4级的安全标准,特别是在和人打交道还有处理突发情况上,得有突破性的技术。这就要求设备不光能执行命令,还得会看环境、会预判风险、能自己做决定,这种活儿比工厂里的机器人复杂多了。 现在很多机器人虽然能听话干活,但还不怎么灵光。王晓刚就觉得现在的设备大多还停留在“能执行指令但缺乏智能”的阶段。主要是因为大家习惯了用旧办法去收集数据,要么是让人开真机玩了命地试,要么是自己动手模拟各种动作。这两种方式都很慢,而且也测不出人在真实世界里到底是怎么动的。 拿保洁行业来说事儿吧。要是把1000名保洁员都武装上采集设备去工作,一天下来就能自然产生1万小时的有效数据。这种模式让数据积累的效率提升了百倍。王晓刚说他们的目标是要在2027年前把数据储量堆到1000万小时。 有了这些数据当燃料,未来的人形机器人就能像ChatGPT那样迎来关键突破了。这一切都要靠技术路径越来越明确还有数据规模不断翻番来驱动才行。大晓机器人准备用开悟世界模型把数据储备向亿小时级迈进。