北京人形机器人创新中心开了4个月,内部自己研发的数据都攒了300 万条,还有外头的开源数据也有30

记者从北京市经济和信息化局那儿打听,北京人形机器人创新中心搞了个数据采集基地,开了4个月,这下可好了,内部自己研发的数据都攒了300万条,还有外头的开源数据也有30万条,光给那些头部企业和搞科研的机构交出去的高质量训练资料,都能堆满好几万个小时。这些资料到底是干吗的?我就知道这个基地是全国场景最齐的机器人训练地之一,光一期就占了5000平,里头还有个大概200平的光学动作捕捉场。我在现场看了一圈,发现有120多台机器人分别在家里、超市、办公室、工厂、药房和养老院这30多个地方晃悠着采集数据。这可不是摆样子的样板房,灯怎么打、东西放哪、人怎么走都能自己调,为的就是让机器人学会举一反三。马欣欣在镜头里跟我们说,他看到了个模拟儿童房的场景,有个做模型训练的人正摆弄着机器人去把袜子翻过来。别看这动作简单,光是录下关节怎么动、轨迹怎么划拉,这一整套动作就得重复练个300到1000次才能攒够数。以前机器人数据采集总是乱七八糟的,场景杂、机器长相不一样就不好适配,质量也没法保证。为了解决这些毛病,基地专门弄了一套标准化流程来约束大家。现在大家做出来的数据合格率都稳在了95%以上。目前内部的研发数据已经突破了300万条大关。蒋未来跟我们算了一笔账:要是用了他们这套办法,起码能帮中小型机器人用户省下超过50%的数据采集成本。