就在这个2026年的博鳌亚洲论坛上,百度集团的沈抖聊起了具身智能,说它虽然发展挺快,但现在还卡在“本体”、“数据”、“模型”这三个关键坎儿上。要是能把这三个问题解决了,这领域肯定能来个大飞跃。他还分析说,“本体”其实就是大规模生产的问题,得靠完整的工业体系来撑着;至于“数据”和“模型”,就得靠AI的整个基础设施一起配合。 沈抖特别提到了中国的优势,说咱们的供应链齐全、工程师多、成本控制得好,市场需求也大。要是以后技术升级了,生产成本肯定能降下来,让具身智能变成大家都能用上的标准工业品。 会场里还有个亮点,北京人形机器人创新中心跟中国电科院联手搞了个“电力具身智能联合实验室”。他们用百度智能云的AI Infra训出来一个VLA大模型,这东西能通过“感知-理解-执行”这个闭环系统,让机器人在复杂环境里干活特别准。这就验证了沈抖的观点:工业里的活儿对动作和理解的要求比家里更明确,所以更容易把标准定下来。 对于以后怎么赚钱,沈抖有个大胆的想法:等技术成熟了,机器人服务说不定可以按Token收费,就跟咱们现在用的云计算差不多。他也坦言现在的投入比做语言大模型的投入少多了,“看着挺热闹其实还不够”,还得在产品、应用和跨国合作上多下功夫。 另外,百度的数字人ViviDora也来凑热闹了。这个数字人是用慧播星技术做的,靠着AI的全栈基础设施能做到实时互动和真的反馈,样子做得跟真人一样,把大家都惊着了。这个案例不光展示了数字人在高端会议上的本事,也给咱们提供了一种新的互动思路。 现在人形机器人开始往工业制造、救援、养老这些地方钻了,具身智能也从概念变成了产业的实际东西。沈抖觉得想破这个局得靠大家一起搞创新。中国现在的产业生态、数据量还有市场空间都不错,以后肯定能在推动全球具身智能发展上起大作用。