商汤科技联合创始人王晓刚呼吁回归物理世界

最近,商汤科技联合创始人王晓刚在中国提出了一个新的具身智能理论。他呼吁大家回到物理世界,因为目前的AI是通过处理网络数据和文本获得智能,这种方法让它难以真正理解物理世界。他提出了一个名为ACE的研究框架,这个框架强调人类行为和环境互动的重要性。他强调智能不是来自于机器或数据,而是来自于人类和环境的互动。王晓刚在中国12月8日至21日举行的T-EDGE全球创新大会期间接受了NextFin.AI创始人何娟的专访,提出了这个观点。商汤科技的联合创始人王晓刚认为,如果只依赖基于互联网数据训练的模型,AI就无法适应复杂多变的真实场景。他指出,在这些模型中,知识是基于数字世界抽象出来的统计规律,缺乏对物理实体和社会情境的本质理解。ACE这个研究框架包含了三个核心要素:人本、情境驱动和具身。这三个要素可以帮助AI从传统的数据驱动模式转向交互和情境驱动模式。ACE框架提出了把人类行为模式、物理交互过程和环境上下文放在机器学习中心的方法。王晓刚认为,通过模拟或真实物理环境中人类的感知、决策和行动,机器可以构建出能理解物理规律和社会常识的“世界模型”。这个观点在学术界和产业界引起了广泛共鸣。人们认为,ACE不仅是对技术路径的调整,也是对智能本质的再思考。它呼应了人工智能从追求大数据转向追求高质量物理交互数据的趋势。中国在人工智能和机器人产业中扮演着重要角色,商汤科技作为中国企业在此方面进行前瞻性思考,可能为未来构建优势奠定基础。这次讨论强调了让智能产生于主体与客观世界持续互动过程中,并呼吁回归智能本源。 商汤科技联合创始人王晓刚通过给大家提供“以人为中心”的具身智能新范式来引起大家关注。他把机器人仅靠阅读文本或处理海量数据永远无法真正理解物理世界运行法则的问题拿出来警示大家。如果不能从根本上扭转以机器和数据为中心的研发范式,整个具身智能领域可能就会陷入投入产出失衡困境。ACE这个研究框架是王晓刚为解决这个问题而提出来的方法。他认为当前很多具身智能研究依赖于大规模视觉-语言-动作模型训练出来的结果可能无法应对真实场景中的适应性挑战。所以他系统性地提出了一个名为ACE的新型研究框架,把人类行为模式、物理交互过程以及环境上下文置于机器学习中心位置来引导AI从传统的数据驱动转向交互与情境驱动模式。 12月8日至21日期间举行的T-EDGE全球创新大会上,《巴伦周刊》中文版出版人何娟接受了王晓刚专访并阐述了上述观点。ACE取自“Anthropocentric(人本)、Context-driven(情境驱动)、Embodied(具身)”的首字母缩写,核心主张是把人类行为模式、物理交互过程以及环境上下文置于机器学习中心位置。通过模拟或真实物理环境中学习人类如何感知、决策与行动来构建能够内化物理规律、理解社会常识的“世界模型”,ACE框架就能打通感知、认知与行动的闭环实现自主适变跨越。 很多人认为ACE框架不仅仅是对技术路径进行调整更是对智能本质进行再思考。它呼应了人工智能发展从追求大数据向追求高质量物理交互数据转变的趋势同时也推动了机器人学、认知科学以及发育机器人学等多学科深度融合。 ACE这个新范式在中国这次大会上引起广泛共鸣并被视为对未来技术发展能否真正与人类社会复杂需求同频共振至关重要的一步棋。 王晓刚呼吁回归物理世界互动本质也是对目前资本与技术双轮驱动下全球人形机器人产业热潮背后所隐藏问题进行深刻思考时发出的警告声。他提醒业界在追逐硬件形态仿生与算法性能指标时更需关注主体与客观世界持续互动产生智能这个根本问题。 他强调“智能的根源在于人类如何与其所处环境进行持续多维互动”,脱离真实物理交互的智能系统就难以获得可迁移可泛化通用能力去适应复杂动态现实场景因此必将陷入技术困境。 这次讨论会引发人们对未来强人工智能与通用机器人时代到来所面临挑战及机遇进行深入讨论并呼吁回归智能本源注重基础研究复杂数据获取长期投入去实现人类社会复杂需求同频共振达成目标从而在中国这个全球人工智能与机器人产业重要参与方里构建关键优势奠定理论基础。