大晓机器人搞出了一个开源的实时生成世界模型叫开悟3.0,它被称为“原生大脑”,能让机器人

大晓机器人搞出了一个开源的实时生成世界模型叫开悟3.0,它被称为“原生大脑”,能让机器人真的去干活。这次,大晓机器人把开悟世界模型3.0的具身原生版开放了出来,叫作Kairos 3.0-4B系列。这个模型在行业里第一个实现了多模态理解、生成还有预测的一体化能力,给了具身智能从模仿行为到深度理解物理世界的机会,还能帮着规模化落地。 现在这个行业里有很多难题,比如数据不足、交互时间不够长还有部署成本高。之前的生成式模型大多是大模型改改款,对物理世界没那么懂。Kairos 3.0-4B是从底层架构开始重新设计的,它用自然界的物理规律和因果规律当基础,结合了机器人真机交互、人类行为结构还有思维链文本这三类数据。这样一来就打破了数据壁垒,让模型能真的理解世界、生成世界还能预测世界。 在部署和执行方面,Kairos 3.0-4B也是头一个能在端侧直接驱动机器人控制的世界模型。它被部署在Jetson Thor T5000平台上,算力高达517 TFLOPS。这是行业里第一个在THOR端侧平台实现1:1.5实时生成的模型,视频生成时间只需要5秒左右就足够了。有了这个优势,模型就能直接输出机器人的全身体控制指令,省掉中间转译的步骤。它不仅能在3D仿真环境里规划机械臂的动作轨迹,还能让机器人实际行动起来干活。 物理因果一致性对具身智能来说很重要,Kairos 3.0-4B在这方面比其他主流模型都要好。比如倒水和叠平衡石这些复杂场景里,水流平稳不洒出来、石头也不会飘在空中。对比之下Cosmos 2.5和Lingbot这些竞品就会出现物理逻辑上的问题。 在长时序交互能力方面也有了突破。Kairos 3.0-4B结合了Agent智能体技术,把复杂的指令拆成一层层来做。它能用预测和自我反思的机制生成长达7分钟的连贯视频。有个Demo演示里显示它在家庭场景里能连贯地整理桌面、洗衣服还有做早餐。 这个模型还很轻巧高效。虽然只有4B参数但只需要23.5GB显存就能跑起来。在A800 GPU的Benchmark测试中,它比Cosmos 2.5快了72倍。完成10秒的任务只需要9.5秒的时间,比Lingbot快了约151倍。它还能在云侧实现1:1实时推理适配多种GPU平台。 最后是多本体泛化能力也很强。Kairos 3.0-4B支持跨本体任务一键生成不管是单臂、双臂还是灵巧手都能无缝适配执行策略。它也支持智元-精灵G1、宇树G1这些主流机器人硬件设备。