最近人工智能这块可热闹了,大家都在争着搞世界模型研发,这回咱就说开源这个事儿吧。先是中国的灵波科技,他们连着两天把具身大模型LingBot-VLA和高精度空间感知模型LingBot-Depth给放出来了。到了1月29日,重头戏来了,他们在1月27日、28日、29日这三天里,干脆把LingBot-World这个能生成动态视频、让人操控场景的模型也完全开源了。这玩意厉害在哪儿?就是你给它一张照片或者游戏截图,不用费劲训练,它就能弄出个高保真的虚拟世界来。大家在里面不仅能看,还能通过语音或设备去指挥角色或者改变视角。技术指标这块,这玩意儿做得跟国际顶尖水平没啥两样。关键是它还成了机器人训练和游戏开发的“数字沙盒”,能省不少钱。 就在灵波这边忙着开源的时候,北京时间1月30日,谷歌也没闲着,给自家的AI Ultra订阅用户开了个叫Project Genie的平台。大家都能上去体验他们的Google Genie 3世界模型了。这在海外技术圈里反响特别大,说明大家伙儿都盼着世界模型能早点用起来。 这两家公司虽然是各搞各的,路子不一样——一个是全公开代码权重,一个是开放体验入口——但目的都是一个,就是想把这个技术圈子做大,吸引更多的人来折腾创新。德国媒体AdHocNews说得挺对,灵波这回是拿出了一套完整的物理人工智能开发工具包,把自己放在了全球机器人竞争的棋盘上去布局。 其实LingBot-World不是单打独斗的,灵波科技在这短短三天里,把从“看清楚”环境(LingBot-Depth)、到“做明白”任务(LingBot-VLA)、再到“想象世界”的完整技术链条都给敞开了。这种系统性的开源策略,明显是想推动整个具身智能技术一起进步。 世界模型开源了影响可不小。研发方面门槛低了,高校和中小企业都能进来玩玩;产业应用上更是不得了,成了赋能各行各业数字化转型的新基础设施。无论是工业机器人调试、汽车虚拟测试,还是做影视游戏或者元宇宙体验,有了这个高保真的虚拟世界模拟工具,速度都能大大加快。 蚂蚁灵波跟谷歌这两家公司的举动就像往水里扔了块石头,掀起的浪花正在扩大。这不仅仅是两家公司在秀技术肌肉,更是一种全新的发展思路——通过开放合作来应对难题,用生态繁荣推动技术落地。未来世界模型能不能普及成熟,不光看算法算力行不行,更得看全球开源协作的生态健不健康、活跃度高不高。技术的大门打开了,关于智能的想象和创造空间也就更大了。