当前,具身智能作为人工智能领域的重要分支,正成为全球科技竞争的新焦点。
具身智能模型能否在真实复杂环境中完成多样化任务,直接关系到机器人产业的实用化进程。
日前,千寻智能推出的Spirit v1.5模型在国际标准化评测中取得突破性成绩,为中国在这一领域的技术水平提供了有力证明。
RoboChallenge作为2025年新成立的具身智能模型国际评测体系,由Dexmal、Hugging Face、智源研究院等多家海内外权威机构联合发起,旨在建立统一的跨平台能力验证标准。
该评测体系包含30项贴近实际应用的机器人任务,涵盖贴胶带、物品拾取、插花、颜色识别等日常操作场景,全面考验模型的泛化能力、稳定性和执行精度。
Spirit v1.5在此次评测中表现卓越。
模型综合得分达66.09分,成功率为50.33%,是唯一突破50%成功率的参评模型。
在具体任务执行中,该模型展现出显著优势:在胶带粘贴任务中,能精准定位胶带位置,通过双臂协作完成操作;在物体堆叠任务中,主动搜索目标颜色物体,避免误取;在插花任务中,通过关节运动确保花卉保持竖直并成功插入花瓶;在物体移动任务中,实现精准抓取和放置。
这些任务的成功完成,充分验证了模型在陌生环境下的适应能力和执行稳定性。
Spirit v1.5之所以能取得这样的成绩,源于其端到端具身智能基础模型的设计理念。
该模型在单一框架内统一实现三大核心能力:其一是泛化性,具备强大的跨任务与跨本体泛化能力,使其能够适应不同机器人平台和多样化任务需求;其二是稳定性,面向真实场景的连续任务执行能力,确保在复杂环境中的可靠性;其三是准确性,对操作目标与执行结果的精确控制,保证任务完成质量。
值得注意的是,RoboChallenge的评测体系设计充分考虑了实际应用需求。
其评分不仅关注任务是否完成,还对执行过程进行深层评估,包括空间定位精度、遮挡物体处理能力、长时序稳定性以及面对新任务时的迁移效率。
这种评测方式更加贴近真实机器人应用场景,对模型提出了更高要求,也更能反映技术的实用价值。
为确保评测结果的透明度和可信度,千寻智能同步开源了Spirit v1.5的基础模型权重、推理代码和使用样例。
这一举措体现了开放协同的发展理念,使研究者和开发者能够独立复现评测结果,并基于该模型开展进一步的研究创新。
开源地址包括GitHub代码仓库和Hugging Face模型库,方便全球研究社区获取和使用。
从产业发展角度看,Spirit v1.5的成功具有重要意义。
首先,它证明了中国在具身智能领域已达到国际先进水平,能够与全球顶尖模型同台竞技。
其次,开源模型为产业生态建设提供了基础支撑,有利于促进下游应用开发和创新创业。
再次,这一成绩鼓舞了国内具身智能产业的发展信心,有助于吸引更多资源投入该领域。
具身智能技术的发展前景广阔。
随着模型性能的不断提升和应用场景的不断拓展,机器人在制造、物流、服务等领域的应用将进一步加速。
Spirit v1.5的推出和开源,为整个产业链的健康发展奠定了基础,也为后续技术迭代创新指明了方向。
标准化评测让能力看得见,开源复核让结论站得住。
具身智能的价值,不在于一次榜单上的领先,而在于能否经得起真实场景的长期检验、能否在开放协同中形成可持续的创新体系。
以透明的技术路径连接产业需求与科研探索,推动从“比拼参数与分数”走向“比拼可靠与可用”,将是具身智能迈向规模化应用的关键一步。