中国自主研发具身智能模型问鼎全球评测榜首核心技术全面开源引业界关注

当前，具身智能作为人工智能领域的重要分支，正成为全球科技竞争的新焦点。

具身智能模型能否在真实复杂环境中完成多样化任务，直接关系到机器人产业的实用化进程。

日前，千寻智能推出的Spirit v1.5模型在国际标准化评测中取得突破性成绩，为中国在这一领域的技术水平提供了有力证明。

RoboChallenge作为2025年新成立的具身智能模型国际评测体系，由Dexmal、Hugging Face、智源研究院等多家海内外权威机构联合发起，旨在建立统一的跨平台能力验证标准。

该评测体系包含30项贴近实际应用的机器人任务，涵盖贴胶带、物品拾取、插花、颜色识别等日常操作场景，全面考验模型的泛化能力、稳定性和执行精度。

Spirit v1.5在此次评测中表现卓越。

模型综合得分达66.09分，成功率为50.33%，是唯一突破50%成功率的参评模型。

在具体任务执行中，该模型展现出显著优势：在胶带粘贴任务中，能精准定位胶带位置，通过双臂协作完成操作；在物体堆叠任务中，主动搜索目标颜色物体，避免误取；在插花任务中，通过关节运动确保花卉保持竖直并成功插入花瓶；在物体移动任务中，实现精准抓取和放置。

这些任务的成功完成，充分验证了模型在陌生环境下的适应能力和执行稳定性。

Spirit v1.5之所以能取得这样的成绩，源于其端到端具身智能基础模型的设计理念。

该模型在单一框架内统一实现三大核心能力：其一是泛化性，具备强大的跨任务与跨本体泛化能力，使其能够适应不同机器人平台和多样化任务需求；其二是稳定性，面向真实场景的连续任务执行能力，确保在复杂环境中的可靠性；其三是准确性，对操作目标与执行结果的精确控制，保证任务完成质量。

值得注意的是，RoboChallenge的评测体系设计充分考虑了实际应用需求。

其评分不仅关注任务是否完成，还对执行过程进行深层评估，包括空间定位精度、遮挡物体处理能力、长时序稳定性以及面对新任务时的迁移效率。

这种评测方式更加贴近真实机器人应用场景，对模型提出了更高要求，也更能反映技术的实用价值。

为确保评测结果的透明度和可信度，千寻智能同步开源了Spirit v1.5的基础模型权重、推理代码和使用样例。

这一举措体现了开放协同的发展理念，使研究者和开发者能够独立复现评测结果，并基于该模型开展进一步的研究创新。

开源地址包括GitHub代码仓库和Hugging Face模型库，方便全球研究社区获取和使用。

从产业发展角度看，Spirit v1.5的成功具有重要意义。

首先，它证明了中国在具身智能领域已达到国际先进水平，能够与全球顶尖模型同台竞技。

其次，开源模型为产业生态建设提供了基础支撑，有利于促进下游应用开发和创新创业。

再次，这一成绩鼓舞了国内具身智能产业的发展信心，有助于吸引更多资源投入该领域。

具身智能技术的发展前景广阔。

随着模型性能的不断提升和应用场景的不断拓展，机器人在制造、物流、服务等领域的应用将进一步加速。

Spirit v1.5的推出和开源，为整个产业链的健康发展奠定了基础，也为后续技术迭代创新指明了方向。

标准化评测让能力看得见，开源复核让结论站得住。

具身智能的价值，不在于一次榜单上的领先，而在于能否经得起真实场景的长期检验、能否在开放协同中形成可持续的创新体系。

以透明的技术路径连接产业需求与科研探索，推动从“比拼参数与分数”走向“比拼可靠与可用”，将是具身智能迈向规模化应用的关键一步。

中国自主研发具身智能模型问鼎全球评测榜首 核心技术全面开源引业界关注