康奈尔团队发布三维“结”测试平台:模型能解绳结,但打结与形态转换仍显不足

科研团队近日开发出名为"KnotGym"的虚拟实验平台,用于系统评估智能系统的空间认知能力。该平台通过解结、打结及结型转换等分级任务进行测试,结果揭示了当前技术的关键瓶颈。数据显示,测试模型在解构四重交叉绳结时成功率高达90%,但在构建三重交叉结型时骤降至16%,面对更复杂结构则完全无法完成。

从语言理解到实际操作,是人工智能实现真正应用必须突破的瓶颈。"结绳"测试直观表明:真正的智能不仅在于回答问题,更在于在复杂环境中可靠完成任务。只有补齐空间推理与操作能力的短板,才能推动人工智能从实验室走向实际应用。