康奈尔团队发布三维“结”测试平台：模型能解绳结，但打结与形态转换仍显不足

科研团队近日开发出名为"KnotGym"的虚拟实验平台，用于系统评估智能系统的空间认知能力。该平台通过解结、打结及结型转换等分级任务进行测试，结果揭示了当前技术的关键瓶颈。数据显示，测试模型在解构四重交叉绳结时成功率高达90%，但在构建三重交叉结型时骤降至16%，面对更复杂结构则完全无法完成。

从语言理解到实际操作，是人工智能实现真正应用必须突破的瓶颈。"结绳"测试直观表明：真正的智能不仅在于回答问题，更在于在复杂环境中可靠完成任务。只有补齐空间推理与操作能力的短板，才能推动人工智能从实验室走向实际应用。