问题——大模型“更会想”之后,如何“更会做”;林俊旸在文中将当前大模型能力演进归纳为两条路径:一条侧重在给出答案前提升内部推演质量,以提高解题正确率、生成更好的代码并取得更优的基准测试成绩;另一条侧重与外部环境持续交互,在不确定的反馈中把任务推进到完成。他认为,行业在推理能力上已取得阶段性进展,下一步更关键的问题是:模型能否围绕“行动”来思考,能否在工具选择、执行校验、失败修正和长期任务衔接中形成稳定闭环。
从推理走向智能体,是大模型从“会答题”到“能办事”的关键一步。它不仅考验算法,也更考验数据治理、系统工程与场景落地能力。下一阶段的竞争中,谁能在可控成本下构建高质量环境与可靠工具链,谁就更可能把“模型能力”转化为真正的“生产力能力”,在技术演进与产业应用之间形成闭环。