ai界炸开了锅，这个强化学习的大佬在新加坡国立大学演讲时说，大语言模型也就是一时流行

前段时间，AI界真是炸开了锅。特别是理查德·萨顿，这个强化学习的大佬在新加坡国立大学演讲时说，大语言模型也就是一时流行的玩意儿，真智能还差得远呢。毕竟人家可是拿了2024年图灵奖的人。他直言不讳地指出，像ChatGPT、Gemini这些系统，说白了就是在猜词儿，根本不懂人话背后的逻辑。比如说你问它怎么用微波炉热冰淇淋，它给你个听起来挺完美的答案，但心里根本不知道这事儿有多荒唐。这种缺失常识的毛病，把纯文字训练的弱点暴露得淋漓尽致。反观AlphaGo那种能下围棋的，还有波士顿动力那个会自己爬起来的机器人，这些靠跟环境互动学会的本事，才是真正的智能源头。萨顿和Yann LeCun提的那个“世界模型”理论挺有道理。他们觉得机器得像个婴儿那样，靠感官去感知世界才行。比起现在这些关在文字笼子里的天才，哪怕背遍了书也学不来抓积木懂力学的道理。更要命的是灾难性遗忘的问题。人类学会骑自行车就忘不了了，但大模型只要稍微改个新任务，以前学的东西就全忘了。萨顿他们搞的那个持续反向传播算法（Continual Backprop）就不一样，通过动态重置神经元来保持记忆，在机器人控制上表现特别好。这种像生物一样的学习方式，跟现在用死数据集训练的老路子完全是两码事。现在大家开始反思了。听说OpenAI的GPT都卡脖子了，DeepMind也把心思放在了多模态智能上。萨顿参与的那个阿尔伯塔计划正在做能在虚拟厨房里瞎晃悠的AI，实验结果表明这种能动手动脚的家伙解决问题的能力比光会聊天的强太多。这也证明了他的预言：以后AI的主战场肯定不在文本预测上，而是在跟环境的互动上。咱们站在十字路口回头看，得听听这个研究了AI 45年的老爷子的话。现在科技巨头都忙着拼千亿参数的军备竞赛呢，萨顿提醒咱们得盯紧点本质的问题：没目标的学习就是个精致的统计学玩具；不能动手动脚的智能终究是个空中楼阁。就像他拿奖时说的那句至理名言——真正的智能时代得从放弃模仿人类数据开始。