这数字太扎心了!那1177 个人里有多少人反思了自己的方向盘?我猜不会太多吧……

最近啊,刷到华东师范大学搞的那个AI一作实验,把我给镇住了。他们居然投了724篇论文,全是AI当第一作者。这也太科幻了吧?整整1177个人参与进来,说实话,我看了数据感觉学术圈的门槛有点变味了。 上次我参加一个线上研讨会,教授分享了类似的情况。实验室里学生们围在电脑前,对着ChatGPT说“来个引言”,还真就搞定了。有人质疑这算原创吗?大家七嘴八舌地改改句子,一个小时不到初稿就出来了。会议结束后有人问我这是偷懒还是加速,我当时没急着回答。 这个实验主要就是看看AI写的论文能不能骗过专家。结果让人挺意外的,AI和专家在评判好坏上一致率超过80%。虽然样本有限,但这也让我想起以前用AI辅助写代码的经历。那时候AI版本比手动快3倍,但bug率高了15%左右。 其实大模型原理挺简单的,就是海量数据喂给它,你给个提示词它就按概率挑最可能的组合。产业链上GPU卡就是燃料,NVIDIA提供算力;下游就是咱们这些用户输入提示拿输出。不过我现在也不觉得AI会完全取代人了,它太依赖人类输入了。 之前我在手机上试AI写作助手,让它写篇科技评论秒出稿,但深度就浅了很多。Siri规划行程确实省时,但脑子会偷懒啊。我翻旧笔记的时候看到一张截图,AI生成的摘要逻辑顺但引用全是大路货,原创引用率不到20%。 这就让我有点怀疑AI能不能真推进行业了?现在大家都太依赖外包了。朋友跟我说“AI是锤子,得找钉子用”,我觉得挺有道理的。NVIDIA的GPU成本高得吓人,小公司只能用开源模型。从GPT-3到4参数翻倍准确率升10-15%,但真实使用场景里往往打折。 实验数据显示724篇里超半数被刷掉了,为啥?因为缺乏温度啊!我自己写自媒体稿也是先让它生成框架再自己插故事,读者反馈就比纯AI版好30%。 那个实验发起人说人驾驭AI才有价值对的呢!就像开车导航导航再厉害也得有人来开才不会乱转。想象一下实验室尾声一个学生摇头说论证太机械加人文关怀同伴笑改半小时…… 最后报告末尾那个数据把我戳中了:一致率80%,但人类独有的创新火花识别率只有25%。这数字太扎心了!那1177个人里有多少人反思了自己的方向盘?我猜不会太多吧……