到了毕业季,许多大学生为论文写得像AI生成的事儿愁得不行。孔德淇拿这事提醒大家:AI检测技术不该伤了原创的要害。数据显示,有大学生反映自己的论文被指出AI率高达90%。为了搞清楚这是怎么回事,有人把朱自清的《荷塘月色》和刘慈欣的《流浪地球》片段放进论文检测系统里去测。结果太吓人了,前者被判定有62.88%的概率是AI生成的,后者更是高达52.88%。更离谱的是,经典的《滕王阁序》竟然被检出了100%的AI率。这些作品都是人类写的,居然都过不了关,同学们都在担心自己的论文会不会也遭殃。 其实AI检测技术原本是想帮我们判断内容是不是机器生成的。现在AI发展这么快,学术创作里“机器味”也浓了起来,用它来查“机器代写”或数据造假确实很有必要。可现在检测结果这么可笑,真的让人没法信服。只要稍微了解一下这项技术就能发现问题出在哪儿。现在的系统主要是用机器学习和自然语言处理来分析文本、图像或音频。但这种方法有硬伤:语言本来就千变万化,“红杏枝头春意闹”和“春风又绿江南岸”说的是同一种意思,但表达不一样;另一方面,现在的生成式AI写得越来越像人,系统更分不清是真是假。 还有数据方面的问题。如果训练数据本身有偏差或数量不够多、不全,系统就容易出错。实际使用中很多系统为了追求速度简化了流程,结果准确性就大打折扣。如果检测老出错,它的可信度就会下降。时间长了会误导大家对原创的判断,还会打击创作者的积极性。 既然技术还没成熟,我们不能全信它。创作者也不用太焦虑,毕竟创作的过程是独一无二的,作品里的情感和思想是机器模仿不来的。 要解决这个问题,关键是要提升技术的准确性和公信力。相关部门和机构要尽快规范和监管这项技术,一方面完善检测标准;另一方面加强数据治理。还得建立第三方审计机制来检查系统算法透明不透明、准确不准确。只有让它在科学规范的轨道上跑,才能真正保护原创作品而不是害它们。