最近我看到一个挺有意思的活动,北京那边举行了“数智时代古籍数字化前沿论坛暨‘我用AI校古籍’(2025年)总结会”,专门聊了聊怎么用AI去整理古籍。这种事儿听起来好像挺高大上,其实就是全国各地3.7万的志愿者通过互联网平台一起动手,把那些老古董的书给翻出来看看。 这些书可是咱们老祖宗留下的宝贝,全都是历史记忆跟智慧的结晶,保护它们真的很不容易。以前大家都得靠手一个字一个字地抄,费时又费力,规模也不可能太大。现在有了AI这种新技术,局面完全变了。从2024年开始,“我用AI校古籍”这个项目就启动了,在识典古籍平台的帮助下,吸引了全国1450多所高校的2万名大学生,还有1.7万名社会上的志愿者一起参与进来。这么多人凑在一起,通过电脑协同工作,总共已经把15亿字的内容给粗校了一遍,涉及到的古籍大概有2万部。这成果真是让人吃惊。 说到技术上的事儿,北京大学中文系的杨海峥教授提了一个词叫“OCR”,就是光学字符识别。以前大家靠肉眼看字可费劲了,现在有了这个技术就能把字给识别出来,准确率特别高,为后面的工作打下了很好的基础。不过光把字弄出来还不够,标点符号、人名地名什么的也得标清楚才行。杨教授还说现在AI不光能自动加标点分段,还能帮你比对不同版本的书里哪不一样,把形近字错误给筛掉。这样学者们就不用老是对着书翻来翻去做那些重复的工作了,能把更多心思花在研究那些不一样的地方去。 全国高等院校古籍整理研究工作委员会的卢伟秘书长也特别认同这个说法。他觉得AI技术不光是提高了速度,更重要的是把以前人力没法搞定的海量文献处理问题给解决了。现在大家都是人跟机器一块儿干活,研究的方式也变了。 除了让专业人士干活更轻松外,这个项目还特别有意思的一点是它拉进了普通人跟古籍之间的距离。以前大家可能觉得那都是很高深的学问只有专家才能懂,现在平台把那些复杂的步骤给拆分成了大家都能看懂的小任务。首都师范大学敦煌学方向的方晓辰博士作为志愿者就很有感触。她在处理《康熙字典》里那些怪字的时候,平台的图像识别特别厉害,稍微一拍照几秒钟就能搞定一个字的校对。这种方便的方式让原本枯燥的活儿变得好玩了不少。看着自己整理的书被别人引用讨论,那种感觉真的挺棒。 而且这不只是学生在参与啊,各行各业的人都在这儿。像机场的工作人员张晓波就因为对历史有兴趣加入了精校团队。在跟学校老师同学合作的过程中,他也学了不少诗词啊、传记啊什么的内容。张晓波觉得那些书从博物馆里冷冰冰的展品变成了大家能亲手摸、能一起聊的知识了。 这样一来就打破了知识的高墙啊!大家都能参与进来了。“我用AI校古籍”这个项目不光是完成了一大堆校对工作那么简单,它展示了一种新模式:技术搭好台子,文化唱戏,大家一起唱戏。首先它让古籍数字化的速度快了好多;其次它培养了一大批懂技术的年轻力量;最重要的是它改变了咱们看古籍的眼光——不再觉得那是高高在上的东西了,而是咱们能用得着的公共资源。 当3.7万双手通过电脑跟千年的文化连在一起的时候,我看到的不仅仅是效率提高了这么简单,更是那种传承的模式发生了大变化。AI和古籍整理结合在一起真的打开了一扇大门,让这些老智慧在数字时代能大放异彩。这股新的力量不光让书活了起来、传下去了,还在全社会种下了爱护传统文化、愿意去传承它的种子呢!