最近,南京大学数智史学实验室在南京举办了一个发布会,介绍他们最新开发的文献处理平台和红色资源库。这个平台和资源库利用了人工智能技术,把它运用到历史文献的研究中,让历史研究更智能化、高效化。南京大学历史学院院长梁晨教授提到,人工智能能帮助历史学家处理大量文献,减少繁琐的工作。这样一来,学者们就能更专注于需要深入思考和理论创新的地方。南京大学历史学院数智史学实验室负责人、助理教授金伯文指出,这个平台是基于生成式大语言模型的智能化资源库和工作环境。它通过光学字符识别(OCR)和智能优化技术,把非结构化的文献内容变成结构化数据,方便进行检索和分析。平台的设计考虑到了用户的需求,交互界面友好且易于使用。使用者即使没有编程背景,也能轻松导入、识别和管理文献资料。 这个平台在技术上取得了突破。它集成了先进的多模态大语言模型,在光学字符识别和跨语言翻译方面表现出色。不仅能高精度识别印刷体、手写体和竖排文本等复杂版式,还能处理西班牙语、葡萄牙语等多语种历史文献。最重要的是,它在翻译时会结合历史语境进行语义化转换,提高原始数据质量。 在实际应用中,这个平台已经展示出巨大的效果。比如南京大学历史学院明史研究中心的一个老师带领三名研究生,在短短一两个月内完成了近7亿字的明清海洋史研究文献全文识别与翻译基础工作。这在过去是难以想象的。这种高效的工作方式大大缩短了资料整理周期。 此次发布会上还介绍了近代红色资源库项目。这个项目致力于数字化、语义化整理和开发近代以来中国革命与建设时期的红色文献、报刊和档案等资料。它为相关历史研究、思想政治教育以及文化遗产保存提供高质量数据支撑和智能化工具。 南京大学数智文献处理平台及相关资源库的建成与开放,是现代信息技术推动文科研究创新的积极探索之一。这个项目不仅提升了历史研究的效率和边界拓展能力,也为人工智能在人文社科领域提供了借鉴路径。随着技术迭代和更多学科应用融合,这些数智化工具有望在更深层次上激发学术活力。