北京大学日前宣布,"智镜"大语言模型审美评估平台建设取得突破性进展,在国内率先建立起针对人工智能模型的中式审美能力测评体系,为解决当前智能算法在传统文化理解方面的短板提供了新路径。
长期以来,全球范围内的人工智能模型评测体系主要以西方美学标准为基础,对于中国传统艺术的理解与鉴赏能力缺乏系统性的评估框架。
北京大学艺术学院教授李洋指出,中国画的欣赏需要深厚的文化积淀和审美修养,如何判断智能模型是否真正理解这一艺术形式,成为人工智能本土化发展中亟待解决的课题。
面对这一现实问题,研究团队展开了深入调研,发现尽管中国古代艺术体系成熟完备、文化内涵丰富,却始终缺少一套能够客观衡量模型表现的评价标准。
为破解这一难题,北京大学艺术学院与北京大学计算艺术实验室于2025年3月联合启动"智镜"平台建设项目。
该平台的核心创新在于将意境、气韵、神采等抽象的中国传统美学范畴转化为可量化、可操作的评估指标,使算法能够接受系统化的审美能力检验。
目前建成的"中国画考试系统"已收录超过1.8万张中国古代书画艺术图像,每件作品都附有详尽的创作背景、风格流派、文化寓意及评论文献等资料,构成了内容丰富的测评题库。
评审专家进入系统后,可查看大模型对特定作品的分析解读,并从作品信息准确性、构图分析、笔墨技法、意境阐释等多个维度进行评判,精准识别模型在审美认知、历史知识、文化常识等方面存在的偏差与不足。
这种"模型答题、专家阅卷"的创新机制,不仅为技术研发团队提供了明确的优化方向,也为人工智能的本土化调优建立了客观参照系。
通过持续的测评与反馈,研究人员得以发现模型在处理中国传统文化内容时的薄弱环节,进而有针对性地改进算法架构和训练数据。
据了解,现阶段"智镜"平台主要面向受邀领域专家开放使用。
按照计划,今年5月该平台将向社会公众全面开放,届时普通民众也可参与到对人工智能审美能力的评价过程中。
这一举措将进一步扩大评估样本的广度与深度,使测评结果更具代表性和权威性。
以中国画为切口,审美评估平台的探索提示人们:技术能力的提升离不开文化坐标的校准。
把意境、气韵等传统审美转化为可检验的评测语言,不是简化艺术,而是为理解与传播打开新的通道。
未来,如何在尊重艺术复杂性的前提下建立更科学、更开放的评价机制,既考验跨学科协作的耐心,也将检验社会共同参与文化建设的广度与深度。