北大推出“superchem”化学能力评测体系

北京大学化学与分子工程学院联合计算中心、计算机学院还有元培学院,经过几个月的努力,搞出了一套叫“SUPERChem”的评测体系。这回推出的这套体系挺有看头,有三个特点:出题的老师都是专业人士,有化学奥赛冠军和其他专家一起设计题库,保证题目既有前沿性又有挑战性;审核也很严,一道题得经过出题人、评审人还有终审人三轮把关,有个别题目修改了15次以上;答题形式简单直接,全是选择题,既能防止机器背数据糊弄事,又方便统计到底哪儿不行。这次评测结果挺有意义。平均40.3%的准确率告诉我们,学生在解决复杂化学问题时还是挺看重思维深度和直觉的。对于做技术的人来说,这些数据就像指路明灯,清楚地显示出了现在的模型在化学这块还有多不足。更长远看,这套体系把标准定下来了,以后大家做技术、搞科研就能在“评估—改进—再评估”这个圈子里转起来。 发布这套评测体系不是为了单纯看谁比谁强,而是想给智能技术定一个标准。未来如果多模态学习、符号推理这些技术更厉害了,智能工具就能在设计化合物、优化反应路径还有分析实验数据这些事儿上帮大忙。作为中国化学学科的重要基地,北大这次的行动不仅体现了高校在跨学科上的带头作用,也给咱们探索“人工智能驱动科研”这个新路子打下了底子。科学技术发展不是要把人类换掉,而是要帮咱们拓展认知和实践的边界。北京大学这次推出的化学能力评测体系,不光给智能技术树了一把尺子,也反映出了高等教育在时代变化中的自觉和担当。学校用科学精神给技术把了向,用人文关怀带了头。在技术和学科深度融合的路上,中国高校正一步步摸索出既看得远又有建设性的发展模式。