北大推出“superchem”化学能力评测体系

北京大学化学与分子工程学院联合计算中心、计算机学院还有元培学院，经过几个月的努力，搞出了一套叫“SUPERChem”的评测体系。这回推出的这套体系挺有看头，有三个特点：出题的老师都是专业人士，有化学奥赛冠军和其他专家一起设计题库，保证题目既有前沿性又有挑战性；审核也很严，一道题得经过出题人、评审人还有终审人三轮把关，有个别题目修改了15次以上；答题形式简单直接，全是选择题，既能防止机器背数据糊弄事，又方便统计到底哪儿不行。这次评测结果挺有意义。平均40.3%的准确率告诉我们，学生在解决复杂化学问题时还是挺看重思维深度和直觉的。对于做技术的人来说，这些数据就像指路明灯，清楚地显示出了现在的模型在化学这块还有多不足。更长远看，这套体系把标准定下来了，以后大家做技术、搞科研就能在“评估—改进—再评估”这个圈子里转起来。发布这套评测体系不是为了单纯看谁比谁强，而是想给智能技术定一个标准。未来如果多模态学习、符号推理这些技术更厉害了，智能工具就能在设计化合物、优化反应路径还有分析实验数据这些事儿上帮大忙。作为中国化学学科的重要基地，北大这次的行动不仅体现了高校在跨学科上的带头作用，也给咱们探索“人工智能驱动科研”这个新路子打下了底子。科学技术发展不是要把人类换掉，而是要帮咱们拓展认知和实践的边界。北京大学这次推出的化学能力评测体系，不光给智能技术树了一把尺子，也反映出了高等教育在时代变化中的自觉和担当。学校用科学精神给技术把了向，用人文关怀带了头。在技术和学科深度融合的路上，中国高校正一步步摸索出既看得远又有建设性的发展模式。