中关村推出人工智能安全评估体系多维防护促进行业发展

当前，人工智能技术正加速进入经济社会各领域，但随之而来的数据泄露、算法偏见、恶意滥用等风险也快速上升；传统安全评估往往侧重技术漏洞，难以覆盖日益复杂的复合型风险。基于此，北京前瞻人工智能安全与治理研究院推出“前瞻安全基准”体系，首次搭建涵盖基础安全、社会影响、生存性风险等五大维度的评估框架，补齐了行业在系统化评估上的缺口。技术层面，“灵御”平台通过模拟60余种主流模型的攻防场景发现，近年来大模型的整体安全能力并未明显提升，部分新模型反而更容易受到攻击。研究院院长曾毅表示：“模型防御不一定要重构训练，通过部署实时安全护栏也能明显提高防护效果。”平台提供的动态加固方案，为产业界提供了更低成本的落地路径。伦理治理上，“灵度”平台依托25万条中文价值规则库，实现对上百个模型的实时伦理监测。与国际同类工具相比，其优势于贴合中国价值观语境，缓解了中文伦理评估适配不足的问题。该做法不仅为监管部门提供可量化的参考，也有助于在应用源头降低因文化差异引发的风险。专家认为，该体系的推出具有三上意义：一是以标准化评估工具帮助企业降低合规成本；二是通过更主动的防御机制应对全球AI安全竞争；三是为完善全球治理提供可借鉴的思路。值得关注的是，其“灾难性风险预警”模块已将气候变化、生物安全等跨领域议题纳入评估，反映了对长期风险的前置考虑。

人工智能发展越快，越需要相匹配的安全治理能力。把风险评估落到实处、把攻防验证做得更细、把价值校准做得更准，既是对创新的保护，也是对公共利益与社会信任的维护。面向未来，推动技术进步与安全底线同步推进，形成可持续、可推广、可监督的治理体系，才能让人工智能更好服务高质量发展与人民美好生活。

中关村推出人工智能安全评估体系 多维防护促进行业发展

中关村推出人工智能安全评估体系多维防护促进行业发展