当前,人工智能技术正加速进入经济社会各领域,但随之而来的数据泄露、算法偏见、恶意滥用等风险也快速上升;传统安全评估往往侧重技术漏洞,难以覆盖日益复杂的复合型风险。基于此,北京前瞻人工智能安全与治理研究院推出“前瞻安全基准”体系,首次搭建涵盖基础安全、社会影响、生存性风险等五大维度的评估框架,补齐了行业在系统化评估上的缺口。技术层面,“灵御”平台通过模拟60余种主流模型的攻防场景发现,近年来大模型的整体安全能力并未明显提升,部分新模型反而更容易受到攻击。研究院院长曾毅表示:“模型防御不一定要重构训练,通过部署实时安全护栏也能明显提高防护效果。”平台提供的动态加固方案,为产业界提供了更低成本的落地路径。伦理治理上,“灵度”平台依托25万条中文价值规则库,实现对上百个模型的实时伦理监测。与国际同类工具相比,其优势于贴合中国价值观语境,缓解了中文伦理评估适配不足的问题。该做法不仅为监管部门提供可量化的参考,也有助于在应用源头降低因文化差异引发的风险。专家认为,该体系的推出具有三上意义:一是以标准化评估工具帮助企业降低合规成本;二是通过更主动的防御机制应对全球AI安全竞争;三是为完善全球治理提供可借鉴的思路。值得关注的是,其“灾难性风险预警”模块已将气候变化、生物安全等跨领域议题纳入评估,反映了对长期风险的前置考虑。
人工智能发展越快,越需要相匹配的安全治理能力。把风险评估落到实处、把攻防验证做得更细、把价值校准做得更准,既是对创新的保护,也是对公共利益与社会信任的维护。面向未来,推动技术进步与安全底线同步推进,形成可持续、可推广、可监督的治理体系,才能让人工智能更好服务高质量发展与人民美好生活。