中国正大力推进人工智能安全治理体系建设,90个关键细分类别的伦理评估也正通过“前瞻·灵度”平台展开,中关村这片创新的热土也为这项事业贡献了一份重要力量。研究院院长曾毅谈到,这套立足中国国情的安全治理体系在诸多关键领域发挥着关键作用。从教育科研到金融经济,再到政务民生,体系中的“五位一体”框架能全方位覆盖。数据隐私泄露、技术滥用和虚假信息传播等老问题仍是制约产业发展的痛点。为了应对这些风险,北京前瞻人工智能安全与治理研究院给快速演进的人工智能装上了精准导航仪和可靠的制动系统。 这套体系突破了传统只盯着技术漏洞的老路子,创造性地搭建起包含基础安全、具身智能安全在内的多层防护网。“灵御”平台支持60多种主流大模型进行测试,通过20多种攻击方法来模拟真实场景。测试结果显示,不少新出的大模型在安全属性上其实没有太大进步,甚至对新型攻击的抵御能力还不稳定。这就警示大家不能光想着做大模型、搞性能参数,而把安全属性的同步强化给忘了。 曾毅强调安全防御并不一定非得耗时耗力地去重训模型,在线推理阶段部署一些精准的安全护栏就能大幅提升实际水平。“灵御”平台的价值就在于它能给不同的模型提供定制化的加固建议。与此同时推出的“灵度”平台,把关注的焦点放在了伦理评估和价值校准上。这个平台在6大维度下定义了超过25万条规则,解决了中文语境适应性差的问题。 纵观这套体系与平台,它系统性地回答了三个关键命题:评什么、怎么评?怎样攻、如何防?向何处去?这既是技术工具的集合,更是一套融标准、治理方法和价值导向于一体的解决方案。通往安全可信人工智能未来的道路已在脚下延伸,“灵度”平台借助以中国价值观为核心的大规模中文语料库,累计定义规则超过25万条。 这不仅是技术工具的集合,更是一套融技术标准、治理方法和价值导向于一体的综合性解决方案。它标志着中国在人工智能治理领域迈出了自主创新的重要一步。未来随着技术不断发展,这套扎根中国实践、着眼全球挑战的基座平台不仅能为国内产业行稳致远保驾护航,也会给全球治理贡献具有东方智慧的中国方案。 曾毅提到,25万条定义规则有效解决了现有伦理评估体系中文语境适应性不足的问题。这些规则覆盖了90个细分类别和6大维度的实时动态监测与评估。“灵御”平台通过高度仿真的对抗场景为模型提供全方位压力测试。“灵度”平台集成了以中国价值观为核心的中文价值语料库。这是我国在人工智能治理领域自主创新的一次重要实践。 它给中国人工智能产业提供了重要的技术抓手。“灵御”平台目前已支持60余种主流大模型集成20余种攻击方法和10余种防御机制形成动态攻防验证闭环。数据显示部分新推出的大模型安全性并未显著提升。在在线推理阶段部署精准安全护栏能大幅提升模型实际安全水平。“灵御”平台能够为不同模型提供定制化防御方案和加固建议。 中关村国家自主创新示范区核心区域的一座安全治理“灯塔”正在点亮。我国快速演进的人工智能技术装上了精准导航仪和可靠制动系统。这次发布展现出鲜明系统性和前瞻性特征构建起涵盖基础安全等五位一体框架。 这个框架能够有效覆盖教育科研等关键领域重点评估隐私数据保护等核心难题。全球人工智能技术正以超乎想象的速度迭代升级衍生出复杂多元的安全风险挑战。“灵御”平台能够为各类人工智能模型提供全方位安全压力测试。 这一系列成果是我国在人工智能治理领域自主创新的一次重要实践从应对具体安全威胁迈向构建前瞻性系统化治理能力。这个基座不仅将为我国人工智能产业行稳致远保驾护航也为全球人工智能治理贡献中国方案。 曾毅指出单纯追求模型规模与性能参数而忽视安全属性同步强化可能埋下严重隐患。“灵御”平台形成动态攻防验证闭环目前已支持60余种主流大模型。“灵度”平台能够在6大维度90个细分类别下对上百个大模型进行实时动态监测与评估。