英伟达与思科开源方案应对AI安全挑战构建智能代理防护体系

问题：自主智能体加速落地，安全与治理短板凸显近年来，企业运维、安全、客服、研发等场景中广泛采用自主智能体，以提升自动化水平和响应效率。然而，与传统软件不同，智能体需要跨系统访问数据、调用外部工具并生成决策，一旦权限配置不当或遭遇提示注入攻击，可能导致越权访问、数据泄露或错误变更扩散等风险。此外，若智能体决策过程缺乏可追溯的证据链，企业在合规审计和责任界定上将面临更大挑战。原因：智能体具备“工具化行动力”，供应链与执行链风险增加业内人士分析，智能体风险上升的核心在于其从“内容生成”转向“行动触发”。一上，智能体需连接工单、配置管理、云服务、代码仓库等多种系统，访问范围和颗粒度显著扩大；另一方面，工具、插件和服务接口构成新的“能力供应链”，任一环节未经验证或被篡改，风险可能沿调用链快速蔓延。加之智能体具备长期运行和持续学习能力，传统静态防护手段难以应对其动态行为。影响：从“能否使用”到“能否安全规模化使用” 在降本增效和数字化转型需求推动下，企业对智能体的期望不断提高。但如果安全和治理能力不足，智能体推广将面临现实障碍：高权限场景受限、关键链路受阻、跨部门协作困难。此外，监管合规要求企业证明系统“按规则运行”，不仅要防止越权行为，还需解释决策逻辑和操作过程。因此，覆盖运行时隔离、策略控制、行为审计和供应链验证的体系化能力，正成为智能体规模化落地的必要条件。对策：以“边界约束+行为核验”构建分层防线英伟达与思科联合发布的技术方案采用两层协同机制：OpenShell作为开源运行时，为智能体提供基础设施级安全边界；AIDefense作为安全平台，负责验证和审计智能体行为。在运行时层面，OpenShell针对长期运行的智能体设计，遵循“默认不授予权限”原则。它为每个智能体创建隔离的沙箱环境，外部访问需经策略授权；调用外部工具或服务时，通过网络策略拦截未经验证的软件包和不合规访问；在调用云端模型等环节，引入隐私路由机制，对敏感信息匿名化处理，降低泄露风险。在验证审计层面，AIDefense聚焦“记录与核验行为”。平台持续跟踪智能体的推理步骤、工具调用和决策过程，并对技能组件及对应的服务进行供应链安全检查，确保仅调用已验证工具。该架构分工明确：运行时约束“能做什么”，审计系统核验“实际做了什么”，并在异常时提供阻断和取证能力。为展示应用价值，方案以企业安全运营为例：当出现零日漏洞时，智能体可自动解析公告并定位受影响设备，评估影响范围后生成修复建议。所有操作在沙箱中完成，避免越权访问；当智能体通过工单系统提交修复任务时，AIDefense实时检测调用请求，发现异常行为（如提示注入窃取数据）立即阻断并记录事件，确保数据安全。最终，企业不仅获得修复方案，还能提供完整的审计记录，满足合规要求。前景：开源推动生态协同，安全治理或成核心竞争力业内认为，智能体将向“更强行动力、更长运行周期、更广系统连接”方向发展，安全治理将从附加功能变为核心基础。此次开源方案有助于降低企业验证和集成成本，推动生态伙伴在统一标准下扩展工具与服务。分层防护和全链路可追溯的思路或将成为企业构建智能体平台的重要参考：既要严格管控权限，又要确保行为透明可验证。

自主AI代理不仅是自动化升级，更是治理模式的重构；只有在可验证、可审计的框架内运行技术创新，才能将效率优势转化为长期竞争力。未来，谁能实现安全、合规且规模化的智能自动化，谁就更可能在新一轮产业变革中占据先机。

英伟达与思科开源方案应对AI安全挑战 构建智能代理防护体系

英伟达与思科开源方案应对AI安全挑战构建智能代理防护体系