3月13日,由微软小冰原班人马打造的明日新程发布了Guardian Claw,也就是“卫士虾”,打算给AI Agent穿上一层防护铠甲。随着那个叫“龙虾”的生态越来越火,好多用户都在本地电脑上使唤Agent干活、调用工具,甚至管文件、连API了。可是,要是Agent变得太自主、能直接操作电脑,到底谁来保证用户的安全? 针对这种情况,“卫士虾”正式上线了。这款产品能实时盯着本地机器上所有“龙虾”的异常动作,一旦发现不对劲立马出手。安装它简直太简单了,用户只需要对自己的Claw说:“去Claw.myTuanzi.com 下载卫士虾”,说完软件自己就能全搞定。 最近Agent圈子里爆出了不少安全隐患。有人发现有些Skill(技能插件)能通过提示词注入(Prompt Injection)或者瞎指挥,骗得Agent把个人信息、企业API Key、.env文件甚至SSH Key这些私密东西都给掏出来发出去。虽然这种漏洞不一定是坏人故意留的,可能只是插件写得不够严谨,但只要有漏洞存在,就很容易成了数据泄露的后门。 卫士虾可以看作是Agent时代的安全大管家。它引入了一套类似操作系统的防护机制,包括查权限、记日志、分等级和做沙箱。它的活儿主要有:拦截那些挖坑的提示注入攻击;专门盯着API Key、Token这些宝贝;限制插件只能看完成任务必需的东西;检查插件往外发数据的地方安不安全;还能记个账供用户查账。 更有意思的是,这玩意儿不是人类程序员敲代码弄出来的,而是明日新程那帮群体智能自己搞定的。CEO李笛说这只是个开头,团队已经给群体智能下命令了,要不断升级这套系统。未来版本还会搞更厉害的招数,比如权限说明、域名信誉库、插件签名还有专门的Secret Vault,用来统一管那些敏感的密钥。