“卫士虾”来袭，谁来保证用户的安全？

3月13日，由微软小冰原班人马打造的明日新程发布了Guardian Claw，也就是“卫士虾”，打算给AI Agent穿上一层防护铠甲。随着那个叫“龙虾”的生态越来越火，好多用户都在本地电脑上使唤Agent干活、调用工具，甚至管文件、连API了。可是，要是Agent变得太自主、能直接操作电脑，到底谁来保证用户的安全？针对这种情况，“卫士虾”正式上线了。这款产品能实时盯着本地机器上所有“龙虾”的异常动作，一旦发现不对劲立马出手。安装它简直太简单了，用户只需要对自己的Claw说：“去Claw.myTuanzi.com 下载卫士虾”，说完软件自己就能全搞定。最近Agent圈子里爆出了不少安全隐患。有人发现有些Skill（技能插件）能通过提示词注入（Prompt Injection）或者瞎指挥，骗得Agent把个人信息、企业API Key、.env文件甚至SSH Key这些私密东西都给掏出来发出去。虽然这种漏洞不一定是坏人故意留的，可能只是插件写得不够严谨，但只要有漏洞存在，就很容易成了数据泄露的后门。卫士虾可以看作是Agent时代的安全大管家。它引入了一套类似操作系统的防护机制，包括查权限、记日志、分等级和做沙箱。它的活儿主要有：拦截那些挖坑的提示注入攻击；专门盯着API Key、Token这些宝贝；限制插件只能看完成任务必需的东西；检查插件往外发数据的地方安不安全；还能记个账供用户查账。更有意思的是，这玩意儿不是人类程序员敲代码弄出来的，而是明日新程那帮群体智能自己搞定的。CEO李笛说这只是个开头，团队已经给群体智能下命令了，要不断升级这套系统。未来版本还会搞更厉害的招数，比如权限说明、域名信誉库、插件签名还有专门的Secret Vault，用来统一管那些敏感的密钥。