Twilio最近发布了一个叫做Agent-2-Human(A2H)的新协议。过去一年里,很多公司都在搞各种协议来让AI工具和人或其他机器对话,比如说有智能体对智能体的协议(A2A),还有专门和企业系统聊天的商务协议(ACP)和支付协议(AP2),甚至还有给模型上下文用的MCP。不过Twilio觉得,大家都在忙这些乱七八糟的东西,却漏掉了怎么让AI和真人沟通。他们周四就开源了这个A2H,主要是想帮AI在工作的时候,知道什么时候该把事情交给人来处理,并且用对的方式联系到人。Twilio负责新兴技术的VP Rikki Singh在发公告的时候说得挺简洁:“智能体只关心从人那拿什么,不在乎怎么找到人。” 系统还会把所有对话记录下来,弄成审计日志。 我在The New Stack独家采访了Singh,她说现在的AI虽然越来越能干,但总还得靠人来最后拍板。“这不是因为AI笨,而是因为很多决策还得靠人的判断,还有信任这一块很重要。” 问题来了,升级的路该怎么走?Twilio以前一直管着企业怎么跟消费者打交道,不管是发短信、用App还是打电话。Singh觉得他们在这方面经验老到,正好能解决这个问题。“我觉得我们要做的是卸掉责任——搞清楚升级路径的责任不该在开发者或消费者身上。应该是工具自己搞定,”她说。开发者不需要自己去操心AI怎么找人联系还得管不同的渠道像SMS、WhatsApp、推送通知或者语音之类的这些事。A2H就把这些乱七八糟的都抽象掉了,AI只要把消息发到A2H网关,剩下的事就交给网关去办。 基于公司以前连企业和消费者的经验,A2H支持五个主要意图(以后还能扩展):通知、收集信息、授权交易、升级任务还有报告结果。考虑到实际使用情况,A2H第一个案例就是冲着安全来的。网关处理的每一次交互都会留下签名的记录文件。也就是说当有人批准一笔交易的时候,这就是AI请求并得到同意的铁证。Singh说网关很关键,“因为必须有一套规则来确保AI在做某些交易前得要批准,而且必须得有记录。” “我们觉得每次AI想和人说话的时候,背后其实都有一个隐含的意图,”Singh说,“我们发现这样做最能帮开发者理解怎么跟人搭话。” 不过默认意图只是个基准,整个框架还能扩展。对于用MCP的AI来说,A2H就像个普通工具,他们可以用相同的工具调用方式比如humans_inform()来操作。 这次Twilio开源了A2H的第一个版本规范,重点关注意图功能还有认证支持和渠道抽象。接下来他们还会把A2H和其他的AI框架比如LangGraph、CrewAI连起来用,还有加上一些用于长期批准(和撤销)的东西。 Q1:A2H协议到底是啥?它解决了啥问题? A:A2H是Twilio搞出来的开源协议,专门管AI跟人怎么说话的事儿。它解决了当AI需要人帮忙的时候,怎么正确地把活儿交给人干,还得选对的通讯方式的问题。 Q2:A2H支持哪些主要功能? A:A2H支持五种核心功能:通知(单向发消息)、收集(要地址这种结构化信息)、授权(通过验证批准交易)、升级(把活儿移交给人)还有结果(报告任务干完了)。这些功能都可以再加东西。 Q3:A2H咋保证安全? A:A2H是通过网关处理所有对话的。每次对话都会产生一个签名的记录文件。当有人批准一笔交易的时候,系统会把AI请求并获得同意的证据记下来,保证以后能查到并保证安全。