话说2026年3月,清新研究团队搞了个报告,算是把全球通用智能体这事儿给捋顺了。他们不玩以前老盯着基座模型看的那一套了,直接把目光转向了产品和任务交付这一块儿。这报告说,现在大家拼的不是谁家模型更牛,而是看谁家能像个“数字同事”一样接活儿、干活儿、还能协同配合。为了把这事儿说清楚,他们还搭了个三层框架:产品层、原语层和垂直代理层。真正的通用智能体标准也定了下来:得能接任务、拆任务、执行任务、最后把活儿干完,还得能处理复杂事儿、用各种工具、记住状态、产出实实在在的东西。光会聊天的那种或者只能搞一个专业领域的系统,都不算通用智能体。 现在的主战场在产品层。Manus、Genspark和Flowith这几家是核心玩家,路子都不一样。Manus是典型的任务交付型智能体,主打在本地浏览器里执行任务,直接把文件交给用户而不是光发消息。Genspark呢,就是搞个一体化的AI工作台,把各种办公模块都整合进来,想让用户迁移成本低一些。Flowith则是画布优先的工作空间,特别看重上下文的保持和可视化的工作流,野心挺大,想做成AI智能体的操作系统。 底座能力这块儿就是OpenAI、Google和Anthropic在搞。他们给产品层提供像用电脑、用浏览器这些动作原语的能力。OpenAI搞的是Operator,Google是Project Mariner,Anthropic就自己搞自研的computer use。不过这些能力虽然基础又重要,但光有它们还成不了用户眼里真正的通用智能体。想要让用户满意,还得靠产品层去包装包装才行。 高价值垂直代理层就Devin比较典型。Devin就是个AI软件工程师,在软件工程这块儿挺深的,能搞定复杂的工程任务。不过它场景太窄了,算不上广义的通用智能体。以后它和那些产品层的智能体还得共存着。 报告还提了五个核心竞争维度:任务交付、环境控制、Workspace和记忆、用户入口与平台黏性、企业治理与控制面。说白了就是看谁能成为“默认任务承接方”,把活儿抢走了才算赢。他们还首创了几个概念,像任务交付型智能体、原语层和产品层分离、工作台护城河这些。 最后对未来两年做了三个预判:竞争会更偏向产品本身的比拼;底座能力层和产品层分开的趋势会更明显;工作台、记忆和入口的商业价值会越来越高。说白了就是以后的胜负关键在产品层那些玩家怎么打。真正的护城河也不在模型参数有多大,而是在任务交付的工作台入口、记忆还有治理能力上。