2026年3月，我们拼的不是谁家模型更牛，而是看谁家能像个“数字同事”一样接活儿、干活

话说2026年3月，清新研究团队搞了个报告，算是把全球通用智能体这事儿给捋顺了。他们不玩以前老盯着基座模型看的那一套了，直接把目光转向了产品和任务交付这一块儿。这报告说，现在大家拼的不是谁家模型更牛，而是看谁家能像个“数字同事”一样接活儿、干活儿、还能协同配合。为了把这事儿说清楚，他们还搭了个三层框架：产品层、原语层和垂直代理层。真正的通用智能体标准也定了下来：得能接任务、拆任务、执行任务、最后把活儿干完，还得能处理复杂事儿、用各种工具、记住状态、产出实实在在的东西。光会聊天的那种或者只能搞一个专业领域的系统，都不算通用智能体。现在的主战场在产品层。Manus、Genspark和Flowith这几家是核心玩家，路子都不一样。Manus是典型的任务交付型智能体，主打在本地浏览器里执行任务，直接把文件交给用户而不是光发消息。Genspark呢，就是搞个一体化的AI工作台，把各种办公模块都整合进来，想让用户迁移成本低一些。Flowith则是画布优先的工作空间，特别看重上下文的保持和可视化的工作流，野心挺大，想做成AI智能体的操作系统。底座能力这块儿就是OpenAI、Google和Anthropic在搞。他们给产品层提供像用电脑、用浏览器这些动作原语的能力。OpenAI搞的是Operator，Google是Project Mariner，Anthropic就自己搞自研的computer use。不过这些能力虽然基础又重要，但光有它们还成不了用户眼里真正的通用智能体。想要让用户满意，还得靠产品层去包装包装才行。高价值垂直代理层就Devin比较典型。Devin就是个AI软件工程师，在软件工程这块儿挺深的，能搞定复杂的工程任务。不过它场景太窄了，算不上广义的通用智能体。以后它和那些产品层的智能体还得共存着。报告还提了五个核心竞争维度：任务交付、环境控制、Workspace和记忆、用户入口与平台黏性、企业治理与控制面。说白了就是看谁能成为“默认任务承接方”，把活儿抢走了才算赢。他们还首创了几个概念，像任务交付型智能体、原语层和产品层分离、工作台护城河这些。最后对未来两年做了三个预判：竞争会更偏向产品本身的比拼；底座能力层和产品层分开的趋势会更明显；工作台、记忆和入口的商业价值会越来越高。说白了就是以后的胜负关键在产品层那些玩家怎么打。真正的护城河也不在模型参数有多大，而是在任务交付的工作台入口、记忆还有治理能力上。