anthropic 收购anthropic做视觉驱动的初创公司

最近AI Agent这个领域,简直热闹得不行。Anthropic把一家做视觉驱动计算机自动化的初创公司Vercept给收购了,这动作看着是在给Claude这个核心产品补短板呢。2024年10月的时候,Claude就带着那个计算机操作功能上线了,让机器能看屏幕、动鼠标、敲键盘,一口气搞定好多任务。可这玩意刚出来的时候,视觉理解总不准,动态界面也处理不好,搞得成功率老是不行。Vercept在UI识别、空间推理还有低延迟处理这块积累得厚,正好能填Claude的坑。据他们内部测下来,集成了Vercept技术之后,Claude在处理复杂工作流时出错的几率明显降了。Vercept是2025年初才刚成立的西雅图公司,理念特前卫叫“无API自动化”。它有艾伦人工智能研究所的大佬撑腰,种子轮就拿到了1600万美元的融资,估值直接飙到6700万美元。投资人阵容那叫一个豪华,有前谷歌CEO埃里克·施密特、DeepMind首席科学家杰夫·迪恩这些大人物。虽说成立没多久,Vercept已经攒了差不多5000万美元的融资了,他们的Vy桌面应用在开发者圈子里也挺有名。这次收购完了,Vercept准备把现有的服务慢慢关掉,让用户都搬到Claude那边去。联合创始人卢卡·韦斯说他们看重Anthropic在底层模型研发上的本事,觉得两家的技术一结合,以后的人机交互方式肯定要大变样。 除了Anthropic这边收购不断之外,OpenAI也在忙着抢人来布局个人AI Agent领域。今年2月中旬的时候,OpenClaw的创始人彼得·斯坦伯格宣布加入了OpenAI团队,负责做下一代的个人助手项目。跟Anthropic直接买公司不一样,OpenAI把这个项目弄到了一个独立的开源基金会里面去运营了,用MIT协议保证社区自己能管自己,还给出资金和模型方面的支持。这种“轻资产”的玩法就是为了跟Anthropic在企业级市场上拼一下。Anthropic的创始人达里奥·阿莫迪在最近的访谈里说过,AI最终的样子应该是能全面控制计算机的闭环系统。这系统得能看懂屏幕、明白上下文、还能跨平台一起干活才行。他觉得现在的大问题不在模型智商多高上,而是交互太不可靠了。阿莫迪觉得未来三年只要把长上下文管理跟计算机视觉结合好,很多需要“边干边学”的岗位需求就能解决了,这很可能会引发劳动力市场的大变动。