问题:从“能回答”到“能做事”,智能体落地仍存门槛 近年来,大模型在文本生成、检索问答等能力提升明显,但在真实工作流中仍面临“最后一公里”难题:大量业务动作发生在操作系统与各类软件界面之中。传统做法往往依赖开发者通过应用编程接口(API)进行集成——不仅成本高、适配周期长——而且不同软件、不同版本的接口能力差异较大。如何让智能体直接执行“打开文件—查找数据—填写表单—发送邮件”等连续操作,已成为产业关注焦点。 原因:产品化易用需求与生态扩展诉求并行,催生两条技术路线 Anthropic此次对ClaudeCode与ClaudeCowork升级,核心是赋予其“像人一样操作电脑”的能力:在缺少专门接口的情况下,通过识别界面元素并执行点击、滚动、输入等动作,完成端到端任务流程。公司同时推出Dispatch跨设备能力,打通手机与电脑的对话链路,用户可远程下达指令,由系统自动处理邮件整理、数据汇总、代码调试等事务。 同日,OpenClaw宣布架构与插件体系更新,推出ClawHub插件市场,并强调增强Windows侧安全机制、提升开发工具兼容性,明显指向“开放生态、可扩展集成”的路线。业内人士指出,一条路径侧重“即插即用、降低门槛”,另一条路径侧重“系统级能力、生态聚合”,分别对应个人与中小团队的效率需求,以及企业复杂场景对可控扩展的诉求。 影响:智能体从“辅助工具”走向“流程参与者”,同时放大安全与治理挑战 从应用层面看,直控电脑能力意味着智能体可以绕开接口限制,直接融入既有软件体系,潜在受益行业覆盖办公协作、客服运营、软件测试、数据整理与研发辅助等领域。对非技术用户而言,过去需要脚本或接口对接才能实现的自动化任务,有望通过自然语言指令直接启动,继续推动自动化普及。 但风险也随之上升:其一,直控操作往往涉及更高权限与更广数据范围,一旦误操作,可能引发误删文件、误发信息等连锁问题;其二,跨设备协同带来身份验证、会话劫持、数据泄露等新安全挑战;其三,模型在复杂任务中仍可能出现多次尝试、路径绕行等情况,带来额外时间成本与不确定性。Anthropic表示,研究预览阶段仅向macOS的Pro与Max订阅用户开放,新应用访问需经用户授权,并支持随时中断,以提高可控性。 对策:以“最小权限+可审计+人机协同”构建护栏,推动标准化治理 业内普遍认为,智能体进入“可执行”阶段后,安全策略需要从“内容安全”扩展到“行为安全”。一是落实最小权限原则,对文件、邮箱、浏览器、系统设置等高敏操作实行分级授权与动态提醒,关键步骤引入二次确认。二是强化可审计机制,记录指令来源、操作路径、数据读写范围与回滚点,便于追溯与处置。三是提升沙箱与隔离能力,在虚拟环境或受控容器中先行演练,降低对生产环境的直接影响。四是企业侧完善接入评估与员工培训,明确可用场景、禁用场景与责任边界,避免“以自动化替代管理”。 前景:路线分化或将长期并存,竞争焦点转向“可信执行力”与“生态聚合力” 展望未来,智能体发展可能形成“产品化直控”与“开放式插件生态”并行格局:前者强调快速上手与端到端体验,适合通用办公与个人效率场景;后者强调模块化扩展与行业适配,利于在企业系统与行业软件中实现更深集成。随着多设备协同、权限管理与审计标准逐步成熟,竞争焦点将从“会不会”转向“稳不稳、安不安全、能否规模化部署”。同时,监管与合规要求预计将更早介入“可执行系统”的边界界定,推动形成更清晰的责任框架与技术规范。
智能技术的每一次重要进展都在重塑人机协作的边界。此次升级不仅展示了智能体从“理解”走向“执行”的加速趋势,也将安全、治理与责任划分推到台前。在数字化转型持续推进的背景下,如何在提升效率与风险可控之间取得平衡,将成为行业下一阶段需要共同回答的问题。