谷歌推进Gemini屏幕自动化功能 AI助手将可代理用户完成手机操作

技术革新与风险并存谷歌最新测试的屏幕自动化技术，显示人机交互正迈入新阶段。该功能通过解析用户界面元素来执行自动化操作，内部代号为“倭黑猩猩”的项目已集成至谷歌应用17.4测试版。技术文档显示，系统能够识别应用界面中的按钮、文本框等组件，并模拟人的操作流程完成预定任务。安全机制尚待完善测试版中频繁出现的风险提示引发外界关注。开发团队在代码中加入多重警告，强调“可能发生操作失误”以及“责任由用户承担”等条款。这种谨慎并非多余，源于自动化技术的固有限制——现阶段算法仍难以稳定应对界面元素的动态变化，以及运行中可能出现的异常情况。更，功能说明明确标注不得用于处理紧急事务，折射出技术成熟度与真实场景需求之间仍有距离。隐私保护采取双轨制在数据安全上，谷歌设计了不同于常规流程的处理路径：当用户启用活动记录时，系统截图将交由人工审核团队处理，而非沿用常见的AI训练数据脱敏机制。但隐私条款同时规定，用户不得在自动化会话中输入任何认证信息。这种“允许截图留存、却禁止输入凭证”的并列要求，也暴露出自动化在安全边界上仍存在不确定性。行业影响深远从技术演进角度看，该功能基于Android 16 QPR3底层架构开发，意味着操作系统正从“被动响应”向“主动服务”迈进。业内专家指出——若此类技术走向成熟——移动应用生态可能被重塑：简单、重复的操作将逐步由系统接管，应用开发者也需要相应调整交互设计。但在现阶段，过度依赖自动化也可能带来副作用，例如用户对流程的理解和手动操作能力下降。发展前景审慎乐观谷歌同步测试的“芥末”虚拟形象功能，暗示未来或将形成“自动化操作+虚拟交互”的组合服务模式。不过，要实现真正可靠的屏幕自动化，仍需在界面动态识别、操作逻辑验证等关键环节取得突破。市场分析认为，该技术至少还需要3-5年的迭代，才可能达到可商用的可靠性标准。

从“能做”到“放心用”——智能助手迈入代办时代——考验的不只是技术能力，也包括规则与治理是否到位。要把便利转化为可持续的用户价值，关键在于提前识别风险、明确边界、并把关键控制权交还给用户。只有在透明、可控、可追责的框架下推进创新，移动端自动化能力才能在提升效率的同时守住安全与隐私底线。