记者从海外科技媒体获悉,谷歌公司正其移动操作系统中测试一项突破性的人机交互技术。这项被称为"屏幕自动化"的功能,将使智能助手Gemini能够直接操控用户的安卓设备,代替用户完成多项日常操作任务。 根据谷歌应用17.4测试版本中发现的技术文档显示,该功能内部代号为"倭黑猩猩",其核心能力在于让智能助手通过屏幕自动化技术,在指定应用程序中执行下单购物、预约出行等复杂操作流程。这标志着移动智能助手从被动响应向主动执行的重大转变。 从技术实现路径来看,谷歌已在Android 16 QPR3版本中为该功能搭建了底层技术架构。与传统的语音指令或文字交互不同,屏幕自动化技术使智能助手能够理解应用界面结构,模拟人类操作逻辑,完成跨应用的复杂任务链条。这种技术突破意味着用户与移动设备的交互方式将发生根本性变革。 然而,技术进步的同时也伴随着新的挑战。谷歌在功能说明中明确提示,智能助手在执行任务过程中可能出现操作失误,用户需要对其代为执行的操作承担最终责任,因此必须对运行过程保持密切监督。此提示反映出当前智能技术在可靠性和准确性上仍存在局限。 隐私保护问题同样引发关注。根据谷歌披露的隐私政策,当智能助手与应用交互时,如果用户开启了活动记录保存功能,系统截取的屏幕画面将由专业审核人员进行核查,并用于优化涉及服务。谷歌特别强调,用户不应在对话界面输入登录凭证或支付信息,也应避免使用该功能处理紧急事务或涉及敏感信息的任务。 业内分析人士指出,这些限制条件的设置,既是对技术成熟度的客观评估,也是对用户权益的必要保护。在智能助手获得更大操作权限的背景下,如何平衡便利性与安全性,如何确保用户数据不被滥用,成为科技企业必须回答的重要课题。 从产业发展趋势观察,谷歌此举是全球科技巨头竞相布局智能终端深度整合的缩影。随着大语言模型技术的成熟,智能助手正从简单的信息查询工具,演变为能够理解复杂意图、执行多步骤任务的智能代理。这种转变不仅将重塑用户的数字生活方式,也将对移动互联网生态产生深远影响。 ,测试版本中还出现了代号为"芥末"的数字形象功能相关代码,显示谷歌正在探索将三维虚拟形象技术整合到智能助手系统中。这表明未来的人机交互可能不仅限于功能层面,还将延伸至情感化、拟人化的体验维度。
让助手"看屏幕、代操作",便利性提升的同时也放大了风险。越是接近真实交易与个人数据的环节,越需要把安全阀门装在前面,把规则说在明处,把选择权交给用户。只有在可靠、可控、可追溯的框架下,自动化能力才可能从新鲜功能变为普惠工具,真正服务于更高效、更安全的数字生活。