Synth Daily

Gemini 现可在安卓设备上自动完成多步任务

谷歌 Gemini AI 在安卓系统上推出更新,核心功能是让 AI 能够自动处理多步骤任务,例如订餐或叫车。此次更新还扩展了电话诈骗检测功能,并升级了“圈选搜索”功能,使其可以识别屏幕上的所有项目。目前,这些新功能仍处于测试阶段,仅在部分设备、地区和应用中提供。

AI 自动化处理复杂任务

Gemini 现在可以将用户的待办事项清单转化为实际操作。这意味着 AI 可以自主完成过去需要用户手动分步完成的任务。

  • 核心功能: 允许 Gemini 跨应用处理需要多个步骤的复杂指令
  • 应用场景: 目前主要支持食品、生鲜杂货和共享出行(如 Uber)类应用。
  • 限制条件: 这项功能目前仍处于测试阶段,且有严格的限制。
    • 支持设备: 仅限于 Pixel 10、Pixel 10 Pro 和三星 Galaxy S26 系列等特定手机。
    • 可用地区: 初期仅在美国和韩国推出。

安全措施与用户控制

考虑到 AI 自动化可能出错,谷歌设置了多项保护措施,确保用户始终拥有控制权。

  • 明确指令: 自动化任务不能自行启动,必须由用户发出明确指令。
  • 实时监控: 用户可以实时观察任务的执行进度,并可以随时手动停止
  • 安全环境: 所有自动化操作都在一个安全的虚拟窗口中运行,该环境只能访问限定的应用,无法触及手机上的其他私人数据。

使用 AI 来自动化处理个人生活中的任务,正在成为一种日益增长的趋势。除了谷歌,ChatGPT 等工具也在提供类似的功能,帮助用户管理日程、发送邮件或创建演示文稿。

其他实用功能更新

除了任务自动化,此次更新还包括另外两项重要改进。

  • 电话诈骗检测扩展:

    • 此功能之前已在 Pixel 手机上提供,现在扩展到美国的三星 Galaxy S26 系列设备。
    • Gemini 的设备端模型也被用来在短信中检测诈骗信息
  • “圈选搜索”功能升级:

    • 之前的“圈选搜索”一次只能识别一个对象。
    • 更新后,该功能可以一次性搜索屏幕上看到的所有项目。例如,用户可以圈出图片中的一套服装,系统会分别识别并搜索上衣、裤子和所有配饰。