Synth Daily

谷歌对话式照片编辑器:终于有个AI功能大家真想用

尽管许多智能手机的 AI 功能华而不实,但谷歌照片中新增的“Ask Photos”对话式编辑功能却是一个例外。它允许用户通过简单的语音或文字指令来编辑照片,极大地简化了复杂的编辑流程。这项功能不仅让高级编辑技术(如移除物体或生成图像)变得触手可及,还通过内容凭证等技术手段来应对潜在的滥用风险,被认为是首批真正能让普通用户受益的实用 AI 应用之一

智能手机 AI 功能的普遍困境

近年来,苹果和谷歌等公司在其智能手机中集成了大量 AI 功能,例如实时翻译、文本摘要和图像生成。然而,作为一名专业的评测者,我发现其中很少有功能能够真正简化日常生活,成为我父母辈也能轻松使用的实用工具。

“AI 的目标不就是让事情变得更容易吗?”

“Ask Photos”:一个真正实用的 AI

谷歌在 Google Photos 中推出的“Ask Photos”对话式编辑功能改变了这一现状。它允许用户通过输入或说出指令来完成照片编辑,无需再摸索复杂的菜单和滑块。

  • 降低使用门槛: 大多数人并不了解手机软件的强大功能。通过自然语言交互,用户可以轻松使用所有可用的编辑工具。
  • 提升用户认知: 这种近乎无摩擦的体验不仅能快速提供理想效果,还有助于用户更好地理解自己智能手机的潜力。
  • 明确的引导: 与许多 AI 应用的空白输入框不同,该功能在用户点击“编辑”后直接弹出,上下文清晰,极大地降低了使用难度。正如卡内基梅隆大学的克里斯·哈里森所说:“人类的懒惰总是会赢。”

democratizing 强大的编辑工具

长久以来,使用语音控制电脑完成任务一直是人们的设想。早在 12 年前,一个展示类似技术的视频下就有这样的评论:

“为什么要这么多恨意?它不是为‘真正的’摄影师准备的,但对于我那个偶尔用 Photoshop 的爸爸来说,这太棒了。”

过去,像 Photoshop 这样的专业软件不仅价格昂贵,还需要一定的学习成本。而“Ask Photos”让强大的编辑功能变得简单且触手可及。

  • 超越基础编辑: 除了调整光线、裁剪或移除背景杂物,你还可以让它执行更复杂的操作,比如“在帝国大厦上添加一只攀爬的金刚”或从照片中移除人物。
  • 应对滥用风险: 强大的功能也带来了被用于传播虚假信息的风险。对此,谷歌采取了措施:
    • 使用 C2PA 内容凭证IPTC 元数据来标记 AI 编辑痕迹。
    • 通过 SynthID 技术为图像添加水印,以便追踪文件来源。

实际体验与局限性

在手机上编辑照片通常不是一件愉快的事,需要频繁滑动和精确调整。谷歌的对话式编辑则让用户掌握主导权。

你可以直接告诉它“让照片看起来更好”、“修复光线”或“移除反光”,它便能自动调整裁剪、光影甚至添加人像虚化效果。我曾让它“修复”一张我婴儿时期的老照片,它在几秒钟内就完成了图像清理、色彩增强和对比度提升,而这通常需要我花费数分钟才能完成。

当然,这个工具并不完美:

  • 无法执行某些操作,例如在画面中移动主体。
  • 编辑效果会统一应用于整张图片,无法像 Lightroom 或 Photoshop 那样对局部进行精确调整。

从工具到伙伴的转变

尽管存在局限,但“Ask Photos”所展示的能力预示着我们与计算机交互方式的下一次飞跃。

“计算机科学家在过去半个世纪里一直在思考:从‘计算机作为工具’到‘计算机作为伙伴’的转变何时会发生?这确实是我们思考计算方式的一个根本性转变。”

这项功能不仅仅是一个更强大的滤镜或更方便的工具,它代表了一种新的交互模式,让技术真正成为我们普通人生活中的得力伙伴。