Synth Daily

我们体验了谷歌的 AI 眼镜,离成功只差临门一脚。

谷歌正在开发一款AI智能眼镜,它分为今年秋季先上市的纯音频版和稍后推出的带显示屏的增强版。这款眼镜的核心是集成了Gemini AI,可以实现实时翻译、导航、拍照和物体识别等功能。尽管目前仍是原型阶段,但其增强版能在用户视野中叠加信息,与Warby Parker、三星等品牌合作设计,旨在提供一种无需掏出手机的便捷交互体验。

两种版本,不同体验

谷歌的AI眼镜计划分两步走。首先推出的是纯音频版,主要通过内置扬声器和麦克风与Gemini互动。随后将推出功能更全面的显示版,它在音频功能的基础上,增加了一个镜片内显示屏。

  • 纯音频版: 今年秋季开始发货,可以听音乐、打电话、拍照以及使用Gemini的语音功能。
  • 显示版: 目前仍是原型,能将天气、导航、翻译等信息叠加在现实世界之上。它同时支持iOS和安卓手机。

显示版眼镜:核心功能体验

我们体验的原型机主要用于测试显示技术及其对电池寿命的影响,外观和最终上市版本会有很大不同。

启动与交互

  • 启动Gemini: 长按右侧镜腿两秒,会听到启动音,表示Gemini正在聆听。
  • 控制音乐: 单次轻点镜腿中部可以暂停或播放音乐。
  • 原型机在启动Gemini时会同时开启摄像头,但未来用户可以自行设置。

功能实测

  • 音乐播放: 在嘈杂环境中,音量开到最大也难以听清细节。它无法替代高品质耳机,但适合在散步或做家务时随便听听。其优点在于,不像入耳式耳机那样隔绝环境音,可以轻松听到他人说话。

  • 拍照功能: 可以通过按键或直接命令Gemini拍照。你甚至可以发出类似“拍张照,然后把照片里的人变成动漫角色”这样的AI指令。在测试现场,由于网络拥堵,完成一张AI处理的照片大约需要45秒

  • 实时翻译:

    这是最出色的演示之一。当演示者快速说西班牙语时,眼镜能自动检测语言,并在显示屏上显示英文文本,同时通过扬声器播放英文翻译。单凭这一功能,就可能吸引很多跨国旅行者购买。

  • 导航指引: 用户可以通过Gemini语音设置导航目的地,眼镜会在视野中显示转弯提示。当你需要确认位置时,低头看地面就会出现一个带有蓝色圆点的地图,抬头后地图消失,不影响正常走路。

  • 物体识别: 表现好坏参半。

    • 识别一幅莫奈的复制画时遇到困难,经过几次提问和靠近观察才成功。
    • 识别架子上的植物或书中的食谱则非常流畅。
    • 这些功能目前用手机上的Google Lens也能实现,眼镜的优势在于无需掏出手机

设计与硬件

目前展示的眼镜仍是非常初期的原型,目的是为了自由地试验显示技术,而非最终形态。

  • 合作伙伴: 谷歌与 Warby ParkerGentle Monster三星 合作,将技术融入时尚设计。
  • 显示方式: 测试原型只有一个右眼显示屏,但该平台支持单眼、双眼显示以及纯音频模式。
  • 佩戴体验: 测试者在体验时感到右眼有些疲劳,但这可能与个人视力情况有关。

谷歌表示,今年晚些时候将公布更多关于Android XR显示眼镜的进展,并扩大其测试者计划。在此之前,谷歌认为纯音频版眼镜已能满足部分用户的需求。