Synth Daily

苹果发布围绕 Google Gemini 模型构建的新 AI 架构

苹果公司宣布对其 Apple Intelligence 平台进行重大调整,采用了与谷歌合作开发的新架构。该架构基于 Google Gemini 模型技术,通过结合设备端处理和“私有云计算”(Private Cloud Compute),显著提升了图像、语音和自然语言处理能力。新系统还引入了一个“系统编排器”来协调不同应用和任务的响应,同时苹果再次强调 隐私是核心,用户数据仅用于即时请求,不会被存储或访问。

与谷歌的深度合作

苹果公司透露,其新的 Apple Foundation Models 是与谷歌深度合作开发的成果。这一合作被形容为一次“巨大的升级”,为 Apple Intelligence 带来了顶尖的理解和推理能力。

  • 新模型同时支持在 设备端 和通过 Private Cloud Compute 基础设施在服务器上运行。
  • 核心技术源于谷歌的 Gemini 系列模型。
  • 此次合作旨在实现包括图像理解与生成在内的多模态支持。

增强的 AI 功能

升级后的模型带来了一系列新的实用功能,显著增强了用户的创作和交互体验。

  • 图像处理: 支持创建逼真的图像和进行高级照片编辑。
  • 视觉问答: 能够理解图像内容并回答相关问题。
  • 语音与语言: 提升了语音生成、听写准确性和自然语言理解能力。

苹果提到,部分高端设备将获得一个功能更强大的模型版本,但未具体说明是哪些设备。

全新的系统编排器

新架构的核心是一个 系统编排器(system orchestrator),它负责在苹果的各个平台之间安全地协调 Apple Intelligence 的功能。

它的作用是根据用户正在使用的应用程序和当前任务来调整系统的响应,从而实现苹果所说的“真正的全系统智能”。

以隐私为核心的设计

苹果借此机会强调其对用户隐私的重视,并将其与那些“不顾用户、盲目冒进”的竞争对手进行对比。

  • 系统优先依赖 设备端处理Private Cloud Compute
  • 苹果承诺,用户数据 仅用于执行即时请求,苹果或任何第三方都无法访问。
  • 为了增加透明度,苹果表示 外部专家可以随时验证其隐私保障措施