微软正将此前为付费用户或特定设备保留的语音、视觉和自动化等高级 Copilot AI 功能,全面推广至所有 Windows 11 电脑。此举旨在将 AI 助手打造为继鼠标和键盘之后的“第三种输入机制”,通过语音交互、屏幕内容识别和自动化操作来改变用户与 PC 的互动方式。配合 Windows 10 支持的终止,微软希望以此推动用户升级并广泛采纳这些新的 AI 功能。
AI 功能的全面普及
过去,微软最强大的 AI 工具主要面向付费用户。现在,一系列高级 Copilot 功能将登陆所有 Windows 11 电脑,这标志着一个重要的战略转变。
- 时机选择: 此次更新恰逢 Windows 10 支持结束,微软希望借此机会吸引大量升级到 Windows 11 的用户,让他们一上手就能体验到先进的 AI 功能。
- 核心目标: 让尽可能多的用户接触并信服 Copilot 的价值,从而改变用户习惯。
核心:将语音作为第三种输入方式
微软希望你开始和你的电脑“对话”。通过“Hey, Copilot”这个唤醒词,语音交互功能将被全面引入 Windows 11 系统。
“距离 PC 上次改变交互方式(主要是鼠标和键盘)已经过去了近四十年。但如果你可以超越这些,直接与它对话呢?在我们看来,语音将成为你使用 PC 的第三种输入机制。”
微软的这一决策基于其观察数据:
- 用户在使用语音输入时,与 Copilot 的互动频率是打字时的两倍。
- 微软的目标不是取代鼠标和键盘,而是让语音成为一种“附加的”、更便捷的交互选择。
“看见”你的屏幕并为你操作:Copilot 视觉与行动
为了让 AI 更好地理解你的意图,微软推出了 Copilot Vision(视觉)和 Copilot Actions(行动)功能,它们将协同工作,提供更智能的帮助。
Copilot Vision:让 AI 看懂你的屏幕
Copilot Vision 允许 AI “看到”你的屏幕内容,并基于此提供上下文相关的帮助。这项功能此前是 Copilot+ PC 独占,现在将普及到所有 Windows 11 电脑,即使没有 NPU(神经处理单元)也能使用。
- 主要用途: 在复杂的软件中提供操作指引。例如,当你问“如何做某件事”时,它能直接为你指出菜单或选项的位置。
- 游戏辅助: 在游戏中,它可以为玩家提供任务指引或攻略提示。
- 减少重复说明: 它就像一个懂行的朋友站在你旁边,你无需过多描述,AI 就能理解你的处境。
Copilot Actions:让 AI 为你代劳
如果说 Copilot Vision 是“告诉你怎么做”,那么 Copilot Actions 就是“直接帮你做”。这是一个 AI 代理功能,可以根据你的自然语言指令,在本地应用或操作系统中执行任务。
- 自动化操作: 你可以让它在 Adobe Photoshop 中为你调整某个设置,或者对一整个文件夹的照片执行相同的编辑。
- 信息处理: 它可以从一个大型 PDF 文件中为你提取关键信息。
- 连接应用 (Connectors): 一项名为 Connectors 的新功能(目前提供给 Windows Insiders 测试)允许 Copilot 直接在你本地的 PC 上操作文件或应用。例如,你可以让它:
- 从 OneDrive 中打开文件。
- 查找特定邮件。
- 甚至直接创建一个 PowerPoint 演示文稿。
- 未来还将支持 Google Calendar 或 Gmail 等第三方应用。
虽然这些功能与备受争议的 Recall 有些相似,但微软表示它们将共存。Copilot Actions 将在未来几个月内广泛推出,届时用户不仅可以用语音,也可以用文本来下达指令。微软的雄心似乎是让 Copilot 逐渐成为 Windows 的主要交互界面,但这能否真正改变用户的固有习惯,还有待观察。