OpenAI 正在全力投入音频人工智能,计划在一年后推出一款以音频为核心的个人设备。这一举动反映了整个科技行业从依赖屏幕转向以声音作为主要交互界面的大趋势。无论是科技巨头还是初创公司,都在探索通过智能眼镜、车载助手或 AI 戒指等设备,让语音成为连接人与技术的未来。
科技巨头纷纷押注音频
屏幕正在退居次要位置,声音成为舞台中心。这不仅仅是 OpenAI 一家的想法,而是整个行业的共识。
- 智能音箱 已进入超过三分之一的美国家庭,让语音助手成为日常的一部分。
- Meta 为其雷朋智能眼镜推出了新功能,利用麦克风阵列帮助用户在嘈杂环境中听清对话。
- 谷歌 正在尝试将搜索结果转化为对话式摘要的“音频概览”。
- 特斯拉 则计划将 xAI 的聊天机器人 Grok 集成到汽车中,通过自然对话来控制导航和空调等功能。
无论是你的家、你的车,甚至你的脸,都正在成为一个控制界面。核心理念是相同的:音频是未来的交互界面。
OpenAI 的下一步计划
为了实现这一目标,OpenAI 在过去两个月整合了多个团队,全力升级其音频模型。
新模型预计在 2026 年初 发布,并将具备以下特点:
- 听起来更自然,更像真实的人类对话伙伴。
- 能够处理对话中的打断。
- 甚至可以在你说话的同时进行回应,这是当前模型无法做到的。
OpenAI 的最终设想是推出一系列智能设备,可能包括眼镜或无屏幕音箱。这些设备的目标不是成为冰冷的工具,而是更像 具有陪伴感 的伙伴。
初创公司的探索与警示
除了大公司,许多初创企业也看到了音频交互的未来,但他们的尝试结果好坏参半。
- Humane AI Pin:这款无屏幕可穿戴设备在烧掉数亿美元后,成了一个警示性的案例。
- Friend AI pendant:一款声称可以记录你生活并提供陪伴的项链,引发了关于隐私和存在意义的担忧。
- AI 戒指:至少有两家公司正在开发 AI 戒指,让用户真正实现“对手说话”。
尽管形式各不相同,但这些探索都指向同一个未来:一个由声音主导的、更自然的人机交互时代。