Synth Daily

让路吧,聊天机器人:AI仿生人来了

这篇内容探讨了 OpenAI 在人形机器人领域的最新动向,认为这是实现通用人工智能(AGI)的关键一步。尽管人形机器人曾因笨拙而闻名,但机器学习和硬件的进步正在迅速改变这一现状,吸引了众多科技公司的投入。文章指出,虽然这些机器人有望在工厂和物流等结构化环境中取代人类从事重复性或危险性工作,但要让它们成为可靠的家庭助理,在复杂的非结构化世界中运行,仍然面临着巨大的技术挑战。

为什么是人形机器人?

人形机器人,即外形和结构模仿人类的机器人,其核心优势在于它们被设计用来在我们为人类设计的世界中运作。

  • 适应人类环境: 它们可以上楼梯、使用为人类设计的工具和进入车辆,无需对现有环境进行大规模改造。
  • 物理智能的体现: 许多专家认为,真正的通用智能不仅限于语言或计算,还必须包括与物理世界互动的能力。正如 ChatGPT 无法为你冲泡一杯咖啡,物理智能是当前 AI 发展需要突破的下一个前沿。

“当你试图构建具有类人智能的东西时,一个重要元素就是能够在现实世界中做事。”

OpenAI 的回归与竞争格局

OpenAI 在 2021 年曾一度关闭其机器人部门,但现在正通过积极招聘相关研究人员,重新加大投入。这一举动反映出,在大型语言模型之后,行业正在寻找 AI 发展的下一个突破口。

然而,OpenAI 并非独自前行,它面临着激烈的竞争:

  • 特斯拉 (Tesla): 凭借其在自动驾驶汽车和制造业中积累的物理世界 AI 经验,被视为一个强大的竞争者。
  • Figure AI: 一家备受瞩目的初创公司,其发布的机器人演示视频(如制作咖啡)引发了广泛关注。
  • Agility Robotics: 亚马逊已投资并正在其部分设施中测试该公司的机器人。
  • Boston Dynamics: 机器人领域的先驱,其人形机器人 Atlas 即将在现代汽车的工厂中进行商业化应用测试。
  • Unitree: 一家中国公司,正在成为低成本人形机器人的主要制造商。

炒作与现实的差距

尽管行业领袖们描绘了一幅科幻般的未来图景,声称我们很快就会在街上看到机器人,但现实远比演示视频复杂。

“在很多演示中,机器人可能是在被远程操控,或者它的成功率可能只有百分之一。这就是目前的现实。”

将这些机器人部署到家庭等 完全非结构化的环境 中,其难度堪比自动驾驶汽车。后者经过二十多年的发展,至今仍只能在有限的道路和条件下运行。让一个机器人可靠地在你从未见过的厨房里找到狗粮并喂狗,是一项巨大的挑战。

近期应用与长远挑战

短期内,人形机器人最有可能在高度结构化的环境中找到用武之地,例如工厂和仓库。它们可以替代人类从事 危险、重复或体力要求高 的工作,如搬运箱子或在生产线上执行特定任务。

然而,要实现更广泛的应用,仍需克服几大核心挑战:

  • 可靠性与安全性: 语言模型的“幻觉”如果发生在物理机器人身上,后果可能非常严重。确保机器人在任何情况下都能安全、可靠地运行是首要难题。
  • 数据瓶颈: 与大型语言模型可以利用整个互联网的文本数据不同,目前缺乏一个足够庞大的、关于人类在物理世界中所有行为的数据库来训练机器人。
  • 硬件限制: 现有的机器人硬件,尤其是 手部,在灵活性和精细操控能力上仍远不及人类。