Synth Daily
特斯拉如何训练擎天柱机器人:工人的模仿与挑战
·
特斯拉正在通过一个特殊的数据采集团队来训练其人形机器人“擎天柱”(Optimus)。在玻璃墙实验室里,工人们每天花费数小时重复模仿人类的日常动作,如擦桌子、跳舞、下蹲等,而他们佩戴的摄像头则负责捕捉这些行为数据。这项工作不仅对体力要求极高,而且过程极其细致,甚至有些荒诞,已导致部分员工受伤。埃隆·马斯克将擎天柱视为特斯拉未来的核心,期望它能替代人类从事工厂、家务乃至护理等工作。然而,尽管公开演示令人印象深刻,现实中的机器人仍处于反复试验阶段,常常在执行简单任务时失败,距离实现真正的自主智能还有很长的路要走。
要点
- 1人类模仿训练:特斯拉雇佣“数据采集员”通过反复表演日常动作来为 Optimus 机器人提供学习数据,这些动作从擦桌子到跳舞无所不包。
- 2高强度工作:这项工作对体力消耗巨大且要求一丝不苟,工人需佩戴重型设备,已有人因此出现背部和颈部损伤。
- 3现实与演示的差距:公开演示中机器人表现流畅,但内部人士透露,它在训练中经常摔倒,通常需要支撑装置,这些演示更像是为投资者准备的“戏剧表演”。
- 4宏大愿景:马斯克预测 Optimus 将成为有史以来最重要的产品,最终可能占公司价值的80%,目标是取代人类劳动。
为了让机器人学会“做人”,特斯拉采取了最直接也最辛苦的方式——真人模仿。但这背后,不同角色的看法和期望却形成了鲜明对比。
视角
特斯拉工人
这份工作对身心都是巨大的考验,感觉自己就像“显微镜下的实验鼠”。任务重复、枯燥,有时还很荒谬,而且公司对动作的标准要求极为严格。
埃隆·马斯克
Optimus 潜力无限,将是“有史以来最伟大的产品”,它看起来会像一个穿着机器人套装的人,而非一个机器人。他预计公司最终每年将生产100万台。
机器人专家
公开演示的通常是最佳表现,像表演功夫这样的动作并不代表机器人具备认知能力,它只是在对环境做出反应。在受控环境中,保持平衡本应是基础能力。
训练方法与挑战
训练 Optimus 的方法在不断演变。最初,工人们穿着动作捕捉服进行远程操控(teleoperation),直接控制机器人。但这种方式常常导致工人因虚拟现实画面质量差和机器人摔倒而产生严重的动态眩晕。后来,公司转向了更易于扩展的方案:仅使用摄像头采集数据。工人佩戴装有多个摄像头的头盔和重达30-40磅的背包,记录下每一个动作。有时,他们还会戴上触觉手套来捕捉手部的精细活动。
一名员工将这种体验形容为“基本上整天都在做有氧运动”,另一人则表示,不平衡的背包让他感觉像在“跛行走路”,并因此导致背部受伤。
现实与愿景的差距
尽管马斯克描绘了一幅机器人无处不在、无所不能的未来图景,但现实却骨感得多。据员工透露,在执行需要弯腰或倾斜的动作时,机器人有一半的时间会摔倒,有时还会损坏昂贵的设备。因此,除非需要移动几英尺以上,它通常都被固定在一个支撑装置上以防摔倒。投资者参观时看到的流畅演示,大多是工人在幕后通过远程操控实现的,一名前员工将其称为“一场大秀”或“戏剧”。
一位人工智能专家指出:“当你看到它表演功夫时,看起来好像在做一些智能的事情,这会让人对其能力产生过高推断,但事实并非如此。它背后没有认知思想。”
Q&A
Q: 训练 Optimus 的工作具体是怎样的?
A: 工人(数据采集员)需要在8小时的轮班中,数百次地重复简单的日常动作,如擦桌子、蹲下、跳舞等。他们佩戴装有摄像头的头盔和重型背包来采集数据。这项工作对体力和精神要求都很高,且必须一丝不苟地遵循指导手册。
Q: Optimus 机器人目前的能力到底如何?
A: 尽管在公开演示中,Optimus 能表演功夫、分发糖果,但实际情况是它仍处于反复试验阶段。在训练中,执行弯腰或倾斜等动作时,它有一半的时间会摔倒,通常需要一个支撑装置来保持直立。专家指出,这些演示并不代表它具备真正的认知能力。
你知道吗?
为了让机器人学习更多样的动作,工人们有时会收到由AI生成的、看似随机的指令。这些任务包括跳“小鸡舞”、模仿大猩猩、假装打高尔夫,甚至是在几秒钟内完成疾跑或特维克舞(twerking)。
来源
 | 特斯拉玻璃实验室内,工人们训练Optimus机器人模仿人类行为 |