AI 视频生成公司 Runway 最初由三位纽约大学的毕业生创立,旨在帮助普通人成为电影制作人。如今,该公司正将战略重心从视频工具转向构建“世界模型”——一种通过视频等多模态数据来理解现实世界运行规律的 AI。他们的目标是利用这种技术解决机器人、药物研发和气候建模等领域的难题。尽管这一方向被视为 AI 竞争的下一个前沿,但 Runway 也面临着来自谷歌、OpenAI 及其他初创公司的激烈竞争,在算力和资金的巨大压力下,其能否成功实现跨越仍是未知数。
从电影工具到世界模型
Runway 最初的使命是利用 AI 让每个人都成为电影人。公司凭借其视频生成模型(如 Gen-4.5)和 AI 工具迅速成名,这些工具被用于电影《瞬息全宇宙》等作品中,并与狮门影业等大型媒体公司达成合作。
随着技术的发展,公司的目标也随之演变:
- 初始使命: 使用 AI 帮助人人成为电影制作者。
- 演进: 在发布第一个视频生成模型后,使命升级为帮助人人成为 优秀的 电影制作者。
- 最终转向: 团队认识到,这些模型不仅能生成视频,还能理解世界如何运作。这促使他们将重心转向了更宏大的应用,如机器人、药物研发和气候建模。
押注“世界模型”
Runway 与许多竞争对手的核心区别在于,他们认为下一代 AI 智能将源于视频而非文本。
语言模型是从互联网、教科书和社交媒体中提炼现有的人类知识。但要超越这些,我们需要利用偏差更少的数据。
公司的联合创始人 Anastasis Germanidis 认为,直接在现实世界的观测数据上训练模型是 AI 的下一个前沿。这种模型被称为“世界模型”,它能模拟环境并预测其行为,而不是仅仅描述它。其最终目标是构建一个可用于实验的“宇宙数字孪生”,从而加速科学进程。
宏大愿景与现实挑战
Runway 的三位创始人背景各异,分别来自智利和希腊,拥有经济学、广告、神经科学和电影等不同领域的学习经历。他们相遇于纽约大学一个被称为“工程师的艺术学校”的研究生项目。
这种多元化的背景促使他们产生了宏大的技术愿景:
- 加速科学研究: 通过构建比人类更优秀的“AI 科学家”来加速我们对宇宙的理解。
- 多模态融合: 训练一个能同时处理文本、视频、声音和其他传感数据的单一模型。
- 终极目标: Germanidis 的个人“登月目标”是利用这项技术进行生物世界模型和抗衰老研究。
激烈的竞争格局
尽管 Runway 在 AI 视频领域是先行者,但在世界模型的赛道上,它面临着强大的对手和巨大的障碍。
主要竞争者:
- 谷歌: 拥有视频模型 Veo 和世界模型 Genie,是 Runway 最直接、最强大的威胁。
- OpenAI: 尽管其视频平台 Sora 曾因高昂的计算成本而受挫,但其资源和技术实力依然不容小觑。
- 其他初创公司: Luma AI 和 World Labs 等公司也在同一赛道上,并获得了大量融资。
核心挑战:
- 算力: 构建基础模型需要大规模、有保障的计算集群,而 Runway 是否拥有此类资源尚不明确。
- 资金: 尽管 Runway 已筹集数亿美元,但与谷歌的万亿市值和 OpenAI 的巨额融资相比,仍然相形见绌。
“局外人”的优势
Runway 的团队认为,他们非典型的“硅谷血统”可能是一种优势。由于没有深厚的硅谷背景和唾手可得的资金,他们从一开始就必须更加“野蛮生长”,更早地关注收入。
联合创始人 Cristóbal Valenzuela 将公司的理念比作智利诗人尼卡诺尔·帕拉的反叛精神,他认为诗歌属于人民,而非规则。
规则只是他们发明的。硅谷在这里,创业公司也在那里,为什么?那些都只是人造的规则。把它们全部抹掉,重新开始。
这种打破常规的文化,加上对市场的敏锐洞察,可能正是 Runway 在与巨头的竞争中赖以生存和发展的关键。