Synth Daily

Mercor 的流星式崛起内幕

数据标注初创公司 Mercor 通过聘请医生、工程师和律师等专业人士对大型语言模型进行高质量的专家评估,迅速成长为 AI 领域的重要参与者。这种独特的模式为其带来了与 OpenAI 等顶尖公司的合作,使其估值飙升至 100 亿美元。尽管短期增长迅猛,但行业专家对其长期发展持谨慎态度,主要担忧在于专业人才的供应以及 AI 自身能力的快速提升可能最终削弱其业务模式。

以专家评估定义 AI 竞赛

在构建超级智能 AI 的竞赛中,高质量数据至关重要。Mercor 的核心业务是提供 AI 评估("evals"),这是一种结构化的评估方法,用于衡量模型在特定领域的表现。

与依赖低薪工人标记数据的传统方法不同,Mercor 聘请专业人士来判断模型输出的质量和准确性。

  • 医生、工程师、律师等专业人士会评估与其领域相关的模型输出。
  • 例如,一名软件工程师可能会评估代码是否存在安全漏洞,然后设计一个评分标准,用于衡量模型的改进。
  • 这些评分标准成为机器学习工程师用来给模型响应打分、标记失败并定义“好答案”的指南。

简单来说,这些评估构成了 AI 公司引导其模型产出期望结果的基线。

“我们正处于 AI 评估的时代。” — Brendan Foody, Mercor 联合创始人兼 CEO

Mercor 的崛起之路

Mercor 由三位大学辍学生于 2023 年 1 月创立,最初是一个 AI 人才市场。在与 OpenAI 和 xAI 等公司会面后,他们迅速转向专家驱动的评估,坚信人类的专业知识将是解锁下一波 AI 性能的关键。

这一策略取得了巨大成功,公司迅速扩张:

  • 主要客户: 与 OpenAI、Anthropic 以及包括 Alphabet 和亚马逊在内的六家“科技七巨头”签订了合同。
  • 收入飙升: 在 17 个月内,年收入从 100 万美元增至 5 亿美元
  • 专家网络: 雇佣了超过 30,000 名专家,平均时薪为 95 美元。
  • 惊人估值: 最新估值达到 100 亿美元,获得了 Felicis、Benchmark 和 General Catalyst 的投资。

Mercor 对质量有着严格的要求。一名匿名合同工透露:“[Mercor] 的标准非常高,如果提交的作品质量不达标,他们会很快解雇人。” 这种对高标准的坚持,帮助其在 AI 生态系统中建立了“基石般的基础设施”的声誉。

“他(Brendan Foody)是远见卓识者和执行者的罕见结合。” — Sundeep Peechu, Felicis 管理合伙人

长期增长的疑问

尽管分析师们普遍认为 Mercor 的业务在短期内会持续增长,但对其长期前景存在一些质疑。主要担忧集中在以下几个方面:

  • 人才质量与动机: 市场研究公司创始人 John Bersin 怀疑,真正顶尖的专家是否“有时间或动力花几天时间来标注数据”。他认为,这些所谓的专家更可能只是帮助系统变得更聪明的普通合同工。

  • 人才库枯竭: ESO 基金的联合创始人 Scott Chou 担心公司可能最终会耗尽合格的人才。他认为 Mercor 的模式与之前的 Scale AI 相似,并表示:“他们在这样一个领域运营,长期维持增长将非常困难。”

  • AI 发展的双重风险: 增长咨询公司 Simon-Kucher 的合伙人 Edward Hartman 指出,无论 AI 发展快慢,Mercor 都面临风险。

    • 如果 AI 发展得太快,可能会出现大量被取代的专业人士,从而削弱 Mercor 的价值。
    • 如果 AI 发展得不够快,对人类监督的需求本身可能会消失。

Mercor 的回应与展望

针对这些担忧,Mercor 的发言人回应称,没有迹象表明人才库正在萎缩,并且 AI 正在创造新的工作和技能。他们坚信,在塑造机器智能方面,人类的判断力仍然扮演着至关重要的角色,距离 AI 达到顶峰能力还有很长的路要走。

“我知道一些大型实验室的高管说我们将在三年内拥有超级智能……但我认为事实是,这是一条更长的路。” — Brendan Foody, Mercor 联合创始人兼 CEO