Synth Daily

AI 超级预言家来了

人工智能(AI)超级预测员正在崛起,其在预测市场、股市和未来事件方面的表现已接近甚至追平顶尖人类专家。尽管在正面竞争中,人类与AI目前仍处于僵持状态,但趋势表明AI可能在一年内全面超越人类。这种技术不仅能让普通人轻松获得高质量的概率判断,还可能成为未来的“观点层”,帮助个人和机构做出更理性的决策。同时,预测市场在AI时代仍将作为汇聚不同AI意见和提供标准答案的基础设施而存在。

AI 超级预测员的崛起

近期的趋势表明,AI在预测领域的表现正以惊人的速度提升。一些AI超级预测领域的初创公司声称,他们的AI已经取得了巨大成功:

  • 一家公司宣称其AI在七个月内将 35美元 变成了 200万美元
  • 另一家公司则表示,他们通过一个市场中性的投资组合,跑赢了股市 25%

这些说法并非空穴来风。长期以来,趋势预测者一直认为AI将在2026-2027年间超越最优秀的人类预测员。如今,AI在预测市场和股市上创造巨额利润,正是这一时刻到来的迹象。

什么是AI超级预测员?

AI超级预测员通常是基于像ChatGPT或Claude这样的前沿模型,并通过一个特殊的程序(称为“脚手架”)进行改造,以擅长预测。这个程序会引导AI完成一个漫长的研究过程,包括使用各种提示、工具和建议。

FutureSearch 公司的AI为例,当被问及“到2040年,普通感冒的发病率减半的可能性”时,该AI在五分钟内完成了以下工作:

  • 部署了 3个子代理 进行协同研究。
  • 浏览了 16个网站 获取信息。
  • 深入研究了空气净化技术等具体细节。

最终,它给出的概率是 7%,并提供了详细的理由:

  1. 生物学难题:感冒病毒种类繁多(超过200种),疫苗研发50年来一直失败。即使在新冠封锁期间,鼻病毒的发病率也仅略有下降并迅速反弹。
  2. 时间表紧张:新疗法的商业化、临床试验和FDA批准需要大量时间,而相关项目的资金可能远不足以支撑如此大规模的部署。
  3. 采纳率未知:对于轻微疾病,人们长期使用鼻喷雾剂等预防措施的依从性预计会很低。空气净化设施的改造也面临高昂成本和效果不确定的问题。
  4. 衡量困难:美国缺乏常规的感冒监测系统,使得验证“发病率减半”这一目标变得极其困难。

另一家公司 Preseen 的AI对同一问题的预测是 8.8%,与FutureSearch的结果非常接近。而一位人类超级预测员给出的判断是 5-10%,再次印证了AI预测的合理性。

人机对决:谁更胜一筹?

要客观衡量预测能力非常困难,只能通过相互比较来判断优劣。预测网站Metaculus的数据显示,基础的AI模型(如GPT和Claude)正在迅速接近“大众智慧”的水平,但仍落后于顶尖的人类专家。

然而,专门为预测而优化的“脚手架”AI,其能力要比基础模型领先约 9个月。考虑到这一点,顶尖AI与顶尖人类专家的差距正在迅速缩小。

在被誉为“预测界世界杯”的 Metaculus杯 竞赛中,结果更加直观:

  • 在最近的比赛中,人类选手占据了前两名,但Preseen的AI位列第三。考虑到运气因素,可以说人类与AI目前处于 统计上的僵持状态
  • 在金融领域的专项比赛中,Preseen的AI则击败了所有人类选手,夺得第一。

这种局面让人联想到工业革命时期的传奇人物约翰·亨利。他挑战蒸汽钻机并以微弱优势获胜,但随后力竭而亡,象征着人类在体力劳动上霸主地位的终结。今天的人类顶尖预测员或许正扮演着同样的角色。

综合来看,目前顶尖人类和顶尖AI的预测能力不相上下,但AI在 金融等数据密集型领域 可能略有优势,而人类在其他领域则稍占上风。

AI预测的现实意义

即使AI的能力不再提升,它也已经带来了巨大的价值,核心在于 可及性。过去,获取超级预测员的判断成本高昂、耗时漫长,只有少数机构能在极重要的问题上使用。而现在,任何人都可以像使用普通聊天机器人一样,在几分钟内获得高质量的预测。

AI预测员还具备其他优势:

  • 更易被接受:人们通常认为AI天生就擅长处理概率和数据,这减少了对其精确预测的质疑。
  • 标准化产品:像“Preseen的AI”这样的品牌更容易建立声誉和信任,便于广泛引用。
  • 非对抗性:与可能利用规则漏洞的预测市场不同,你可以直接向AI提出你的真实意图,而不必担心被算计。

当AI远超人类

按照目前的趋势,AI的预测能力可能在一年内就远超最优秀的人类。如果这一趋势成真,将产生深远影响:

  • 金融业变革:人类股票分析师可能被淘汰,个人在预测市场中几乎没有盈利空间,市场将成为AI之间相互博弈的场所。
  • 企业与政府决策:明智的企业在启动新项目前会咨询AI的预测。政府,尤其是国防部门,也可能将AI预测纳入决策参考。
  • 公共政策的希望:最理想的情况是,公众和政治家能利用AI预测来制定更明智的政策。但这面临一个挑战:人们往往会忽略与自己观点相悖的专家意见,即使这个专家是AI。

AI超级预测:未来的“观点层”

目前的AI被要求保持中立,不能提供个人观点。但这限制了我们利用这些“更聪明大脑”来思考复杂问题的潜力。

超级预测提供了一个解决方案:它可以成为AI的 “观点层”。它介于事实与观点之间,其有效性可以通过预测准确率来客观衡量。

未来,当你询问AI应该如何抉择时,它不会直接给你答案,而是提供基于概率的分析。例如:

“AI,我应该嫁给这个人吗?”

它可能会回答:“根据你提供的信息,如果你们结婚,五年内离婚的概率是 85%。”

这是让AI在不强加价值观的前提下,为我们的生活提供真正有价值意见的最有效方式。

预测市场的未来

在AI时代,个人参与预测市场将变得毫无胜算。然而,预测市场本身作为一种 认知基础设施 仍然至关重要。

  • 成为最终裁判:当不同的AI给出不同预测时,预测市场将成为检验哪个AI更准确的最终平台。
  • 汇集AI共识:你可以直接采用市场的总体预测,因为它已经高效地聚合了所有AI的“意见”。
  • 扩大应用范围:由于AI大大降低了预测成本,未来可以有海量的AI代理对无数问题进行投注,从而让市场覆盖更广泛的议题。

最终,对于基本问题,你的标准AI助手就能提供超越任何人类的概率判断。而对于更具争议性的问题,新一代的预测市场将负责整合所有AI的观点,提供一个统一的答案。