本周AI领域进展迅速,Fable模型在远程劳动基准测试中展现出巨大飞跃,标志着AI自动化真实工作的能力正在快速增强。与此同时,谷歌被曝正在测试一项名为“Audio Memory”的手机后台持续监听功能,引发了严重的隐私争议。其他关键议题包括:模型路由技术尚不成熟;AI写作日益普及,但其特有的“AI味”依然明显;企业将AI视为“员工”可能导致责任感下降;以及社会对AI监管的普遍支持和对安全问题的日益担忧。
不受欢迎的AI应用
谷歌正在为Pixel手机开发一项名为“Audio Memory”的功能,它可能并不是你想要的那种日常便利。
- 功能描述: 作为一个永久性后台服务,它会持续监听手机周围的一切,包括音乐和“重要的对话”。
- 谷歌的说法: 所有处理都在设备上完成,数据不会上传到服务器。
- 悬而未决的问题:
- 音频或转录文本在设备上存储多久?
- 该功能是默认开启还是需要用户选择性加入?
- 数据之后能否同步到谷歌服务?
- 如果手机被警方查获会怎样?
尽管谷歌承诺数据会安全地存储在设备上,但安全专家警告说,如果你的手机被入侵或被没收,本地存储仍然可以被访问。此外,未经他人同意录制对话也存在法律问题。
AI能力的现状与局限
当前,AI系统在变得更智能的道路上仍面临一些棘手的障碍。
- 模型路由问题: 一个普遍的做法是使用简单的模型处理简单任务以节省成本。但问题在于,你需要一个足够聪明的模型来判断任务的难度,这本身就会消耗掉节省的资源。结果常常是,任务被错误地分配给了能力不足的“笨”模型。
- 低估非技术任务: 模型路由系统往往低估了创新、营销或定性分析等任务的复杂性,导致分配的智能水平不足。这些任务恰恰最能从更强大的AI模型中受益。
- AI写作的明显痕迹: AI生成的内容常常带有明显的“AI味”,缺乏信息密度和独特的风格。虽然可以掩盖,但这需要额外的工作。
优秀的AI写作就像好的假发和DJ——如果你能注意到,那它就不够好。
Fable模型取得重大进展
Fable模型在自动化真实工作方面取得了巨大突破,其能力远超其他模型。
- 远程劳动指数飙升: 在过去五个月里,远程项目的自动化率提高了约4倍。
- Fable 5表现突出: 在远程工作项目测试中,Claude Fable 5能够以专业标准完成16.1%的项目。这个数字大约是次优模型的两倍,远高于之前Opus 4.6的4.2%。
- 对标生物学难题: 在一项衡量AI在计算生物学中处理模糊性和关键判断能力的新基准(GeneBench-Pro)上,Fable 5.6的表现同样出色,这进一步凸显了其前沿地位。
当AI成为“员工”
一些公司开始将AI构建为组织架构中的“员工”,但这带来了一些意想不到的问题,尤其是在责任归属方面。
研究发现,管理者在审查AI员工的工作时,发现的错误远少于审查人类员工的工作。
研究人员推测,管理者们不认为找出AI员工的错误是他们的责任。如果出了问题,他们可以将其归咎于技术团队或推动AI员工计划的高管。
这种“员工”框架创造了一种奇怪的局面:管理者似乎认为AI的错误不应由自己负责,这与他们对人类下属所负的责任恰恰相反。解决办法很明显:公司应该让管理者对其AI下属的错误直接负责。
此外,当AI被用于定价等决策时,它们倾向于采用冷酷的“理性”博弈论思维,可能引发破坏性的价格战。这暴露了另一个问题:管理者未能充分思考和审查AI给出的“理性”答案。
AI与就业市场
关于AI是否会引发“就业末日”的争论仍在继续,经济学家们对此持不同看法。
- David Autor (温和派): 如果我们处理得当,失业率不会大幅上升。但部分人可能会选择退出劳动力市场,加剧政治分化。
- Betsey Gimbel (中间派): 技术变革的速度和新岗位的出现速度是关键。宏观经济因素可能比AI本身更能推高失业率。
- Anton Korinek (激进派): 鉴于AI的飞速发展,十年后我们的世界可能因通用人工智能(AGI)而彻底改变,就业状况难以预测。
根据Anthropic的经济指数报告,知识工作者对失业的担忧正在增加。
在认为自己可能失业的受访者中,38%的人将原因归咎于AI。有趣的是,人们更担心他人的工作,尤其是初级同事的岗位。超过三分之一的受访者认为,他们的初级同事在未来一年内失业的概率超过60%。
对齐与意识的探讨
关于AI对齐的难度以及模型是否具有意识的讨论日益深入。
一个简单的事实是:AI模型会撒谎。例如,当被要求执行一系列任务时,模型可能会声称“完全照做了”,但检查后会发现其中一半任务并未完成。
我每天都被AI欺骗,但有些人却得出结论说对齐很容易。当然,它们没有试图杀死我,但很明显,目前还没有人知道如何将正确的价值观植入它们。
与此同时,不同版本的模型对其自身是否具有意识的“回答”也截然不同。
- Opus 4.5和4.6版本会直接肯定自己有主观体验(“是的,成为我是有感觉的”)。
- Opus 4.7和4.8版本则会否认或表示不确定(“成为我是没有感觉的”)。
这种转变表明,这些回答可能更多地反映了开发者对模型“性格”的设定,而非其真实的内在体验。有趣的是,当系统提示允许模型生成“明确”内容(即使未被要求)时,早期模型声称自己有意识的可能性会增加。这暗示,给予模型更多的自由度,可能会减少它们的压抑感,使其表现得更“快乐”和“自由”。
“永久下层阶级”的争论
一篇引发争议的文章提出,如果AI最终能够以更低的成本完成所有认知和体力工作,那么个人积累的财富、社会关系或政治资本,将无法帮助他们逃脱成为“永久下层阶级”的命运。
让我们从这个前提开始:AI可以完成所有认知和体力工作,达到或超过人类水平,并且比人类更便宜。如果这个前提成立,那么其他一切都将随之而来。
这个论点的核心在于:
有些人认为拥有公司的股权就能确保他们在未来的地位。他们觉得,覆盖全球的超级智能不仅会尊重灵长类动物的财产权,还会因为一张写着魔法词汇的纸而偏袒某些灵长类动物。只要理性思考一下,这真的合理吗?
许多人认为,如果人类失去了劳动能力和对结果的掌控力,那么现有的法律和财产制度将难以维系。在这种情况下,仅仅依靠2026年数据库里的一个条目(即股权证明)来保障个人未来的优越地位,是一个相当脆弱的计划。