AI 技术可能因其高昂的算力成本而加剧社会贫富分化,未来富人或将使用效果卓越的顶级模型,而普通人只能依赖性能较差的免费版本。一种衡量大模型能力的新方法揭示,AI 的进步速度惊人,预计在未来几年内能完成专家级的复杂任务。此外,本期内容还涵盖了 GitHub Copilot 植入广告、触摸屏指甲油等科技动态,并探讨了摩尔定律的局限与编程工作的核心价值。
AI 的贫富分化
AI 与其他技术不同,它不仅引发技术变革,更可能带来深刻的社会变革,特别是导致新的贫富分化。
多数技术,如可口可乐或苹果手机,实际上促进了“消费者平等”,让穷人和富人能消费相同的产品。然而,AI 模型打破了这一规律,在大模型面前,穷人与富人并不平等。
价格决定效果: 最顶级的 AI 模型服务极其昂贵。例如,Claude Code 的 Max 套餐月费高达200美元,而 OpenAI 甚至设想过月费2万美元的顶级服务。这背后是一个简单事实:模型效果与算力直接相关,而更多的算力需要巨大的资金投入。
缺乏规模效应: 工业品会因大规模生产而降低成本,但大模型不会。模型的“大规模生产”需要更多服务器,这并不会降低单位成本,甚至可能因基础设施改造而变得更贵。
未来社会可能出现这样的景象:富人使用付费的顶级模型获取规划、咨询和自动化等高级服务;而普通人只能使用效果平平的免费模型。
不过,也有另一种可能。马斯克认为,算力本质是能源转化,若未来人类能实现廉价能源的充足供应,算力成本将大幅下降,届时所有人都能用上最好的模型。但这是否现实,仍是未知数。
模型能力的一种衡量方法
传统上,衡量大模型能力依赖于在测试集上跑分,这种方法难以评估其进步速度。最近一篇论文提出了一种新方法:
- 首先,计算人类完成某项任务所需的时间。
- 然后,测试大模型能否以 50% 的成功率 完成这项任务。
研究发现,模型的进化速度在对数坐标下呈一条直线:
- GPT-2 能完成人类需 2 秒完成的任务。
- Claude 3.7 Sonnet 能完成人类需 50 分钟完成的任务。
- Opus 4.6 则能完成人类需 12 小时才能完成的任务。
这意味着,每过 7 个月,大模型能以 50% 成功率完成的任务,其所需的人类时间就扩大一倍。按照这个趋势,到 2027 年至 2031 年间,大模型将能完成人类专家需要一个月才能完成的任务。
如果该论文的结论正确,那么年底发布的模型将比年初时强大一倍。
科技动态
用户协议的彩蛋 一家美国通信运营商在冗长的《用户协议》中隐藏了一个彩蛋:“如果你读到这句话,请发邮件给我们,赢取免费的瑞士旅游。” 结果上线两周后才有一人发现。这表明几乎没人会阅读用户协议。一个实用的建议是:让大模型帮忙分析协议,快速找出其中对用户不利的条款。
触摸屏指甲油 电容式触摸屏在戴手套时会失灵,因为它需要导电物体(如手指)来触发。为解决此问题,一名化学系本科生发明了一种透明指甲油,内含导电金属碎屑。将其涂在手套指尖或裸甲上,即可在戴手套时正常使用触摸屏。
Copilot 广告 GitHub 的 AI 助手 Copilot 被发现会自动向用户的代码提交(Pull Request)中插入广告。在超过 11,400 个 PR 的结尾都出现了推广 Raycast 应用的广告词。经用户抗议后,GitHub 暂停了此功能,但这揭示了其利用用户行为创收的意图。
文章
- 小米 MiMo v2 Pro 评测 (英文): 国外媒体对小米新发布的大模型给予了高度评价。
- 我用 AI 生成了一个 JavaScript 引擎 (英文): 作者介绍了如何用六周时间,借助 AI 生成一个能通过所有官方测试场景的 JavaScript 引擎。
- 解剖 .claude/ 目录 (英文): 深入研究 Claude Code 在本地生成的 .claude/ 目录,揭示其底层数据处理机制。
- 一致性哈希介绍 (英文): 解释一种缓存定位算法,它能确保在增减服务器时,尽量不改变原有缓存的位置。
- 笔记本如何用作单板计算机的 HDMI 显示器 (英文): 通过一张 HDMI 转 USB 采集卡,将笔记本电脑变成树莓派等设备的显示器。
工具
- EmDash: 一个用 TypeScript 编写的 WordPress 开源复刻版,AI 生成,功能基本一致。
- SubsTracker: 基于 Cloudflare Workers 的订阅管理系统,可通过 Telegram 等渠道发送到期提醒。
- OpeniLink Hub: 开源的微信机器人消息管理平台,可通过安装应用为机器人增加功能。
- Lixian.Online: 用于获取 VSCode 插件、Chrome 扩展和 Docker 镜像离线安装包的工具。
- Rename.Tools: 浏览器端的批量文件重命名工具,支持自定义规则,代码开源。
- FontInAss: 开源工具,可将字幕文件所需的字体字形嵌入其中,方便分发。
- pretext.video: 一个有趣的应用,通过文字排版实时展示摄像头捕捉到的人体轮廓。
- OxideTerm: 基于 Rust 语言开发的跨平台 SSH 终端。
- wtree: 一个
git worktree的图形化管理界面。
AI 相关
- Open Agent SDK: Claude Code 源码中
claude-agent-sdk的开源替代品,用于 AI Agent 开发。 - Antigravity Gateway: 用于统一管理本地所有 AI 智能体的 Web 控制台。
- ArcReel: 开源的 AI 视频生成工作台,输入小说即可自动生成剧本、人设、分镜和短视频。
- TermCanvas: 一款桌面应用,将所有终端窗口平铺在无限画布上,方便管理 AI 编程工具。
资源
- Claude Code 动手教程: 通过 11 个互动练习,帮助用户掌握 Claude Code 这个 AI 编程工具。
- Claude Code Unpacked: 基于其泄漏的源码,图解演示输入提示词后软件内部的处理流程。
- 机器学习入门教程: 为工程师编写的机器学习教程,用于解释基本概念。
文摘
越使用 AI,我越不担忧
我花在 AI 编程的时间越多,对自己的职业生涯的担忧就越少。因为我发现,我的真正工作是找出可以用代码解决的问题,然后解决它们,并验证解决方案是否有效。AI 最终或许能够承担编码部分,但发现问题、定义问题并确认问题已解决,这仍然需要人来完成,而这正是我工作的 80%。
摩尔定律的不可持续性
摩尔定律不仅指芯片晶体管数量每两年翻一番,它还有一个很少被提及的伴生效应:芯片工厂的建造成本大约每五年翻一番,而能负担得起的公司数量则减半。
25 年前,建厂成本约为几十亿美元,有约 40 家公司能负担。如今,建造成本飙升至数百亿美元,只有两三家公司能做到。如果这个趋势持续,未来可能没有公司能负担得起最先进芯片工厂的建设。随着制造工艺逼近 1 纳米,技术和资金壁垒都将接近极限。未来芯片的性能差异可能不再巨大,增长将主要来自整体算力,而非单块芯片的性能。
言论
源代码的 map 文件不小心发布到 npm,这种错误听起来似乎不可能,但当你意识到很大一部分代码库很可能是由你正在发布的 AI 编写的,一切就容易理解了。 -- 网友评论 Claude Code 源码泄漏事件
人工智能的蓬勃发展,使得某些办公室工作的需求可能并不大,而将创造大量电工、焊工和水管工的工作岗位。有些人或许更适合做体力劳动者,在这些领域,职业生涯同样可以很成功。 -- 拉里·芬克,贝莱德集团老板
写作的目的不在于写完,而在于增进你自己的理解。让 AI 为你写作,就像花钱请人为你健身一样。 -- 《别让 AI 替你写作》
程序员的工作不是编程,而是通过抽象,来管理软件的复杂性。如果你做到了这一点,那么编程就很容易了。 -- 《你的工作不是编程》