本期内容探讨了由大模型驱动的第二次 API 开放浪潮,指出与15年前不同,此次浪潮的核心是 AI 自动化需求,促使包括日常生活服务在内的各平台开放接口,并支持自然语言调用。同时,内容也关注了北京人形机器人半马比赛暴露的续航瓶颈,介绍了 OpenAI 新发布的 GPT Images 2.0 图像模型,并分享了多款实用工具、资源以及关于 AI 作为信息扩展工具的思考。
第二次 API 开放浪潮
大约15年前,互联网曾经历过一次 API 开放浪潮,Facebook、Twitter 等平台纷纷开放数据接口,以期通过第三方开发推动生态增长。然而,由于盈利困难和用户流失等问题,平台最终转向封闭,建起“围墙花园”。
如今,随着大模型的崛起,情况发生了逆转。人们意识到 AI 的最大价值在于内容生成与自动化的结合。为了实现自动化,AI 必须能够调用其他平台的服务,这便倒逼各大平台必须开放 API。
没有 API,你的平台就进入不了 AI 工作流,各种 Agent 也就不能代表用户在你的平台上工作。
这股新浪潮的特点与上次截然不同:
- 范围更广: 不再局限于云服务,而是扩展到外卖、电商、银行等日常生活服务。
- 调用方式更简单: 用户通过自然语言下达指令,由大模型翻译后调用 API,无需手动编程。
- 目的不同: 上次 API 主要由应用程序调用以获取数据,而这次则由消费者通过 AI 调用,目的是代表用户执行操作。
机器人半马
北京举行了第二届人形机器人半马比赛,冠军成绩虽超越人类,但比赛过程也暴露了当前技术的短板。
- 机器人需要频繁进入补给站更换电池并使用冰块降温。
- 这表明其内置电池无法支持长时间的高强度运动,续航能力成为主要瓶颈。
- 目前市售的人形机器人,如宇树 H2,续航约为3小时,剧烈运动时会大幅缩短。在不插电的情况下,一两个小时就需要充电,这限制了其实用场景。
GPT Images 2.0
OpenAI 发布了据称目前最强的图像模型 GPT Images 2.0,其性能超越了竞品。新模型在文字渲染方面有显著进步,尤其对汉字的支持更好,能够生成复杂的解释性图片。用户可以免费试用,并已有多个收集优秀提示词的仓库可供参考。
AI 是扩展神器
AI 不仅能压缩信息,更擅长扩展信息,它能根据模糊的指令推断并生成看似合理的细节。一个简单的设想可以被 AI 逐步扩展为战略文件、产品规格、代码原型,乃至发布文案。
人们总是说,将来的世界是物质产品极大丰富的世界,AI 看上去就是这一类工具:凡是它能生成的东西,都将变得极大丰富。
小轿车的车载厕所
赛力斯申请了一项“车载厕所”专利。该设计通过一个滑轨装置,在座椅下方藏有一个坐便器,并配备了加热蒸发和排气系统。虽然对小轿车而言场景有限,但可能对长途货车司机等群体非常实用。
文章
- 不要使用 Ollama: 文章指出 Ollama 在运行本地大模型时存在问题,并推荐使用 llama.cpp 和 LM Studio 作为替代。
- npmx 的功能: 一个为 npmjs.com 设计的新前端,实现了许多开发者期待已久的功能。
- 不要过长的链式调用: 讨论了 JavaScript 中过长链式调用的缺点。
- 异步编程技术的演变: 深入介绍了异步编程的由来、async/await 的发展及其存在的问题。
- 被动雷达的工作原理: 解释了被动雷达如何通过监听电波变化而非主动发射来侦测目标。
工具
- Little Snitch for Linux: 著名的网络监控软件推出 Linux 版,可查看各应用的通信情况。
- quien: 用于查询域名信息的终端工具。
- ggsql: 可将 SQL 查询结果直接生成可视化图形的工具。
- Himi Recorder: 开源的 Mac 录屏应用,能绕过录屏检测。
- Tab Harbor: 开源 Chrome 插件,将新标签页变为标签管理器。
- animal-island-ui: 《动物森友会》风格的 React UI 组件库。
- CUPS Web: 网页版打印机管理工具,支持远程控制和多用户管理。
- Blog Helper: 开源的访客统计服务,支持多站点。
- HiKid: 帮助儿童练习英语口语和听力的免费桌面应用(仅 macOS)。
- Kite Desktop: 桌面端的 K8S 多集群管理工具。
- Project River: 可视化 Git 仓库提交历史的工具。
AI 相关
- OpenAI Privacy Filter: 一个本地运行的大模型,用于在将数据发送到线上模型前过滤掉姓名、地址等敏感信息。
- LinkAI Gateway: 开源的 AI 网关,可统一接入并管理多个主流大模型。
- Nezha(哪吒): 轻量级的 AI 编程任务管理器,集成了终端、会话管理等功能。
- WatermarkZero: 在浏览器本地去除 Gemini 图片可见水印的工具。
- mini-cc: 开源的 AI 编程 Agent,作用类似 Claude Code。
资源
- The Listening Museum: 一个收集各种键盘打字声音的网站,方便用户在购买前试听。
- 软件工程定律: 该网站收集了56条与软件开发相关的定律,如“帕金森定律”。
帕金森定律 (Parkinson's Law):工作量总是会增加,直至填满所有可用时间。推论就是,不管设置多长的开发时间,项目开发总是会做到最后一刻。
图片
- 5x5 像素的英文字体: 讨论了可读英文字体的最小尺寸。5x5 像素被认为是可辨识的最小极限,占用内存极小,非常适合低功耗或老式设备。
- 里海石油城: 介绍了苏联曾在里海上建造的庞大水上石油城市。该城市通过桥梁连接数百个生产基地,曾有数千人居住。随着石油枯竭,如今已大多废弃。
言论
美国鞋类生产商 Allbirds 宣布转型为 AI 公司,股价一天暴涨了5倍。这让人想起2017年,一家名为“长岛冰茶”的饮料企业宣布转型为区块链公司,股价也是暴涨,但后来在区块链业务建立前就破产了。 -- 雅虎
Figma 拥有近 2000 名员工,而 Anthropic 新推出的 Claude Design 的开发团队,我甚至怀疑是否超过10个人。 -- 《Figma 的困境》,评论认为 AI 的开发速度和成本优势对传统软件构成了重大打击。
我对未来世界的憧憬是,她或许不那样充满未来感,反而更像田园牧歌。我们可以回归传统的生活形态,同时又不放弃新技术带来的便利,几乎无需再去看屏幕或触碰屏幕。 -- jsomers.net
每一种文化都会造就反映其最深层焦虑的英雄。硅谷最焦虑的,就是增长停滞,所以大肆宣传“英雄开发者”:他们能凭借着咖啡因带来的强大意志力,将白板上的涂鸦变成价值数十亿美元的独角兽企业。 -- 《古典维护者的挽歌》