Synth Daily

科技爱好者周刊(第 394 期):第二次 API 开放浪潮

本期内容探讨了由大模型驱动的第二次 API 开放浪潮,指出与15年前不同,此次浪潮的核心是 AI 自动化需求,促使包括日常生活服务在内的各平台开放接口,并支持自然语言调用。同时,内容也关注了北京人形机器人半马比赛暴露的续航瓶颈,介绍了 OpenAI 新发布的 GPT Images 2.0 图像模型,并分享了多款实用工具、资源以及关于 AI 作为信息扩展工具的思考。

第二次 API 开放浪潮

大约15年前,互联网曾经历过一次 API 开放浪潮,Facebook、Twitter 等平台纷纷开放数据接口,以期通过第三方开发推动生态增长。然而,由于盈利困难和用户流失等问题,平台最终转向封闭,建起“围墙花园”。

如今,随着大模型的崛起,情况发生了逆转。人们意识到 AI 的最大价值在于内容生成与自动化的结合。为了实现自动化,AI 必须能够调用其他平台的服务,这便倒逼各大平台必须开放 API。

没有 API,你的平台就进入不了 AI 工作流,各种 Agent 也就不能代表用户在你的平台上工作。

这股新浪潮的特点与上次截然不同:

  • 范围更广: 不再局限于云服务,而是扩展到外卖、电商、银行等日常生活服务
  • 调用方式更简单: 用户通过自然语言下达指令,由大模型翻译后调用 API,无需手动编程。
  • 目的不同: 上次 API 主要由应用程序调用以获取数据,而这次则由消费者通过 AI 调用,目的是代表用户执行操作。

机器人半马

北京举行了第二届人形机器人半马比赛,冠军成绩虽超越人类,但比赛过程也暴露了当前技术的短板。

  • 机器人需要频繁进入补给站更换电池并使用冰块降温。
  • 这表明其内置电池无法支持长时间的高强度运动,续航能力成为主要瓶颈
  • 目前市售的人形机器人,如宇树 H2,续航约为3小时,剧烈运动时会大幅缩短。在不插电的情况下,一两个小时就需要充电,这限制了其实用场景。

GPT Images 2.0

OpenAI 发布了据称目前最强的图像模型 GPT Images 2.0,其性能超越了竞品。新模型在文字渲染方面有显著进步,尤其对汉字的支持更好,能够生成复杂的解释性图片。用户可以免费试用,并已有多个收集优秀提示词的仓库可供参考。

AI 是扩展神器

AI 不仅能压缩信息,更擅长扩展信息,它能根据模糊的指令推断并生成看似合理的细节。一个简单的设想可以被 AI 逐步扩展为战略文件、产品规格、代码原型,乃至发布文案。

人们总是说,将来的世界是物质产品极大丰富的世界,AI 看上去就是这一类工具:凡是它能生成的东西,都将变得极大丰富。

小轿车的车载厕所

赛力斯申请了一项“车载厕所”专利。该设计通过一个滑轨装置,在座椅下方藏有一个坐便器,并配备了加热蒸发和排气系统。虽然对小轿车而言场景有限,但可能对长途货车司机等群体非常实用。

文章

  • 不要使用 Ollama: 文章指出 Ollama 在运行本地大模型时存在问题,并推荐使用 llama.cpp 和 LM Studio 作为替代。
  • npmx 的功能: 一个为 npmjs.com 设计的新前端,实现了许多开发者期待已久的功能。
  • 不要过长的链式调用: 讨论了 JavaScript 中过长链式调用的缺点。
  • 异步编程技术的演变: 深入介绍了异步编程的由来、async/await 的发展及其存在的问题。
  • 被动雷达的工作原理: 解释了被动雷达如何通过监听电波变化而非主动发射来侦测目标。

工具

  • Little Snitch for Linux: 著名的网络监控软件推出 Linux 版,可查看各应用的通信情况。
  • quien: 用于查询域名信息的终端工具。
  • ggsql: 可将 SQL 查询结果直接生成可视化图形的工具。
  • Himi Recorder: 开源的 Mac 录屏应用,能绕过录屏检测。
  • Tab Harbor: 开源 Chrome 插件,将新标签页变为标签管理器。
  • animal-island-ui: 《动物森友会》风格的 React UI 组件库。
  • CUPS Web: 网页版打印机管理工具,支持远程控制和多用户管理。
  • Blog Helper: 开源的访客统计服务,支持多站点。
  • HiKid: 帮助儿童练习英语口语和听力的免费桌面应用(仅 macOS)。
  • Kite Desktop: 桌面端的 K8S 多集群管理工具。
  • Project River: 可视化 Git 仓库提交历史的工具。

AI 相关

  • OpenAI Privacy Filter: 一个本地运行的大模型,用于在将数据发送到线上模型前过滤掉姓名、地址等敏感信息。
  • LinkAI Gateway: 开源的 AI 网关,可统一接入并管理多个主流大模型。
  • Nezha(哪吒): 轻量级的 AI 编程任务管理器,集成了终端、会话管理等功能。
  • WatermarkZero: 在浏览器本地去除 Gemini 图片可见水印的工具。
  • mini-cc: 开源的 AI 编程 Agent,作用类似 Claude Code。

资源

  • The Listening Museum: 一个收集各种键盘打字声音的网站,方便用户在购买前试听。
  • 软件工程定律: 该网站收集了56条与软件开发相关的定律,如“帕金森定律”。

帕金森定律 (Parkinson's Law):工作量总是会增加,直至填满所有可用时间。推论就是,不管设置多长的开发时间,项目开发总是会做到最后一刻。

图片

  • 5x5 像素的英文字体: 讨论了可读英文字体的最小尺寸。5x5 像素被认为是可辨识的最小极限,占用内存极小,非常适合低功耗或老式设备。
  • 里海石油城: 介绍了苏联曾在里海上建造的庞大水上石油城市。该城市通过桥梁连接数百个生产基地,曾有数千人居住。随着石油枯竭,如今已大多废弃。

言论

美国鞋类生产商 Allbirds 宣布转型为 AI 公司,股价一天暴涨了5倍。这让人想起2017年,一家名为“长岛冰茶”的饮料企业宣布转型为区块链公司,股价也是暴涨,但后来在区块链业务建立前就破产了。 -- 雅虎

Figma 拥有近 2000 名员工,而 Anthropic 新推出的 Claude Design 的开发团队,我甚至怀疑是否超过10个人。 -- 《Figma 的困境》,评论认为 AI 的开发速度和成本优势对传统软件构成了重大打击。

我对未来世界的憧憬是,她或许不那样充满未来感,反而更像田园牧歌。我们可以回归传统的生活形态,同时又不放弃新技术带来的便利,几乎无需再去看屏幕或触碰屏幕。 -- jsomers.net

每一种文化都会造就反映其最深层焦虑的英雄。硅谷最焦虑的,就是增长停滞,所以大肆宣传“英雄开发者”:他们能凭借着咖啡因带来的强大意志力,将白板上的涂鸦变成价值数十亿美元的独角兽企业。 -- 《古典维护者的挽歌》