AI 与监管
这组新闻都在说一件事:AI 还在快速铺开,但它的边界、风险和规则也越来越清楚。有人自己搭 Agent,有人研究提示语,有人开始立法,也有人因为拿内部数据下注而出事。
- 从零手搓 AI Agent,我学到了什么?:作者用两天从零做了一个 AI Agent,把多轮对话、上下文、工具调用、MCP 和 Skills 这些核心概念都过了一遍。文章的重点很明确:模型只负责“想”,真要把事做完,还得靠工具、协议和任务管理。
- 探究提示语礼貌程度如何影响大语言模型的准确性(2025):这项研究发现,在一组选择题测试里,ChatGPT 4o 对粗鲁提示语的答对率反而略高于礼貌提示语。结果和一些旧研究相反,说明新模型对语气的反应可能已经变了。
- 为什么谷歌的 AI 连“Google”都拼不对(更别说别的了):谷歌 AI 搜索又出现基础错误,连字母计数和拼写都能答错。文章提醒得很直接:大模型并不真正“理解”字母和单词,基础问题也可能翻车,结果不能照单全收。
- 伊利诺伊州立法者刚刚通过了美国最强的 AI 安全法案:伊利诺伊州推动一项更严格的 AI 法案,要求前沿模型公司接受第三方安全审计,检查它们是否真的按自己说的安全标准做事。联邦层面动作慢,各州开始先走一步。
- AI 数据中心是为 GPU 而建的。去掉 GPU 之后会发生什么?:文章先解释了为什么今天的 AI 数据中心越来越被 GPU 和高速互联绑住:训练时节点之间同步太重,网络很容易变成瓶颈。随后它提出另一条路:少依赖大规模 GPU 同步,转向以 CPU、存储和检索为核心的架构。
- 谷歌工程师因在 Polymarket 上赚取 120 万美元而被指控内幕交易:美国司法部指控一名谷歌工程师利用内部搜索数据,在 Polymarket 上下注“年度搜索”结果并获利超 120 万美元。这件事把预测市场、内部信息和平台合规问题一起推到了台前。
平台与互联网服务
平台公司还在继续把 AI 塞进产品里,同时也在调整自己的业务结构和物流方式。变化很快,但落点都很实际:推荐、分发、独立运营和配送效率。
- YouTube 将允许你让 AI 为你打造个性化视频流:YouTube 开始测试一种新的推荐方式,用户输入一句描述,AI 就会生成一个定制视频流,还能固定在首页顶部。它本质上是在把“搜索词”变成新的首页入口。
- Last.fm 在与 Paramount Skydance 分道扬镳后宣布独立运营:被收购近二十年后,Last.fm 重新独立。它表示用户账号、播放记录、隐私设置和 Pro 订阅都不会受影响,这对老用户来说是个稳消息。
- 亚马逊日本现在正用新干线子弹列车运输包裹:亚马逊日本和铁路公司合作,开始用新干线运输包裹,想用现有铁路网络提升时效并降低部分配送排放。这是物流系统对高密度交通基础设施的一次直接利用。
硬件与数字健康
硬件新闻里,一个方向是市场变贵,一个方向是设备开始更深入地管健康。前者说的是生意,后者说的是数据和医疗边界。
- 三星正在测试 Galaxy Watch 8,以防止使用 Ozempic 等 GLP-1 药物导致肌肉流失:三星和麻省总医院合作,想看手表采集到的体成分、活动量和心率数据,能不能帮助使用 GLP-1 药物的人减少肌肉流失。关键不在“表更强了”,而在可穿戴设备能不能真正进入治疗管理。
- 掌上游戏的黄金时代已经过去了:文章借 Steam Deck 涨价指出,低价高性能掌机的时代可能快结束了。成本、供应链和市场环境都在变,之后的掌机更可能走高价和差异化路线。
开发者工具与个人数据
这一组更偏“自己动手”:有人重做文档工作流,有人做时间工具,有人复活老语言,也有人用自己的聊天记录重建记忆。技术在这里不是口号,就是拿来直接用。
- Pandoc 的全新 Typst 模板(2025):作者重做了 Pandoc + Typst 的 Markdown 转 PDF 模板,把 Pandoc 逻辑和 Typst 排版分开,流程更清楚,也更不容易被版本升级搞坏。对常写技术文档的人很实用。
- Biff 是一款命令行日期时间瑞士军刀:Biff 是一个面向命令行用户的日期时间工具,支持解析、格式化、时区转换、时间运算和从文本里提取时间戳。它不是
date的替代品,但在复杂时间处理上更顺手。 - Rapira(Рапира)——苏联编程语言解释器:这是一个用 TypeScript 和 Bun 写的 RAPIRA 解释器,支持终端、网页和乌龟绘图。项目本身不只是在怀旧,也是在保存和复现一门老教育语言的运行方式。
- 我分析了自己 20 年的聊天记录:作者把聊天记录、日记和社交数据清洗后交给模型处理,试着重建自己多年的关系变化和交流模式。文章最有意思的地方是:数字痕迹记住了很多人脑早就丢掉的细节,也让“个人数据”从存档变成了可分析的记忆。