数据库与数据工具
这几篇都在讲一件事:把数据处理做得更快、更顺手。重点不只是“性能高”,还包括更简单的部署方式和更灵活的使用边界。
- DuckDB 内部机制:DuckDB 为什么这么快?(第 1 部分):文章拆开了 DuckDB 的前半段执行流程:解析、绑定、优化、生成物理计划,再到流水线执行。它快的原因很具体:列式存储、行组、zone map、Parquet 统计信息,以及对 CSV 的自动识别,都在减少无用计算。
- ClickHouse 开源十周年:ClickHouse 回顾了十年演进过程。从早期为实时分析而生,到形成列式存储、MergeTree、复制和分布式架构这些核心设计,它已经从单一项目变成了成熟的开源数据库生态。
- Datasette 应用:在 Datasette 内部托管自定义 HTML 应用:Datasette 新增了一种插件形态,允许开发者在沙箱 iframe 里跑自定义 HTML 和 JavaScript 应用。它保留了严格权限和可见日志,既能读数据,也能通过受控查询做有限写入,让 Datasette 从“看数据”走向“做小应用”。
编程语言、规范与开源基础设施
这一组更偏底层:有的是 Web 规范设计,有的是语言社区治理,有的是把“能跑”和“能证明”放进同一套工具里。
- 所以,你想定义一个广为人知的 URI:文章讲清了 Well-Known URI 什么时候该用、什么时候不该用。核心观点很实在:只有在客户端已知站点、又确实需要站点级发现或操作时才值得用;如果只是图省事或装“正式”,反而会增加部署负担。
- Raku 基金会诞生了:Raku 基金会已经正式注册,开始从 Perl 基金会之外独立运作。它的目标很明确:为 Raku 单独筹资、治理和对外代表,也为未来可能涉及的开源合规责任提前做准备。
- Show HN:Talos——用于 Lean 的开源 WASM 解释器:Talos 用 Lean 4 写了一个 WebAssembly 解释器,特别之处在于执行语义和形式化证明共用同一套代码。简单说,它不只想“把 Wasm 跑起来”,还想证明程序为什么这样跑。
- Gribouille 0.3.0:Typst 的图形语法:这个版本主要补强图形细节控制,比如引导线、图例、面积图堆叠和标注裁剪。更新不算大新闻,但对用 Typst 画图的人来说,实用性明显提高了。
芯片、系统与硬件研究
这里的共同点是:想真正理解硬件,不能只看公开文档,还得自己搭环境、做实验,甚至重建一层系统。
- 为了研究芯片是如何工作的,MIT 研究人员自己打造了一个操作系统:MIT 做了一个叫 Fractal 的研究内核,直接跑在裸机上,用来减少传统操作系统带来的干扰。团队用它研究苹果 M1,发现了此前未充分注意的推测执行和缓存、分支预测器泄露问题。
- 美国称,ASML 的顶级芯片设备可能已在中国;ASML 则表示并非如此:美国官员怀疑 ASML 的 EUV 光刻设备可能流入中国,但 ASML 明确否认。因为 EUV 是先进芯片制造的关键设备,这件事如果被证实,会直接冲击现有出口管制框架。
AI、自动化与研究工具
这组新闻说明,AI 现在正沿两条线推进:一条进企业软件,另一条进实验室和个人研究场景。
- Elastic 同意以最高 8500 万美元收购由 CRV 支持的 DeductiveAI:DeductiveAI 做的是用 AI 自动发现和修复软件故障。Elastic 收购它,说明老牌企业软件公司正在加快把 AI 原生能力并入现有的可观测性和运维产品。
- 打造一个放在我办公桌旁的机器人研究环境:作者用不到 5000 欧元搭了一套桌边机器人实验平台,包括机械臂、双摄、遥操作设备和自研 Python 软件栈。重点不在“炫设备”,而在证明个人研究者也能在真实机器人上做采集、训练和测试。
- Barret Zoph 在 OpenAI 再次离职了,这次只待了五个月:Barret Zoph 重返 OpenAI 仅五个月后再次离职。单看信息量不大,但它继续反映出顶级 AI 团队之间的人才流动仍然非常频繁。
平台治理与互联网使用
这类新闻看上去像单点事件,背后其实是同一个问题:平台一旦被限制,用户会立刻寻找绕路办法。
- Telegram 在印度被禁,引发 VPN 和竞品应用热潮:印度短暂限制 Telegram 后,VPN 下载量和替代聊天应用使用量都迅速上升。平台限制并没有简单地让需求消失,反而推动用户转向绕过工具和替代服务。