AI 与数据系统
AI 工具还在快速变,但方向已经很清楚:光靠更大的模型不够,关键是成本、验证和底层系统。
- 加拉帕戈斯岛上的智能体编程笔记:作者长期使用 AI 编码代理后认为,LLM 在测试、调试、数据分析和自动化上很有用,但也很容易胡说八道。真正靠谱的做法,是用测试、fuzzing、人工反馈和多模型互相检查来约束它。
- 性能越来越高,价格越来越低:英伟达卡贵且紧张,AMD MI355X 正靠更低成本切入推理市场。实测表明,只要量化、框架选择和 ROCm 兼容问题处理得当,AMD 在推理上的性价比已经很能打。
- Leanstral 1.5:所有命题的证明充裕性:这是一款面向 Lean 4 形式化证明的开源模型,数学证明和代码验证能力都很强。它不只在基准测试上领先,还在 57 个开源仓库里找出了 5 个此前未知的 bug。
- S3 上以 Parquet 格式存储的 Postgres 数据:LTAP 架构详解:Databricks 想把传统 Postgres 的存储层拆出来,放到独立服务上,提高持久性、扩展性和恢复能力。更重要的是,它试图让事务处理和分析直接共享同一份数据,少一层 CDC,也少一份重复数据。
安全与工程实践
底层细节依然重要。一个服务配置错了会直接提权,一个标准库用对了也能做出很强的工具。
- MSI Center——如何在几秒钟内获取 SYSTEM 权限:研究人员发现 MSI Center 的后台服务把高危命令暴露给了普通已认证用户,可直接拿到 SYSTEM 权限,甚至可能带来局域网内的远程执行风险。MSI 已修复,但这个问题说明消费软件里的系统级服务仍然很危险。
- 用 Ruby 逆向工程 Codemasters 的 BIGF 存档格式:作者只用 Ruby 标准库就读出了老游戏的 BIGF 归档和 AI 数据。文章很实在,重点讲了
String#unpack、字节序、二进制读取和NaN这些做二进制解析时绕不过去的问题。 - Steam 控制器自动充电——使用 CV 的磁吸充电底座试点项目:这是个很有意思的小项目:用摄像头光流识别位置,再通过 WebHID 控制手柄震动,引导它自己“挪”到磁吸底座上充电。做法不复杂,但把浏览器、视觉和硬件控制拼得很巧。
健康与日常环境
不少影响判断和健康的问题,其实就在身边:房间里的空气、吃进嘴里的添加剂、还有我们看嘴形时的大脑误差。
- 瓶颈可能在于房间里的空气:封闭会议室和居家办公空间里的 CO2 很容易升高到影响思考的水平。人在这种环境下,决策、规划和压力下处理信息的能力都会下降,而且往往自己还察觉不到。
- 食品防腐剂可能会增加高血压和心血管疾病的风险:法国一项大样本随访研究发现,部分防腐剂摄入较高的人,高血压和心血管疾病风险也更高。它只能说明相关性,不能直接证明因果,但足够提醒人们少吃高度加工食品。
- 研究揭示了人们读唇时看到的内容:研究人员给约 2 万个英语单词做了“视觉地图”,发现唇读误差并不是随机的,而是集中出现在口型相近的词之间。这对唇读训练和音视频转录模型都有用。
科学新发现
从宇宙到森林,再到古生物,很多旧判断都在被新数据推着重写。
- 天体物理学家对韦布的新宇宙感到困惑:韦布望远镜看到了大量早期宇宙中的“小红点”、超大质量黑洞和异常明亮的星系,这些东西出现得太早、太多,和传统模型不太对得上。现在有不少解释,但都还没坐实。
- 巨树将水输送到顶部枝叶毫不费力:最新研究:新研究发现,高大的热带树并不会因为太高就更难把水送到树冠。它们会通过更宽的输水导管和更耐旱的叶片做补偿,这可能意味着一些气候模型高估了巨树的干旱风险。
- 科学家在墨西哥发现了一种新的蝾螈化石物种:研究人员确认了墨西哥首个正式命名的化石蝾螈物种,也是当地已知最早的钝口螈属记录。它把墨西哥蝾螈的演化历史又往前推了一步。
网络记忆与技术文化
互联网一边在遗忘,一边还在争论谁有资格被记住。
- 逝去而不被遗忘:重现消失的网络世界:旧网页消失得很快,十年前的链接今天已经坏掉一大批。互联网档案馆的 Wayback Machine 还能救回其中不少页面,说明“死网”不是抽象问题,而是已经在发生的内容流失。
- Odin、维基百科与流量收割:Odin 语言的维基百科条目被删,引发了一场关于“可靠来源”和“显著性”的争吵。文章认为,这件事暴露出维基规则和现代编程社区之间的错位,也说明社交媒体很容易把小范围的内容争议炒成情绪化对立。