每日科技摘要-07-04-晚报

AI 工具还在快速变，但方向已经很清楚：光靠更大的模型不够，关键是成本、验证和底层系统。

加拉帕戈斯岛上的智能体编程笔记：作者长期使用 AI 编码代理后认为，LLM 在测试、调试、数据分析和自动化上很有用，但也很容易胡说八道。真正靠谱的做法，是用测试、fuzzing、人工反馈和多模型互相检查来约束它。
性能越来越高，价格越来越低：英伟达卡贵且紧张，AMD MI355X 正靠更低成本切入推理市场。实测表明，只要量化、框架选择和 ROCm 兼容问题处理得当，AMD 在推理上的性价比已经很能打。
Leanstral 1.5：所有命题的证明充裕性：这是一款面向 Lean 4 形式化证明的开源模型，数学证明和代码验证能力都很强。它不只在基准测试上领先，还在 57 个开源仓库里找出了 5 个此前未知的 bug。
S3 上以 Parquet 格式存储的 Postgres 数据：LTAP 架构详解：Databricks 想把传统 Postgres 的存储层拆出来，放到独立服务上，提高持久性、扩展性和恢复能力。更重要的是，它试图让事务处理和分析直接共享同一份数据，少一层 CDC，也少一份重复数据。

底层细节依然重要。一个服务配置错了会直接提权，一个标准库用对了也能做出很强的工具。

MSI Center——如何在几秒钟内获取 SYSTEM 权限：研究人员发现 MSI Center 的后台服务把高危命令暴露给了普通已认证用户，可直接拿到 SYSTEM 权限，甚至可能带来局域网内的远程执行风险。MSI 已修复，但这个问题说明消费软件里的系统级服务仍然很危险。
用 Ruby 逆向工程 Codemasters 的 BIGF 存档格式：作者只用 Ruby 标准库就读出了老游戏的 BIGF 归档和 AI 数据。文章很实在，重点讲了 String#unpack、字节序、二进制读取和 NaN 这些做二进制解析时绕不过去的问题。
Steam 控制器自动充电——使用 CV 的磁吸充电底座试点项目：这是个很有意思的小项目：用摄像头光流识别位置，再通过 WebHID 控制手柄震动，引导它自己“挪”到磁吸底座上充电。做法不复杂，但把浏览器、视觉和硬件控制拼得很巧。

不少影响判断和健康的问题，其实就在身边：房间里的空气、吃进嘴里的添加剂、还有我们看嘴形时的大脑误差。

瓶颈可能在于房间里的空气：封闭会议室和居家办公空间里的 CO2 很容易升高到影响思考的水平。人在这种环境下，决策、规划和压力下处理信息的能力都会下降，而且往往自己还察觉不到。
食品防腐剂可能会增加高血压和心血管疾病的风险：法国一项大样本随访研究发现，部分防腐剂摄入较高的人，高血压和心血管疾病风险也更高。它只能说明相关性，不能直接证明因果，但足够提醒人们少吃高度加工食品。
研究揭示了人们读唇时看到的内容：研究人员给约 2 万个英语单词做了“视觉地图”，发现唇读误差并不是随机的，而是集中出现在口型相近的词之间。这对唇读训练和音视频转录模型都有用。

从宇宙到森林，再到古生物，很多旧判断都在被新数据推着重写。

天体物理学家对韦布的新宇宙感到困惑：韦布望远镜看到了大量早期宇宙中的“小红点”、超大质量黑洞和异常明亮的星系，这些东西出现得太早、太多，和传统模型不太对得上。现在有不少解释，但都还没坐实。
巨树将水输送到顶部枝叶毫不费力：最新研究：新研究发现，高大的热带树并不会因为太高就更难把水送到树冠。它们会通过更宽的输水导管和更耐旱的叶片做补偿，这可能意味着一些气候模型高估了巨树的干旱风险。
科学家在墨西哥发现了一种新的蝾螈化石物种：研究人员确认了墨西哥首个正式命名的化石蝾螈物种，也是当地已知最早的钝口螈属记录。它把墨西哥蝾螈的演化历史又往前推了一步。

互联网一边在遗忘，一边还在争论谁有资格被记住。

逝去而不被遗忘：重现消失的网络世界：旧网页消失得很快，十年前的链接今天已经坏掉一大批。互联网档案馆的 Wayback Machine 还能救回其中不少页面，说明“死网”不是抽象问题，而是已经在发生的内容流失。
Odin、维基百科与流量收割：Odin 语言的维基百科条目被删，引发了一场关于“可靠来源”和“显著性”的争吵。文章认为，这件事暴露出维基规则和现代编程社区之间的错位，也说明社交媒体很容易把小范围的内容争议炒成情绪化对立。