AI 与模型开放
更强的模型还在继续放开,但方式更谨慎了:先小范围试用,再看安全和监管能不能跟上。
- DeepSeek 开源推理优化,实现 60–85% 更快的生成速度 [pdf]:论文标题给出的核心信息很直接:这是一次面向推理阶段的开源优化,目标是把生成速度提升 60% 到 85%。如果结果稳定,这类优化会直接影响模型响应时间和推理成本。
- 特朗普政府允许 Anthropic 向部分美国机构发布 Mythos:Anthropic 最强的网络安全模型 Mythos 5 获准重新向 100 多家美国机构开放,但还不是全面恢复。消费者版本 Fable 5 何时回来,仍不清楚。
- OpenAI 面向“少数值得信赖的合作伙伴”推出 GPT-5.6 限量预览版:OpenAI 先把 GPT-5.6 放给少数合作方试用,再逐步扩大范围。新系列分成高性能、均衡和低成本三档,重点加强了推理和安全防护。
安全与隐私
攻击越来越像正常工作流程,防守也不能只盯着代码本身。人、工具链和数据暴露面,都是入口。
- 一次失败的(民族国家?)攻击剖析:这是一起很有代表性的供应链攻击。攻击者假装招聘和面试,引诱开发者下载带后门的代码仓库,再借构建流程植入远控木马。手法不新,但伪装得更深,更接近日常工作。
- DeleteMe 真的能把你的信息从网上清掉吗?我试了试:实测结果是,这类服务确实能减少公开的个人信息,但做不到一次解决。原因很简单:数据经纪商多、规则不统一、删除后还可能再次出现。
性能优化与工程实践
这组内容的共同点是朴素:少讲概念,多讲代价、边界和实做方法。
- Manticore 中更快的 KNN 搜索:两阶段 HNSW、批量距离计算与 AVX-512:Manticore 通过两阶段搜索、批量距离计算和 AVX-512 指令优化,在高 k 和并发场景下把向量检索吞吐继续往上推。好处是升级即可获得收益,不用改 API,也不用重建索引。
- 地狱般缓慢的 13 级 Deflate 压缩:这是一个很好的工程取舍案例。13 级压缩比 12 级只多省了 0.134% 的体积,时间却多花了 56.4 倍。结论很清楚:除非是“一次压缩、长期分发”,否则不值得。
- 金融科技工程手册:这篇手册抓住了金钱系统最重要的几条底线:不能凭空多钱,不能丢账,不能轻信外部输入。围绕记账、审计、幂等、对账和可恢复流程,给出了一套很实用的工程框架。
- 老旧硬件上的 Linux:完整复活指南:文章把“旧电脑怎么继续用”说得很具体:先按内存和 CPU 选轻量发行版,再用 zram、swappiness 和服务裁剪去抠性能。真正最有效的升级还是 SSD。
开源软件与底层技术
一边是新版本和新工具,一边是对旧硬件的深入拆解。两种工作都很有价值。
- IBM MCGA 门阵列逆向工程:作者逆向分析了 IBM MCGA 图形芯片的关键门阵列,挖出了不少过去不公开的寄存器和测试模式。这类工作不只是怀旧,也是在补底层文档的空白。
- OpenTTD 16.0-Beta1:OpenTTD 16 的首个测试版已经放出,火车倒车、多人公司开放加入、地图生成和界面筛选等功能都有更新。对老牌开源游戏来说,这是一次很扎实的版本推进。
- Fusion 编程语言:Fusion 的想法很直接:用一份代码生成多种目标语言的可读实现。它不走虚拟机路线,而是直接输出目标语言代码,适合想复用核心逻辑、又不想引入重型运行时的团队。
公司、芯片与人才流动
大公司现在同时在抢人、抢芯片,也在补自己的基础设施短板。
- 苹果据称正寻求从一家被美国列入黑名单的中国公司购买芯片:苹果据报正寻求批准,从长鑫存储采购芯片,以缓解存储芯片供应压力。这件事敏感的地方不在技术,而在地缘政治和供应链风险。
- 据报道,负责 Vision Pro 的苹果高管将离职加盟 OpenAI:负责 Vision Pro 和智能眼镜项目的苹果高管将转去 OpenAI 硬件部门。OpenAI 明显不只想做模型,也在为自己的 AI 设备团队补关键人才。
- FTC 允许马斯克收购由 SpaceX 校友创办的初创公司 Mesh:Mesh 做的是数据中心高速光通信硬件,创始人来自 SpaceX。若交易完成,SpaceX 可能把这类能力用于更高效的地面和未来太空数据传输。
科学与航天
有些进展不靠大新闻刷屏,而是靠一米一米地走出来。
- 毅力号火星马拉松:毅力号在火星表面累计行驶 42.195 公里,正式跑完一场马拉松。它用了 5 年多时间达成这个里程碑,还在继续寻找生命迹象。