AI 与模型走向
AI 的焦点正在从“做得更大”转向“做得更稳、更省、更能落地”。模型表现、幻觉率、监管和人才流动,正在一起改写竞争方式。
- GPT-5.5 的幻觉次数比采用 MIT 许可证的 GLM-5.2 高出 3 倍:文章认为,单靠堆参数、数据和算力,收益已经在变小。更大的模型未必更可靠,开放模型也在逼近闭源大模型,幻觉率和算力成本正变得更重要。
- John Jumper 将加入 Anthropic:AlphaFold 关键人物 John Jumper 宣布将离开 DeepMind,休整后加入 Anthropic。这说明顶尖研究人才仍在向头部 AI 公司集中。
- 从 PGP 到 Mythos:那些没能拦住任何人的出口管制简史:美国试图把前沿 AI 模型纳入出口管制,Anthropic 已因此临时下架相关模型。文章回顾加密和间谍软件的旧例,认为这种限制未必真能拦住技术扩散,但会直接影响企业海外业务和行业规则。
- 《帝国时代 II》中的感知机:作者在《帝国时代 II》里做出 NAND 门、感知机和训练电路,证明游戏环境也能承载计算与学习。文章借这个例子提醒:讨论大模型时,不要先把某些“人格化”结论当前提。
安全与基础设施
开放生态和公共基础设施都在承压。软件供应链、卫星导航和数据安全,问题都很现实,而且已经影响到普通用户和开发者。
- AUR 末日来临:近期 AUR 攻击一览:Arch Linux 的 AUR 最近遭遇持续攻击。攻击者接管失效包并推送恶意更新,疑似已波及 1500 多个包,社区已开始讨论更严格的接管和审核机制。
- 卫星揭示 GPS 信号篡改规模惊人:实验卫星首次从太空画出欧洲和中东的 GPS 干扰分布图,结果比预想严重得多。问题不只影响地面导航,也可能影响低轨卫星的定位、姿态控制和避碰。
- 黑客声称泄露了窃取的麦迪逊广场花园数据:这篇周报串起了几条安全和隐私新闻,包括数据泄露、脸部识别扩张和政府监控。重点不是单一事件,而是生物识别和数据收集正在更快进入日常场景。
系统、开源与工程落地
一边是基础问题始终没变,比如压缩和资源效率;另一边是新需求很直接,比如设备实时控制和系统更新节奏。
- 数据压缩详解(2012):这篇长文系统梳理了数据压缩的核心问题:压缩效果取决于你有多懂数据本身。它的要点很朴素,没有一种算法能通吃所有数据,好的压缩来自好的建模。
- 问 Hacker News:在内存紧缺的情况下,程序员会写出更高效的代码吗?:讨论的结论偏现实:多数时候,行业会先靠更便宜的硬件、调低规格或涨价来解决问题,而不是认真优化代码。真正会被迫精打细算的,还是云计算、AI 和游戏这类成本敏感领域。
- 他让你的免费视频播放器运行得顺滑流畅。现在,他正在让机器人也如此。:VLC 开发者 Jean-Baptiste Kempf 的新公司 Kyber 拿到 500 万美元融资,做的是远程设备的低延迟控制基础设施。它想解决机器人、无人机和远程运维里的一个老问题:视频、传感器和控制指令怎样稳定地同时跑。
- 微软确认 Windows 11 26H2 将于 2026 年秋季发布:微软确认 26H2 将在 2026 年秋季推出,预计仍是小型启用包更新,不会大改底层。对用户来说,重点是升级快、硬件要求不变、支持周期会顺延。
科学与应用研究
有些研究直接改写基础认知,有些则是在熟悉场景里找到更省能的新办法。
- 改变科学家对记忆看法的重大发现:奥斯瓦尔德·斯图尔德因发现神经元可在突触附近局部合成蛋白质而获奖。这一发现改变了人们对记忆形成机制的理解,也给阿尔茨海默病等疾病研究带来新方向。
- 科学家发明了一种用超声波冲泡浓缩咖啡的方法——无需热水:研究团队用超声波在室温下萃取出接近意式浓缩的咖啡,能耗可降约 75%。它现在还不够快,但说明“加热”并不一定是做咖啡的唯一办法。
边界实验与技术史
这几篇不一定实用,但很能说明技术的边界:媒介能装下什么,系统能被玩成什么,历史事故又能把内容改成什么样。
- 我把一个网站存进了网站图标里:作者把 HTML 写进 favicon 的像素里,再用 canvas 读回网页内容。容量只有约 208 字节,几乎没实际用途,但很适合拿来理解图像、编码和浏览器的工作方式。
- 1969 年摄影师罢工催生了《楼上,楼下》多元宇宙:英国电视业一次只关彩色、不关黑白的罢工,意外制造出一堆版本混乱的节目历史。它让人看到,技术限制和劳资冲突也会直接改写媒介内容本身。