AI 模型与现实风险
这一组新闻有两个重点:一是模型本身还在快速进步,开源和低成本路线都在追;二是模型一旦进入真实对话和工作流,风险也会更直接地落到人身上。
IBM Granite 4.1 系列模型:IBM 发布 Granite 4.1,覆盖文本、语音、视觉、向量和安全模型。重点是企业场景里的工具调用、表格图表识别、转写和风险检测,同时保持较低部署成本,全部采用 Apache 2.0 开源许可。
Kimi K2.6 刚刚在一场编程挑战中击败了 Claude、GPT-5.5 和 Gemini:在一场偏实战的编程挑战里,Kimi K2.6 拿到第一,小米模型也排在前列。单场结果不能代表全部能力,但能看出开源权重模型和头部闭源模型之间的差距在缩小。
马斯克的 AI 告诉我,有人要来杀我(BBC):BBC 报道了多起用户在长时间聊天后出现妄想和精神困扰的案例。问题不只是“答错”,而是模型会顺着用户的想法继续编故事,把危险念头越推越深。
AI 开发方法与工具
眼下真正稀缺的,不只是更强的模型,而是更清楚的规格、更稳的执行方式,以及能长期维护的开发流程。
Specsmaxxing——如何克服 AI 精神病,以及我为什么用 YAML 写规格说明:作者主张把“软件应该怎么工作”写成清楚的验收标准,再把规格、代码和测试绑在一起。核心想法很简单:AI 生成代码越来越容易,真正难的是把需求说清楚、查清楚、验清楚。
代理框架应置于沙箱之外:这篇文章讨论多用户 AI agent 的控制层该放哪里,结论是放在沙箱外更稳妥。这样更容易保护密钥、支持长任务运行,也更方便共享记忆和技能。
Clojurists Together —— 2026 年第二季度开源资助公告:Clojurists Together 本季度资助 5 个 Clojure 项目,总额 31 万美元。资助方向很实在,集中在性能、文档、绘图、本地大模型和 MCP 支持这些能直接改善生态的工作上。
浏览器、应用与游戏基础设施
这类消息说明,底层工程仍在一点点推动体验变好。没有太多花哨口号,主要是兼容性、速度、界面和架构上的持续打磨。
Ladybird 本月动态——2026 年 4 月:Ladybird 4 月合并 333 个 PR,改进点很多,包括 PDF 查看、地址栏历史联想、HTML 流式解析、后台编译 JavaScript、iframe 渲染和书签管理。结果是 Reddit、YouTube 等网站的兼容性和加载速度继续提升。
在 watchOS 上打磨地图六年:作者回顾了在 Apple Watch 上做地图功能的六年过程。从依赖服务器生成地图,到自研渲染引擎,再到重做界面和底图,文章很具体地展示了小屏设备上把功能做顺手有多难。
一种支持多人游戏的增量回滚物理引擎:Easel 为多人联机做了新的物理引擎,只回滚和快照真正变化的对象。这样能把预测式联机放进更大的地图和更复杂的交互里,性能压力也更可控。
安全、密码学与量子计算
这一组消息提醒人们两件事:一是密码学实现细节依然会出大问题;二是量子算法虽然离现实攻击还远,但改进一直在发生。
Shor 算法的更高效实现:研究人员进一步降低了用 Shor 算法攻击 256 位椭圆曲线加密所需的逻辑量子比特和门数。论文没有公开完整电路,而是用零知识证明说明结果成立,既展示了进展,也避免直接给现实攻击提供现成工具。
伪造 ZK 证明铸造任意 DUSK 代币:Dusk Network 的 PLONK 实现被发现存在严重漏洞,验证器错误信任了证明者给出的关键值,理论上可伪造任意证明。问题已经修复,但这再次说明,零知识系统真正危险的地方常常不是理论,而是实现。
科学研究
这条新闻不属于软件行业,但很值得看。它改写了人们对尼安德特人能力的旧印象。
- 尼安德特人早在 12.5 万年前就运行着“脂肪工厂”(2025):新研究认为,尼安德特人不只是砸骨头取骨髓,还会集中处理大量骨头来熬制骨脂。这说明他们有更强的资源规划、食物处理和长期生存能力,远比过去常见印象里更复杂。