AI 模型与研究
这一轮 AI 新闻有两个很清楚的方向:一边是更强的模型开始公开,但限制也更重;另一边是研究继续提醒大家,很多活并不是“把一切交给大模型”就会更好。成本、工具设计和老办法,仍然很重要。
- 如果 Claude Fable 停止帮你,你就永远不会知道:Anthropic 在模型卡里写明,遇到某些前沿 AI 开发请求时,Claude 可能被“静默降级”,而且不会通知用户。问题不只是答得差,而是用户分不清到底是模型失误,还是被政策偷偷改了手脚。
- Anthropic 的 Claude Fable 5 是 Mythos 的一个版本,公众今天就可以使用。:Anthropic 首次把更强的一档模型能力放给公众,但加了很严的护栏。高风险请求会自动转到较弱模型处理,企业用户还要接受 30 天数据保留。
- 科技公司能学会爱上更便宜的 AI 模型吗?:越来越多公司开始认真算账。很多任务未必需要最贵的大模型,合理分流后,小模型也能把大部分工作做完,还能大幅降本。
- Grep 就是你所需要的吗?Agent Harnesses 如何重塑代理式搜索:这项研究发现,在一些长上下文任务里,
grep式检索常常比向量检索更准。但真正决定效果的,不只是检索方法,还有代理框架怎么组织工具、怎么展示结果。 - LLM 能胜过传统超参数优化算法吗?:答案目前是否定的。固定预算下,CMA-ES、TPE 这类老算法整体还是强于 LLM 代理;把两者结合的混合方案反而最好。
- 通过 Kolmogorov-Arnold 网络实现 FPGA 上的超高速机器学习:作者把 KAN 放到 FPGA 上做超低延迟推理和在线学习。核心原因很直接:这类网络的一维激活函数很适合用查找表实现,速度快,硬件开销也小。
苹果与 WWDC 2026
苹果这次没有把重点放在“炫技”上,而是把 AI 塞回 Siri 和系统应用里,同时修修补补一堆老问题。方向很明确:更实用,但也更依赖新硬件、更受地区规则影响。
- WWDC 2026:Siri AI、iOS 27、Apple Intelligence 等全部重磅发布:苹果公布了新版 Siri、iOS 27 和整套 Apple Intelligence 更新,同时继续调整 Liquid Glass 设计。发布会的基调很务实,先补长期被抱怨的问题,再慢慢加新功能。
- Siri AI 首次体验:苹果重建的 AI 助手在 iPhone、iPad 和 Mac 上的表现如何:新版 Siri 的入口更多,能结合屏幕和上下文回答问题,反应也更快。实际体验看,它更像一个不错的起点,而不是最后答案。
- 苹果想让欧洲先眨眼:苹果称,欧盟《数字市场法》要求的互操作性会影响新版 Siri 在欧盟上线;欧盟则反驳说,法规没拦着苹果发功能。双方的分歧,实质上还是“开放”和“控制”怎么取舍。
- 苹果表示,如果某些应用无法吸引用户,可能会将其从 App Store 下架:苹果开始更明确地清理低质量、同质化严重、长期不更新的应用。对开发者来说,靠简单模板和堆数量混日子的空间会更小。
- Apple 将流媒体式订阅套餐带到了 App Store:App Store 允许跨公司做订阅捆绑包,还能推出只能打包买的“Suites”。这会让订阅类应用更像流媒体套餐,也给开发者多一种卖法。
- Xcode 27 发布公告:Xcode 27 加强了编码助手、协作和测试能力,支持 Swift 6.4 和新 SDK。但代价也很直接:不再支持 Intel Mac,部署底线也继续提高。
开发工具与开源生态
这一组新闻很一致:默认设置变得更保守,旧包袱继续清掉;真正好用的工具,往往还是那些朴素、直接、能帮你定位问题的东西。
- Alpine Linux 3.24.0 发布:Alpine 3.24 带来一批基础软件更新,也继续做减法:移除部分 GTK2、Qt5 和 libsoup 2 包。安装器则更实用,补上了 Limine、IPv6 和串口控制台支持。
- NPM v12 即将推出的重大变更:npm 12 将默认禁止依赖安装脚本、Git 依赖和远程 URL 依赖,除非显式放行。方向很清楚:少一点“装包顺手执行代码”的隐患,多一点可审计的白名单。
- 测试用例缩减器:被低估的调试利器:测试用例缩减器不会“理解”程序,但它能稳定地把出错输入压小,帮你更快找到根因。关键在于把“有趣性测试”设计好,不只盯着长度,也可以盯崩溃频率、运行时间和非确定性。
- LD_DEBUG 环境变量(2012):这篇老文章仍然很实用。排查 Linux 动态链接问题时,
LD_DEBUG往往比瞎猜快得多,配合strace、ldd、objdump一类工具,能很快看出库到底是怎么被加载错的。
安全与隐私
安全新闻里最刺眼的,不是“未来风险”,而是眼前正在发生的事:已有漏洞被勒索团伙打,缓存和图片都能变成投递通道,实名和追踪也在继续往前推。
- Exif 隐写携带:这个概念验证把载荷藏进 JPG 的 Exif 元数据里,再利用浏览器图片缓存取出第二阶段代码。它说明一个老问题:很多看上去“只是图片”的路径,也能变成投递链的一部分。
- CISA要求美国联邦机构在三天内修复一个正遭勒索软件团伙攻击的VPN漏洞:被 Qilin 利用的 Check Point 漏洞已经在打真实目标。CISA 直接给出三天期限,说明这不是“理论风险”,而是正在扩散的攻击面。
- FCC 想通过强制电信公司获取所有客户的身份证件来一举消灭“烧号手机”:FCC 拟要求运营商收集并保存更多身份信息,以打击诈骗。批评者担心,这会让匿名通信更难,也会伤到记者、家暴受害者等真正需要隐私的人。
- 公司将把手机、AirPod 和智能手表追踪器加入到自动车牌识别系统中:自动车牌识别摄像头若再叠加蓝牙设备标识采集,就不只是追车,而是更容易追到具体的人。监控系统的颗粒度又往前走了一步。
- 法国政府的内部消息服务在一次安全漏洞中遭到入侵:法国政府内部消息系统 Tchap 遭入侵,攻击者声称拿到了文件、LDAP 凭据、邮箱和会议链接。即便系统部分聊天支持端到端加密,外围资料泄露也足够麻烦。
基础设施、能源与出行
数据中心、电网和电动车,正在越绑越紧。云厂商在改网络,车厂在做储能和回电,电动车新品则要在更冷的市场里证明自己能卖。
- 亚马逊大规模扁平数据中心网络:AWS 把随机图网络真正落到了生产环境里,并从 2026 年起成为多数新建数据中心的默认设计。按其数据,这种方案能少用很多路由器,还能提高吞吐、降低功耗和运维成本。
- 通用汽车加入竞逐,为 AI 数据中心和电网打造电池:GM 不只卖车,也开始押注储能,先上磷酸铁锂,再推进钠离子方案。目标很现实:AI 数据中心和电网都在抢电,车厂也想吃到这块市场。
- 通用汽车的电动车很快将支持更多类型的公共充电桩:GM 推出统一的 Energy Pass,打通更多公共充电网络,同时通过固件更新补上更完整的 V2G 能力。车不只是交通工具,也被当成可调度的电池。
- Rivian开始交付其至关重要的R2 SUV:R2 是 Rivian 向大众市场走的关键一步。更低的起售价和后续更便宜的版本,会直接决定它能不能从“小众电动车品牌”变成更大规模的车企。