AI 模型、能力与管控
这一组消息有两条主线:一是模型训练和推理还有不少基本问题要继续打磨;二是模型越强,安全、出口和使用边界就越难绕开。
- 慎重看待规模定律:系统回顾了大模型“参数、数据、算力”之间的经验规律,也提醒人们别把它当成万能公式。数据是否充足、训练是否均衡、统计口径是否一致,都会影响判断。
- 矩阵正交化提升循环模型的记忆能力:研究显示,在 mLSTM 的读取过程中加入正交化,可以明显提升关联记忆任务表现。结果还停留在小模型和合成任务上,但方向值得看。
- Leanstral 1.5:Mistral 更新了面向 Lean 4 定理证明的模型,主打长上下文和形式化证明。重点不是通用聊天,而是把模型往严谨推理和自动形式化上推。
- 特朗普政府将取消对 Anthropic 的 Mythos 和 Fable AI 模型的出口管制:美国将放开对 Anthropic 两款模型的出口限制,条件是公司加强监测和安全防护。这说明监管思路正从直接封锁,转向“先放行、再加约束”。
- Claude 帮黑客找到了一条路,几乎能给美国所有音乐节“发票”:研究员借助 Claude 找到票务平台漏洞,差一点拿到几乎全站级权限。平台修得很快,但事件说明,AI 已经能明显降低漏洞发现门槛。
开源、开发工具与知识基础设施
这里能看到开发社区的一个现实:一边在加快工具链和协作效率,另一边也在努力挡住低质量自动化内容。
- Godot 将不再接受 AI 生成的代码贡献:Godot 明确禁止 AI 生成代码和 AI 代理提交 PR,原因很直接:维护者扛不住“AI 垃圾”。简单辅助仍可用,但要披露。
- ArXiv 的新篇章:arXiv 将脱离康奈尔大学,改组为独立非营利组织。核心承诺没变:免费阅读、免费投稿,尽量不打扰现有用户。
- Google Copybara:在代码库之间迁移代码:谷歌开源的代码迁移工具,适合在私有库和公开库之间同步代码。它强调一个“权威源”,用规则把代码安全地搬来搬去。
- Pystd:功能相近,编译时间却只需一小部分:作者自研了一套轻量 C++ 标准库替代品,目标是大幅缩短编译时间。对被 C++ 编译速度折磨的人来说,这类尝试很有吸引力。
- Ante:一种融合借用检查与引用计数的新方式:Ante 试图把借用检查和引用计数结合起来,在安全和灵活之间找新平衡。还在开发期,但思路对语言设计很有启发。
- C 语言的单头文件解析器组合子:这是一个纯 C99 的解析器组合子库,单头文件、零拷贝、无隐藏分配。它想解决的是:既不想手搓解析器,也不想被生成器工具链拖累。
平台、系统与终端产品
这一组的共同点很清楚:厂商一边把 AI 和新能力塞进设备,一边又用认证、订阅和权限把边界收得更紧。
- Gemini Spark 登陆 Google 的 Gemini macOS 应用:Google 正把更像“代理”的 Gemini Spark 推到 macOS,可代用户整理 PDF、根据本地文件生成表格。它代表的是桌面 AI 从“回答问题”走向“代做操作”。
- 在 GrapheneOS 上锁定 Bootloader 能通过 Strong Integrity 吗:实测表明,即便锁回 Bootloader,GrapheneOS 也过不了 Google 的 Strong Integrity。原因不在系统本身,而在 Google 不给自定义 ROM 硬件认证。
- Meta 为其智能眼镜的 Conversation Focus 功能设置了速率限制:Meta 给本地运行的降噪听音功能也加了时长限制,免费每月 3 小时,付费最多 15 小时。产品能力没变,使用方式先变得更像订阅服务了。
- Discord 现已原生支持 Meta Quest 头显:Discord 终于在 Quest 上原生落地,不用再靠侧载。对 VR 用户来说,这是很实际的一步,沟通和直播都顺手不少。
- 三星预告一款宽得离谱的新折叠屏手机:三星暗示下一代折叠屏会改机身比例,重点不是更像直板机,而是展开后更偏宽屏体验。它说明折叠屏还没定型,厂商还在试答案。
公司、市场与互联网行业
资本市场和老牌基础设施都在变动:有人给员工套现留人,有人合并失败,有人破产重组,也有人正式离场。
- “互联网之父”终于要退休了:Vinton Cerf 将结束在谷歌二十多年的工作。他离开前提到的一点很重要:AI 代理越来越多,系统之间的标准和互操作会比过去更关键。
- Wayve 以 85 亿美元估值启动 8500 万美元员工要约收购:Wayve 让员工出售部分已归属股权,给早期成员一点流动性,也顺手稳住团队。AI 和自动驾驶公司越来越常用这种方式留人。
- 美国放行、英国搅黄:Getty 与 Shutterstock 的合并告吹:Getty 和 Shutterstock 的合并最后被英国监管卡住,交易终止。说明内容分发和图片授权这类老行业,反垄断压力并没有变小。
- Dish 申请破产,但并未停业:EchoStar 申请破产保护,但 Dish TV、Sling TV、Boost Mobile 等业务继续运转。问题核心还是债务、频谱交易延迟和无线业务现金流吃紧。
科学进展与科技史
这组消息里,一边是生殖医学和地球观测的实打实进展,一边是对技术历史的保存。
- 首批由干细胞培育的人类早期卵细胞:研究团队用诱导多能干细胞构建“迷你卵巢”,得到早期人类卵细胞样结构。这离临床还很远,但对体外配子生成是一步关键推进。
- 太空激光揭示委内瑞拉地震如何重塑了地壳:卫星对比震前震后数据,显示地表出现了明显位移。价值不只是好看,而是能更快帮助灾后评估和救援判断。
- 将韩国首款个人电脑“SE-8001”登记为国家重要资料:韩国开始用国家制度系统保存重要科技实物,SE-8001 是代表案例。科技史如果不及时存,往往就真的丢了。