AI 模型与成本
本周 AI 的主线很清楚:模型继续变小,部署继续往本地走;但企业真正开始头疼的,已经是成本、安全和监管。
- Gemma 4 QAT 模型:为移动端和笔记本效率优化压缩:谷歌用量化感知训练压缩 Gemma 4,尽量少掉效果、多省内存。移动端版本把内存需求压到 1GB 以下,本地运行的门槛又降了一截。
- 上线 HN:General Instinct(YC P26)——边缘设备上的前沿模型:团队把很大的混合专家模型裁剪、量化后,做成更适合边缘设备的版本。8GB 左右显存也能跑较长上下文,说明“本地跑大模型”正在变得更实际。
- 代价开始结算:AI 成本失控之际,行业如何争分夺秒控费:单次调用在变便宜,但总调用量涨得更快,很多公司开始超支。行业正在补一门新课:像管云账单一样管 AI 账单。
- OpenAI 推出锁定模式,进一步防范提示注入攻击:OpenAI 给 ChatGPT 加了更保守的“锁定模式”,用更少的联网和自动操作,换更低的数据泄露风险。能做的事越多,边界就越要收紧。
- OpenAI 将允许美国政府在其 AI 模型发布前进行审查:OpenAI 表示愿意在模型公开前接受政府评估。监管框架还没定型,但“先发再说”的空间已经在变小。
开发基础设施与工程实践
数据库和包管理工具继续承担更多原本在外部服务里做的事。另一边,AI 写代码越普及,老办法反而越显得重要。
- pg_durable:微软开源数据库内持久化执行功能:这个 PostgreSQL 扩展想把长期任务、重试和恢复直接放进数据库里做,少依赖额外的 worker、队列和状态表。适合数据流程重、想少搭几层服务的团队。
- Redis 8.8:新增数组数据结构、限流器和性能提升:Redis 继续往“什么都能做一点”走,新增 array、窗口计数限流和更多实时分析能力,同时把持久化和复制性能也往上推。
- Ruby Bundler 的冷却支持:Bundler 新增“冷却期”,可以延迟安装刚发布的 gem,避开供应链攻击最危险的时间窗。办法很简单,但很有用。
- Supabase 在 8 个月内估值翻倍,达到 100 亿美元:AI 编程工具正在直接推高数据库服务的需求。Supabase 说过去一年数据库创建量涨超 600%,其中近 60% 是由 AI 工具发起的。
- 我的测试驱动开发智能体技能:作者的判断很直接:AI 写测试常常又空又乱,不能直接信。真想提高质量,还是得回到测试驱动开发、评审和明确的设计步骤。
- “也许以后吧”曾是一个功能:文章提醒,最有价值的代码常常是没写出来的那部分。AI 让写代码更便宜,也更容易把本不该做的功能一口气做进去。
安全与隐私
这周的安全消息很分散,但指向同一件事:攻击面越来越大,从源码、办公支持到可穿戴设备,没有哪个环节天然安全。
- Mantine-datatable(及其他项目)遭入侵——作者账号已被暂停:维护者账号被劫持,攻击者把恶意脚本塞进了
github-actions和测试链路。已发布的 npm 包暂未确认受影响,但直接拉源码和跑测试的用户有实际风险。 - 谷歌和 FBI 警告:勒索软件团伙冒充 IT 员工亲自上门入侵受害者:勒索团伙不只靠钓鱼邮件,已经开始冒充 IT 支持人员上门。线上骗术和线下接触合在一起,企业安保不能只盯邮箱和终端。
- 前网络高管转为吹哨人,指控 IBM 掩盖多起数据泄露事件:诉讼指控 IBM 多年未公开多起入侵事件,IBM 予以否认。无论案件最后怎么判,大型供应商该披露什么、何时披露,问题都摆在那儿。
- Meta 悄悄为其智能眼镜加入了人脸识别功能:报道说 Meta 在智能眼镜上测试人脸识别和姓名提示功能。争议点很清楚:一旦眼镜能“认人”,路人很难知道,也很难拒绝。
- Sirius 番茄钟:这款看起来很普通的效率应用,被怀疑实际是伪装成番茄钟的银行客户端。它提醒人们:应用商店上架,不等于可以放心安装。
算力、芯片与数据中心
AI 热潮还在往更重的基础设施走:一边是天价算力合同和更大的数据中心,另一边是终端芯片想把这股需求拉回本地设备。
- 谷歌将每月向 SpaceX 支付 9.2 亿美元用于算力:谷歌为了应对 AI 需求,向外部租用大规模 GPU,金额和规模都很惊人。这说明即便是大厂,也未必能靠自家产能接住高峰。
- AirTrunk 承诺投入 300 亿美元,在印度建设 5GW 的 AI 数据中心:印度正在变成新的 AI 基础设施争夺地,但电力、水和土地会很快变成硬约束。钱能先到位,资源不一定。
- 英伟达的 RTX Spark 芯片,或许能让 Windows 迎来真正的 Apple Silicon 时刻:NVIDIA 想用统一内存和更强图形能力,把高端 AI PC 再往前推一步。它能不能成,最后还得看价格、续航和软件适配。
- 纽约州立法者通过为期一年的新数据中心禁令:数据中心扩张已经开始遇到地方阻力。AI 算力不只是资本开支问题,也会直接碰上能耗、土地和社区承受能力。
政策与公共基础设施
政府系统一边继续数字化,一边也在重新考虑谁来提供底层服务、谁有权看数据。
- Gov.uk 已用荷兰支付服务商 Adyen 取代 Stripe:英国 GOV.UK Pay 把不少公共服务支付从 Stripe 迁到 Adyen,并加入“银行转账支付”选项。对用户来说变化不大,对政府采购和支付底层来说是一次明显换轨。
- 手机在机场被没收后会发生什么?:报道追问了美国边境搜查手机后的流程和法律边界。问题不只是“会不会被查”,而是设备被扣后,个人数据还能不能得到基本保护。
- 国会仍然无法就无令搜查监控该怎么办达成一致:美国围绕 702 条款的争议还在僵住。核心分歧没有变:情报机构的便利,是否应该继续压过普通人的隐私权。
科学与航天
老问题和新办法同时出现:空间站继续暴露老化风险,实验室里则在用 AI 和新材料找更快、更省的解法。
- 由于泄漏问题,NASA曾短暂让空间站宇航员转移到SpaceX的龙飞船内避难:国际空间站因俄方舱段泄漏再次启动临时避难。这类事越来越说明,空间站老化不是远忧,而是现实风险。
- 剑桥大学称,已成功测试一款由人工智能设计抗原的疫苗:研究团队把 AI 设计的抗原推进到人体试验,首批志愿者未见明显副作用。真正值得看的是,它能不能帮助人类更早做出面向未来变种的疫苗。
- 新方法将海水变成饮用水,且不产生废料:新海水淡化方法用太阳能热和特殊金属表面来蒸馏海水,不产生有害浓盐水,还能回收盐和锂。要是能放大规模,缺水地区会多一个更干净的选项。