AI 模型与编码代理:更快、更便宜,也更像“工具链问题”
模型在拼速度、上下文和编码能力;但很多效果取决于接口、工作流和硬件,而不只是“换更大模型”。
- GPT‑5.3‑Codex‑火花:OpenAI 给 Codex 做了一个超低延迟小模型研究预览版,主打实时改代码;128k 上下文,配合 Cerebras 硬件可做到很高吞吐,先向 ChatGPT Pro 开放。
- Gemini 3 深度思考:谷歌把 Deep Think 定位在科研与工程难题,强调推理与专业知识结合;已向 Ultra 订阅与部分 API 用户开放。
- MiniMax M2.5 发布:SWE-bench Verified 得分 80.2%:MiniMax 押注强化学习与智能体任务,强调编码与工具调用能力,同时把“成本低、能跑更久”当卖点。
- 一个下午让 15 个 LLM 的编程能力起飞:只改了 Harness:作者认为瓶颈常在“模型怎么改代码”的接口;用带哈希的行标签让模型定位修改点,能显著提升多模型修复成功率。
- Launch HN:Omnara(YC S25)——随时随地运行 Claude Code 和 Codex:主打把编码代理跑在本地,再用网页/手机远程操控;断线可切云端沙箱,商业模式按会话次数收费。
- Spotify 表示:多亏了 AI,他们最顶尖的开发者从 12 月起就一行代码都没写过:Spotify 宣称内部 AI 工具把开发流程“代写化”,把重点放在产品迭代与数据优势上,但也会引发对质量与责任边界的疑问。
- AI 聊天机器人在提供医疗建议方面,比我们想的还要离谱:研究指出在真实问诊语境里,用户用聊天机器人更容易走偏;问题不只在知识点,还在信息不完整、回答不稳定和误导性自信。
AI 资本与公司动向:钱更集中,争议也更集中
大额融资、政治捐款和宏大叙事绑在一起,AI 公司的“技术路线”之外,多了更现实的博弈。
- Anthropic 在 G 轮融资中筹集 300 亿美元,投后估值达 3800 亿美元:Anthropic 宣布 300 亿美元融资,资金用于研究、产品和基础设施;同时强调 Claude Code 等企业产品带来的收入增长。
- OpenAI 总裁向特朗普捐了数百万。他说这是为了全人类:Brockman 以个人名义向支持特朗普的超级政治行动委员会捐款,引发外界与公司内部争议;OpenAI 表态捐款不代表公司立场。
- 马斯克急需为 SpaceX 和 xAI 打造新愿景,于是他把目光投向了 Moonbase Alpha。:马斯克把 AI 与航天愿景打包到“月球超级算力”叙事里,技术与成本都极难,但对融资与招人很有用。
- Didero 拿下 3000 万美元融资,让制造业采购走上“智能体”自动驾驶模式:用生成式 AI 读邮件/聊天记录、写回 ERP,把采购到付款流程自动化,瞄准制造商与分销商。
自动驾驶:硬件迭代、运营扩张,以及法规卡点
车能跑得更稳、更久,但能不能“无司机上路”,很多时候取决于地方规则与公众接受度。
- 与第六代 Waymo driver 一起开启全自动驾驶运营:Waymo 发布第六代系统,强调更强传感器、更低成本、更好坏天气可靠性,为扩大城市运营做准备。
- Aurora 的无人驾驶卡车如今能比人类司机跑得更远、更快:无人卡车在长途线路上能连续跑完人类受法规限制的时长,直接提高运输效率;公司仍在亏损但运营在扩张。
- Waymo 呼吁 DC 公众向市政府官员施压:Waymo 为进入华盛顿特区无司机运营而游说,公开动员市民施压立法,反映法规仍是关键瓶颈。
苹果与设备生态:安全补丁在前,AI 助手在后
系统更新优先修漏洞;“AI 版 Siri”继续拖延。内容生态上,Vision Pro 终于补上 YouTube 这块短板。
- iOS 26.3 和 iPadOS 26.3:修复多个安全问题,其中包含被用于“复杂攻击”的漏洞;也有用户反馈部分使用体验问题仍在。
- macOS 26.3:以修复与安全为主,变化不大;有界面问题改善,但一些关键框架 bug 仍未解决。
- macOS 15.7.4 和 macOS 14.8.4:面向旧版本的安全更新,建议尽快安装。
- visionOS 26.3:主要是漏洞修复与安全提升。
- 据称,Apple 的 Siri 重新上线已延期:新版 Siri 测试不稳、响应慢,改成分阶段上线,时间表继续后移。
- YouTube 终于为 Apple Vision Pro 推出了专属 App:Vision Pro 原生 YouTube 应用上线,支持离线下载与更高规格播放等功能,补齐平台长期缺口。
平台治理与监管:从广告、邮件到开源商标战
很多“用户体验事故”不是大问题,但会直接把企业的合规、支持和治理短板暴露出来。
- 欧洲大型支付处理商无法向 Google Workspace 用户发送邮件:Viva.com 的验证邮件缺少推荐的 Message-ID 头,被 Google Workspace 拒收,用户收不到注册链接;更糟的是客服不承认问题。
- 据称欧盟对 Google 的广告定价再启一项调查:欧盟继续盯紧谷歌广告竞价与定价行为,若认定违规可能面临重罚。
- Automattic 计划对 10 家竞争对手收取版税费用,WP Engine 在最新文件中称:WordPress 生态的商标与“贡献/收费”纠纷升级,法律战背后是开源项目治理与商业化边界问题。
- 在年龄验证难题中迎接 Discord 用户:Discord 要求年龄验证引发用户外流,Matrix 注册暴涨;Matrix 也面临同样的合规压力,正在评估更隐私友好的验证方式。
- WhatsApp 在俄罗斯现已被全面封锁:俄罗斯封锁 WhatsApp 并推动用户转向可监控替代品,跨境通信与隐私空间进一步收缩。
- 埃隆·马斯克的 X 疑似违规向伊朗领导人出售 Premium 账号,或触犯美国制裁规定:调查称 X 向受制裁的伊朗官员提供付费蓝标与推广能力,可能触碰制裁红线;平台在曝光后才部分处理。
开发者与基础设施:数据格式、内核驱动、运行时和“在浏览器里跑系统”
这些项目不热闹,但决定了性能上限、工程可靠性和生态是否能长久。
- Apache Arrow 十岁了:Arrow 十年,列式内存数据交换格式趋于稳定,多语言与跨系统生态成熟,成为数据基础设施的“通用件”。
- Tyr:Arm Mali 硬件的 Rust GPU 驱动未来展望:Rust 写 GPU 驱动的原型已能跑 3D 游戏并进内核,但离可用还缺电源管理、恢复等关键环节;它更像试验田。
- Select 到磁盘之间的三层缓存:把 Postgres 读路径拆成 shared buffers、OS 页缓存、磁盘三层讲清楚,并用案例说明“索引不对”会把 IOPS 直接打爆。
- Show HN:从数据生成 Web 界面:syntux 让你给一个 value 就生成 UI,通过 JSON schema 流式渲染,而不是吐一堆源代码,强调可控与复用。
- 通过 WASM 在浏览器里运行 Pebble OS:把 QEMU 编译成 WASM,在浏览器里启动真实 Pebble 固件;更像一个“可跑的技术展示”。
- 我在 2025 年写了一个 Scheme:scheme-rs 发布稳定版,测试覆盖推进明显;作者也把它当作重拾编程热情的长期项目。
- Escrcpy - 免费开源!电脑控制安卓手机的投屏工具 (屏幕镜像 / 无线 / AI 自动化 / 录屏):开源跨平台投屏与控制工具,支持 USB/Wi‑Fi、多设备、录屏等;偏实用型生产力软件。
公共讨论与城市问题:工具能帮忙,但分配机制更难
技术能提高协商效率,但城市活力和商业生态,最后还是落在利益怎么分。
- Polis:面向大规模公民协商的开源平台:Polis 2.0 强调可扩展架构、观点聚类、多语言翻译与 AI 审核,目标是让大规模讨论更容易收敛出共识。
- 用土地增值收益捕捉机制拯救零售业:文章把零售困境拆成“价值被房东与周边吸走”,主张用不同的价值回收与再分配机制,为城市公共空间和小商户续命。
文化与个人写作:对 AI 内容的反弹正在出现
效率工具越强,人们越在意“这是不是你写的”“你到底想说什么”。
- AI 速读版:作者支持 AI 写代码提效,但对 AI 代写文章很不信任,担心网络内容变得更空、更像“死网”。
- 文化,是框架的群体同步:从日本地铁排队规则讲文化如何靠模仿与自我强化形成:不一定最有效,但能维持秩序。
- 闭嘴:评论屏蔽器:一款默认隐藏网页评论的应用/扩展,想看再点开,主打减少情绪污染与不必要的注意力消耗。
游戏与娱乐:从春节离线游戏到行业动荡
一边是更轻量的“路上消磨时间”,另一边是大厂裁员、罢工和内容版权收拢。
- 春节长途旅行,这 6 款耐玩小游戏先备好:推荐 6 款离线单机游戏,覆盖卡牌、模拟、优化与沙盒建造,适合长途无网场景。
- PlayStation State of Play 2026 年 2 月:全部新闻与预告片:索尼一小时发布会主打第三方与自家工作室新作,集中放出后续阵容与演示。
- 1,200 名 Ubisoft 员工因裁员发起罢工:裁员、强制返岗引发员工罢工,反映游戏行业在成本压力下的劳资冲突升级。
- Apple 拿下《Severance》全部版权,未来季将由自家团队操刀制作:苹果把热门剧集版权与制作收回到内部,强化对内容与成本的掌控,也是在流媒体竞争里“把核心资产抓牢”。