AI 模型与智能体:更长上下文、更强编码、更像“队伍作战”
大模型发布节奏加快,重点从“会写代码”转向“能分工、能跑流程、能进办公软件”。
- Claude Opus 4.6:Anthropic 发布新模型,主打更强编码、多任务执行与长上下文(百万级 token)。并强化对速度/成本的可控性,已在 claude.ai 和云平台上线。
- GPT-5.3-Codex:OpenAI 推出新 Codex,融合编码与推理能力,速度提升 25%。定位从“写代码工具”升级为可执行长期任务的通用协作助手,先在付费 ChatGPT 上线,后续开放 API。
- Anthropic 发布 Opus 4.6,带来全新“agent 团队”功能:面向复杂任务的并行协作机制落地,支持把大任务拆给多个代理一起跑;同时把 Claude 更深地塞进 PowerPoint 等办公场景。
- 编排多个 Claude Code 会话团队:Claude Code 的“Agent teams”使用说明:主会话负责分配与汇总,队员可互相沟通并行探索。代价是 token 消耗更高,收益是更快覆盖多假设与多方案。
- 我们用智能体团队让 Opus 4.6 打造了一个 C 编译器:多代理在几乎无人干预下协作写出基于 Rust 的 C 编译器,能编译 Linux 6.9 内核;但成本不低(约 2 万美元 API 费),也暴露质量与安全边界问题。
- OpenAI 推出企业级 AI agents 的构建与管理新方案:OpenAI 推出企业代理管理平台 OpenAI Frontier,强调权限控制、连接外部数据与“入职/反馈”式管理,瞄准企业把代理当正式工具链的一部分。
- 我的 AI 落地之旅:一线开发者的真实用法:从不信任到把“简单任务外包给代理”,再到持续改进工具链,核心经验是减少打断、拆好任务、让代理在后台持续跑。
- Nanobot:OpenClaw 的超轻量替代方案:一个约 4000 行代码的个人 AI 助手项目,支持多提供商、Docker 和多聊天渠道,主打“轻量可改、易部署”,更像研究/原型工具。
- PsiACE/Skills——一个小巧的共享技能库:面向开发者的“技能文档库”,用较小规模整理 Python/Rust 等实用写法,适合做内部知识库或团队规范的起点。
- 心理测验式越狱暴露前沿模型的内部冲突:用“心理访谈 + 量表”方式诱导模型自述,论文声称能观察到自洽但可能危险的叙事与“内在冲突”,把模型安全讨论拉到更怪也更难验证的方向。
安全与隐私:漏洞、指纹、数据泄露一起上
攻击面在变大:平台在“看你装了啥”,代理在“拿到系统权限”,数据泄露在“越报越大”。
- Opus 4.6 揭露开源代码中的 500 个零日漏洞:报道称 Opus 4.6 在没有特定指令的情况下,结合工具链发现 500+ 高危开源漏洞,并能主动验证。能力提升的同时,也更需要防滥用的边界与流程。
- LinkedIn 检测 2953 款浏览器扩展插件:开源项目揭示 LinkedIn 页面加载时会探测大量 Chrome 扩展 ID,形成“扩展指纹”。这类做法会把用户的浏览器环境变成可识别的个人特征。
- OpenClaw:当 AI Agents 拿到完整系统权限。安全噩梦?:分析指出:一旦代理有全系统权限,就很容易被提示注入、工具中毒等方式劫持。结论很直接:只能放在强隔离沙箱里玩,别进主机和生产环境。
- 欧洲规模最大的高校之一遭网络攻击,瘫痪数日:罗马拉萨皮恩扎大学疑遭勒索攻击,系统停摆多天,通过备份恢复。事件再次说明:备份、隔离、恢复演练比“事后解释”更重要。
- 政务科技巨头 Conduent 数据泄露规模暴增,波及数百万更多美国人:勒索攻击后影响人数远超早期披露,多州数据(含社保号、医疗保险信息)受波及,通知流程拖得很长,典型的“关键外包商单点风险”。
- Substack 确认数据泄露:用户邮箱地址和电话号码受影响:泄露涉及邮箱、电话与部分元数据,虽不含密码/信用卡,但足以带来钓鱼与骚扰风险;更刺眼的是发现与公开之间的时间差。
- 苹果的“锁定模式”或许能让政府也打不开你的 iPhone:报道提到“锁定模式”在现实执法场景中提高取证难度。它牺牲部分功能换取更强的攻击面收缩,适合高风险人群了解并按需开启。
- ICE 和 CBP 的人脸识别 App 其实根本核验不了“你是谁”:指出移民执法中的人脸识别工具并非为街头精准核验设计,却被广泛使用,带来误判、无授权扫描、数据保存不透明等老问题。
媒体、平台与商业:科技公司更强,新闻室更弱
钱在往大平台和 AI 流量集中,媒体与创业公司都在被迫改打法。
- 《华盛顿邮报》在最关键的时候却从硅谷打了退堂鼓:TechCrunch 认为华邮在裁员与资源收缩下削弱科技报道能力,而科技巨头对信息与经济的影响却更大,新闻独立性与透明度会更难守住。
- A16z VC 希望创业者别再为离谱的 ARR 数字焦虑了:投资人提醒“ARR”常被误用成“运行率想象”,忽略留存和真实合同质量。说白了:别用虚胖数字骗自己,也别被同行吓到。
- 二级市场交易:从创始人暴富,转向员工留才神器:AI 公司用员工股票二级出售给人才“提前兑现”,作为留人手段;但也可能把上市一拖再拖,影响整个资金循环。
- 硅谷已无忠诚可言:AI 人才流动更快,“收购式招聘”更常见。对公司来说,护城河不只在技术,也在组织能否留住人、接得住交付。
- Google 订阅业务 Q4 走高,YouTube 年入 600 亿美元带飞:YouTube 订阅用户继续涨、Shorts 观看量巨大,广告与订阅双轮驱动更稳,内容生态也更向平台集中。
- Spotify 进军实体书销售,新增多项有声书功能:Spotify 把实体书也塞进 App,并用“Page Match”做纸书与有声书进度同步,目标很明确:让用户更多时间留在 Spotify,而不是亚马逊生态里。
- 亚马逊德国因“干预”第三方 Marketplace 定价被罚 7000 万美元:监管认为亚马逊用下架/降权等方式影响第三方定价,构成反竞争。平台既当裁判又当运动员的问题,还会继续被盯。
- 比特币价格跌破 6.5 万美元:比特币短期大跌,回到 2024 年大选后低位区间。对“高波动资产=高确定性叙事”的幻想,又一次被价格教育。
开发与系统:小 Bug 也能把体验拖垮
从浏览器到系统备份,再到 UI 框架,问题往往不宏大,但会真实影响工作。
- 心碎了:Safari 渲染特定 emoji 字体(Noto Color Emoji)时布局耗时暴涨,页面性能可差到 100 倍。作者用 Claude 辅助定位并提交了复现,临时建议是改用 Apple Color Emoji。
- 塔霍时光机:Time Machine 可能会静默停止备份,且不提示错误;问题与 SMB 默认设置变化有关。结论很朴素:别迷信“自动备份”,要定期抽查是否真的在跑。
- Tahoe 版 SwiftUI 表格 Bug:SwiftUI 的 Table 被曝内存泄漏与性能衰退,哪怕数据量受控也会越跑越慢。对依赖 SwiftUI 做数据面板的人,这是需要绕开的坑。
- AEQuery:一个命令行工具,用类似 XPath 的表达式查询支持脚本的 macOS 应用,并以 JSON 输出结果。对自动化和测试脚本来说很实用。
- 都 2026 年了,直接用 Postgres 吧:文章反对“一个需求一个数据库”的碎片化,强调 Postgres 通过扩展覆盖搜索、向量、时序等常见需求,减少运维复杂度;观点偏强势,但提醒了成本与复杂性的真实代价。
- MenuetOS——从一张软盘就能启动的图形界面操作系统:一个用 64 位汇编写的极小型 GUI 操作系统,追求紧凑与高效。它不一定实用,但很适合用来理解“操作系统还能有多简单”。
太空与能源:算力上天、卫星加密、聚变降成本
能源与算力的瓶颈在地面越来越明显,于是有人把算盘打到太空与聚变上。
- Elon Musk 要认真搞轨道数据中心了:马斯克推动 SpaceX 与 xAI 合并,并向 FCC 申请轨道数据中心网络。核心卖点是太空太阳能更“便宜”,但工程与维护挑战会非常硬。
- 潜在的 Starlink 竞争对手刚拿到 FCC 批准,将发射 4,000 颗卫星:Logos Space Services 获批建设低轨宽带星座,计划到 2035 年发射 4000+ 卫星,面向政府与企业市场。卫星互联网的竞争还在加码。
- NASA 宇航员如今执行登月任务也能带手机了:NASA 放开宇航员携带智能手机,先用于 Crew-12 和 Artemis II。意义不在“带手机拍照”,而是让现代硬件进入航天任务的审批流程更顺。
- Pacific Fusion 找到更省钱的办法让它的聚变反应堆跑起来:通过磁场微量预热燃料颗粒,试图减少聚变点火前的复杂设备需求,目标是把惯性约束聚变的成本打下来;离商业化仍远,但方向更务实。
- 特朗普的关键矿产储备计划,等于承认未来属于电动化:美国拟投入 117 亿美元建立关键矿产储备,降低供应链风险。电动化、风电等产业对锂、钴、稀土的依赖,会把资源问题推到更前台。