每日科技摘要-02-06-早报

AI 模型与智能体：更长上下文、更强编码、更像“队伍作战”

大模型发布节奏加快，重点从“会写代码”转向“能分工、能跑流程、能进办公软件”。

Claude Opus 4.6：Anthropic 发布新模型，主打更强编码、多任务执行与长上下文（百万级 token）。并强化对速度/成本的可控性，已在 claude.ai 和云平台上线。
GPT-5.3-Codex：OpenAI 推出新 Codex，融合编码与推理能力，速度提升 25%。定位从“写代码工具”升级为可执行长期任务的通用协作助手，先在付费 ChatGPT 上线，后续开放 API。
Anthropic 发布 Opus 4.6，带来全新“agent 团队”功能：面向复杂任务的并行协作机制落地，支持把大任务拆给多个代理一起跑；同时把 Claude 更深地塞进 PowerPoint 等办公场景。
编排多个 Claude Code 会话团队：Claude Code 的“Agent teams”使用说明：主会话负责分配与汇总，队员可互相沟通并行探索。代价是 token 消耗更高，收益是更快覆盖多假设与多方案。
我们用智能体团队让 Opus 4.6 打造了一个 C 编译器：多代理在几乎无人干预下协作写出基于 Rust 的 C 编译器，能编译 Linux 6.9 内核；但成本不低（约 2 万美元 API 费），也暴露质量与安全边界问题。
OpenAI 推出企业级 AI agents 的构建与管理新方案：OpenAI 推出企业代理管理平台 OpenAI Frontier，强调权限控制、连接外部数据与“入职/反馈”式管理，瞄准企业把代理当正式工具链的一部分。
我的 AI 落地之旅：一线开发者的真实用法：从不信任到把“简单任务外包给代理”，再到持续改进工具链，核心经验是减少打断、拆好任务、让代理在后台持续跑。
Nanobot：OpenClaw 的超轻量替代方案：一个约 4000 行代码的个人 AI 助手项目，支持多提供商、Docker 和多聊天渠道，主打“轻量可改、易部署”，更像研究/原型工具。
PsiACE/Skills——一个小巧的共享技能库：面向开发者的“技能文档库”，用较小规模整理 Python/Rust 等实用写法，适合做内部知识库或团队规范的起点。
心理测验式越狱暴露前沿模型的内部冲突：用“心理访谈 + 量表”方式诱导模型自述，论文声称能观察到自洽但可能危险的叙事与“内在冲突”，把模型安全讨论拉到更怪也更难验证的方向。

安全与隐私：漏洞、指纹、数据泄露一起上

攻击面在变大：平台在“看你装了啥”，代理在“拿到系统权限”，数据泄露在“越报越大”。

Opus 4.6 揭露开源代码中的 500 个零日漏洞：报道称 Opus 4.6 在没有特定指令的情况下，结合工具链发现 500+ 高危开源漏洞，并能主动验证。能力提升的同时，也更需要防滥用的边界与流程。
LinkedIn 检测 2953 款浏览器扩展插件：开源项目揭示 LinkedIn 页面加载时会探测大量 Chrome 扩展 ID，形成“扩展指纹”。这类做法会把用户的浏览器环境变成可识别的个人特征。
OpenClaw：当 AI Agents 拿到完整系统权限。安全噩梦？：分析指出：一旦代理有全系统权限，就很容易被提示注入、工具中毒等方式劫持。结论很直接：只能放在强隔离沙箱里玩，别进主机和生产环境。
欧洲规模最大的高校之一遭网络攻击，瘫痪数日：罗马拉萨皮恩扎大学疑遭勒索攻击，系统停摆多天，通过备份恢复。事件再次说明：备份、隔离、恢复演练比“事后解释”更重要。
政务科技巨头 Conduent 数据泄露规模暴增，波及数百万更多美国人：勒索攻击后影响人数远超早期披露，多州数据（含社保号、医疗保险信息）受波及，通知流程拖得很长，典型的“关键外包商单点风险”。
Substack 确认数据泄露：用户邮箱地址和电话号码受影响：泄露涉及邮箱、电话与部分元数据，虽不含密码/信用卡，但足以带来钓鱼与骚扰风险；更刺眼的是发现与公开之间的时间差。
苹果的“锁定模式”或许能让政府也打不开你的 iPhone：报道提到“锁定模式”在现实执法场景中提高取证难度。它牺牲部分功能换取更强的攻击面收缩，适合高风险人群了解并按需开启。
ICE 和 CBP 的人脸识别 App 其实根本核验不了“你是谁”：指出移民执法中的人脸识别工具并非为街头精准核验设计，却被广泛使用，带来误判、无授权扫描、数据保存不透明等老问题。

媒体、平台与商业：科技公司更强，新闻室更弱

钱在往大平台和 AI 流量集中，媒体与创业公司都在被迫改打法。

《华盛顿邮报》在最关键的时候却从硅谷打了退堂鼓：TechCrunch 认为华邮在裁员与资源收缩下削弱科技报道能力，而科技巨头对信息与经济的影响却更大，新闻独立性与透明度会更难守住。
A16z VC 希望创业者别再为离谱的 ARR 数字焦虑了：投资人提醒“ARR”常被误用成“运行率想象”，忽略留存和真实合同质量。说白了：别用虚胖数字骗自己，也别被同行吓到。
二级市场交易：从创始人暴富，转向员工留才神器：AI 公司用员工股票二级出售给人才“提前兑现”，作为留人手段；但也可能把上市一拖再拖，影响整个资金循环。
硅谷已无忠诚可言：AI 人才流动更快，“收购式招聘”更常见。对公司来说，护城河不只在技术，也在组织能否留住人、接得住交付。
Google 订阅业务 Q4 走高，YouTube 年入 600 亿美元带飞：YouTube 订阅用户继续涨、Shorts 观看量巨大，广告与订阅双轮驱动更稳，内容生态也更向平台集中。
Spotify 进军实体书销售，新增多项有声书功能：Spotify 把实体书也塞进 App，并用“Page Match”做纸书与有声书进度同步，目标很明确：让用户更多时间留在 Spotify，而不是亚马逊生态里。
亚马逊德国因“干预”第三方 Marketplace 定价被罚 7000 万美元：监管认为亚马逊用下架/降权等方式影响第三方定价，构成反竞争。平台既当裁判又当运动员的问题，还会继续被盯。
比特币价格跌破 6.5 万美元：比特币短期大跌，回到 2024 年大选后低位区间。对“高波动资产=高确定性叙事”的幻想，又一次被价格教育。

开发与系统：小 Bug 也能把体验拖垮

从浏览器到系统备份，再到 UI 框架，问题往往不宏大，但会真实影响工作。

心碎了：Safari 渲染特定 emoji 字体（Noto Color Emoji）时布局耗时暴涨，页面性能可差到 100 倍。作者用 Claude 辅助定位并提交了复现，临时建议是改用 Apple Color Emoji。
塔霍时光机：Time Machine 可能会静默停止备份，且不提示错误；问题与 SMB 默认设置变化有关。结论很朴素：别迷信“自动备份”，要定期抽查是否真的在跑。
Tahoe 版 SwiftUI 表格 Bug：SwiftUI 的 Table 被曝内存泄漏与性能衰退，哪怕数据量受控也会越跑越慢。对依赖 SwiftUI 做数据面板的人，这是需要绕开的坑。
AEQuery：一个命令行工具，用类似 XPath 的表达式查询支持脚本的 macOS 应用，并以 JSON 输出结果。对自动化和测试脚本来说很实用。
都 2026 年了，直接用 Postgres 吧：文章反对“一个需求一个数据库”的碎片化，强调 Postgres 通过扩展覆盖搜索、向量、时序等常见需求，减少运维复杂度；观点偏强势，但提醒了成本与复杂性的真实代价。
MenuetOS——从一张软盘就能启动的图形界面操作系统：一个用 64 位汇编写的极小型 GUI 操作系统，追求紧凑与高效。它不一定实用，但很适合用来理解“操作系统还能有多简单”。

太空与能源：算力上天、卫星加密、聚变降成本

能源与算力的瓶颈在地面越来越明显，于是有人把算盘打到太空与聚变上。

Elon Musk 要认真搞轨道数据中心了：马斯克推动 SpaceX 与 xAI 合并，并向 FCC 申请轨道数据中心网络。核心卖点是太空太阳能更“便宜”，但工程与维护挑战会非常硬。
潜在的 Starlink 竞争对手刚拿到 FCC 批准，将发射 4,000 颗卫星：Logos Space Services 获批建设低轨宽带星座，计划到 2035 年发射 4000+ 卫星，面向政府与企业市场。卫星互联网的竞争还在加码。
NASA 宇航员如今执行登月任务也能带手机了：NASA 放开宇航员携带智能手机，先用于 Crew-12 和 Artemis II。意义不在“带手机拍照”，而是让现代硬件进入航天任务的审批流程更顺。
Pacific Fusion 找到更省钱的办法让它的聚变反应堆跑起来：通过磁场微量预热燃料颗粒，试图减少聚变点火前的复杂设备需求，目标是把惯性约束聚变的成本打下来；离商业化仍远，但方向更务实。
特朗普的关键矿产储备计划，等于承认未来属于电动化：美国拟投入 117 亿美元建立关键矿产储备，降低供应链风险。电动化、风电等产业对锂、钴、稀土的依赖，会把资源问题推到更前台。