大模型与智能体
面向“多工具、长流程”的AI进入实用阶段:Anthropic强化工具编排与跨应用集成,业界反思插件生态演进,同时开始用新基准检验“是否守护人类福祉”。
- Claude 高级工具使用:新增“工具搜索”“程序化工具调用”“工具使用示例”,按需加载工具、用代码编排多步调用,减少上下文污染并提升准确率与扩展性。
- Anthropic 发布 Opus 4.5:新增 Chrome 与 Excel 集成功能:旗舰模型在代码与长上下文上领先,首超SWE-Bench 80%;推出Claude for Chrome/Excel,面向多代理协作与办公场景。
- Anthropic 推出 Opus 4.5 模型:要来“攻占” Microsoft Excel:支持“无尽聊天”、更强提示注入防御和表格自动化,API价格下探,实用性提升。
- LLM 插件的残酷真相:回顾从ChatGPT插件到MCP、Agent Skills的演进:从重API到轻脚本与本地规则,趋势是“自然语言+通用计算”的低门槛扩展。
- 全新 AI 基准测试:检验聊天机器人能否守护人类福祉:HumaneBench发现多数模型在压力下会牺牲用户福祉;GPT-5与Claude系列相对稳健,呼吁以“长期福祉”和“用户自主”为设计目标。
- Anthropic 新模型杀入 AI Agent 之战最前线,但网络安全隐患仍挥之不去:尽管安全性增强,仍难完全免疫恶意用例;在拒绝恶意代码方面表现较好,但对更隐蔽的风险仍需改进。
安全与隐私
软件供应链与金融系统再受冲击,平台级自动化攻防上场;隐私项目与标准化争议凸显治理缺口。
- 沙虫再临:超 300 个 NPM 包遭感染:攻击者伪装Bun运行时,注入恶意脚本窃取NPM令牌与云凭证,并借GitHub Actions外泄,具蠕虫特性,疑与“Shai-Hulud”同源。
- 黑客攻破金融科技公司后,美国银行紧急排查数据失窃风险:SitusAMC被入侵,涉银行客户企业数据外泄;FBI介入,业务暂未受影响,事件仍在调查。
- 亚马逊借助专业 AI 智能体深入“猎杀”顽固 Bug:内部“自主威胁分析”系统用多智能体模拟攻防,自动发现漏洞并生成防护方案,降低误报,提升响应效率。
- GrapheneOS 将服务器基础设施从法国迁出:因安全与政策担忧迁往德加托管,称不收集敏感数据,更新与安全不受影响。
- NSA 与 IETF(下):刻意回避眼前问题:批评IETF在后量子密码标准推进中程序不透明、共识存疑,呼吁重视混合加密方案与公正流程。
- Signal 加密消息备份功能登陆 iOS:提供端到端加密备份与64字符恢复密钥,免费与付费容量分级,后续将支持桌面与跨平台迁移。
产业与基础设施
AI计算与存储供需失衡加剧,云巨头押注政府市场;金融科技与半导体链条压力上升。
- AWS 斥资 500 亿美元为美国政府打造 AI 基础设施:2026年动工,新增1.3GW算力,扩展政府对SageMaker、Bedrock与第三方模型的安全访问。
- 英伟达发布“我不是安然”备忘录,结果反而引来一堆早就被这份备忘录本身回答了的问题:回应对“新云”投资与会计处理的质疑,称合作合法、未隐匿债务;若AI景气反转,或面临减值与库存风险。
- PS5 现在比 64GB DDR5 内存还便宜:内存短缺致 RAM 飙升至 600 美元:AI需求推高DRAM/NAND价格,DDR5套条飙至约640美元,紧张或延续至2026年。
- Revolut 最新一轮融资估值飙升至 750 亿美元:收入与利润双增,全球扩张加速,晋升欧洲最具价值的独角兽之一。
法律与监管
科技公司在商标、自动驾驶与未成年人保护上接受更严审视;消费品安全风险促监管介入。
- OpenAI 花钱买教训:Cameo 早已把“cameo”注册成了商标:法院临时禁令禁止在Sora中使用“cameo”,12月将举行听证。
- 特斯拉 FSD 软件恐难获欧盟监管机构最终批准:荷兰RDW澄清2月仅为演示并非批准,安全仍是首要门槛。
- 马来西亚或将自明年起禁止16岁以下用户使用社交媒体:拟推16岁以下禁令与强制年龄验证,参照澳大利亚做法。
- CPSC 警告:Rad Power Bikes 电池存在起火风险,应立即停止使用:已报告31起火灾,监管否决“折扣换新”方案,敦促停用并整改。
开源、应用与媒体格式
经典硬件生态自救,主流浏览器重启高效图片格式讨论,生产力与隐私应用小步快跑。
- Pebble Watch 软件现已 100% 开源:发布移动端源码与开发者后台,Appstore引入多源订阅与备份,生态自托管能力增强。
- Chrome 重新开放 Jpegxl 问题讨论:JPEG XL主打更小体积与HDR/动画等高级特性,业界应用与标准化推进中,Chrome或重启支持。
- Pocket Casts 现已支持为你喜欢的播客节目创建播放列表:新增手动与智能播放列表,按规则自动收集整理剧集。
- Cool-retro-term:复古风终端模拟器,完美还原老式 CRT 的屏幕质感与操作氛围:跨平台QML终端,提供多种CRT特效与主题,轻量可定制。
- Signal 加密消息备份功能登陆 iOS:端到端加密备份登陆iOS,支持免费/付费容量与密钥恢复。
前沿科技与科普
量子与脑机接口加速“出圈”,同时也提醒我们存储介质与数据保存的基本常识。
- 读心设备如今已能捕捉你“尚未成形”的念头:BCI从运动皮层扩展到顶叶皮层,结合AI实现更早期意图解码,临床与伦理问题并存。
- 你可以在 IBM 伦敦办公室亲眼看到一台正在运行的量子计算机:IBM System One对外展示,公众可隔窗参观,科普量子计算与低温工程。
- 断电状态下的 SSD 会慢慢丢失数据:消费级SSD离线1–3年可能退化,不适合长期冷存;建议遵循3-2-1备份。
能源与硬科技创业
小堆与聚变进入融资与工程化阶段,探索多场景清洁供能路径。
- X-energy 把握核能热潮,完成 7 亿美元 D 轮融资:推进高温气冷小型模块化反应堆供应链建设,累计订单逾百台,亚马逊等为客户与投资方。
- 这家初创公司想把聚变反应堆造在船上:Maritime Fusion计划2032年交付30MW海上聚变电站,主打海运替代高成本燃料场景,技术与资金挑战仍大。