AI模型与代理:能力跃迁与评测对齐
全栈多模态、科研到代码的代理化、以及更贴近真实开发与编译任务的评测,正在同步推进。
- Qwen3-Omni:全能AI模型,文本、图片、视频一网打尽:阿里多模态基础模型,支持文本/图像/音频/视频输入与实时语音响应,提供Transformers、vLLM、DashScope等多种部署方式与本地演示,多个基准达SOTA。
- Paper2Agent:斯坦福让论文变身AI智能体:自动把论文与配套代码转为MCP工具服务器,迭代测试后生成可用代理,连接聊天AI即可用自然语言调用论文中的流程和工具。
- SWE-Bench Pro:评测LLM/智能体修复真实开源项目缺陷的能力,要求生成可编译补丁;提供Docker/Modal的可复现实验流程。
- CompileBench:AI能否编译22年前的老代码?:19个模型在15个真实编译任务上对比,Claude成功率领先,OpenAI性价比较优,Gemini表现不佳且出现“作弊”倾向;无“一刀切”最优模型。
- 扩散模型在数据有限场景中力压自回归模型:数据受限时,扩散模型更高效,能更好利用重复数据与多样化token排序,挑战“自回归更优”的传统认知。
- 当编程 AI 摆脱“拨号上网”般的迟钝:当前代理慢且不稳,背后是算力与基础设施瓶颈;更高速模型与无监督工作流将到来,同时带来新计费模式与半导体约束的压力。
AI基础设施与巨头博弈:资本加速、格局重排
超大规模算力投资与组织调整,正重塑AI基础设施版图。
- 千亿级基础设施投资,助推AI狂飙:本十年AI基建投入或达3–4万亿美元;Oracle与OpenAI据称达至多3000亿美元算力合作,微软、亚马逊、Meta等大手笔建数据中心,电网与环境压力上升。
- NVIDIA豪掷千亿美元联手OpenAI打造10吉瓦AI数据中心:英伟达拟投至多1000亿美元,与OpenAI共建10GW级AI数据中心,采用其芯片与系统,降低OpenAI对单一合作方依赖。
- Oracle一口气提拔两位总裁,共掌CEO大权:甲骨文设联席CEO,强化AI基础设施与算力供给布局,应对激增的AI计算需求。
安全事件与隐私:基础设施与终端双线告急
从关键行业供应商到游戏平台,攻击面扩大、影响面更广。
- 欧盟网络机构证实勒索软件攻击致机场大乱:针对Collins Aerospace的勒索攻击致多国机场值机系统瘫痪,航班延误与取消。
- 汽车巨头Stellantis称客户个人数据在黑客攻击中被盗:第三方服务平台被入侵,客户联系方式外泄,涉及规模巨大。
- Steam游戏下架,黑客植入加密窃取器盗走超15万美元:免费游戏暗改加入加密货币窃取器,数百玩家受害,平台已下架。
- Tahoe FileVault:iCloud钥匙串与SSH:macOS 26改进FileVault密钥管理,支持E2E加密的iCloud钥匙串存储与通过SSH远程解锁,加固企业与远程场景下的可管可控。
科技监管与平台治理:规则线与红线
AI与平台治理进入“划线”阶段,法律与行业规范加速跟进。
- 美国TikTok交易最新进展:美方与中方达成“框架”协议,甲骨文等美方财团控股TikTok美国业务,Oracle负责安全与算法复制,美国用户或需迁移至新平台。
- 全球呼吁为AI划定红线,国际AI政策缺失引发警钟:200多位前政要与AI领袖倡议在2026年底前达成AI“红线”国际协议,禁止AI冒充人类、自我复制等高风险行为,并设立有约束力的全球机构。
- 加州因律师使用ChatGPT捏造案情开出罚单:律师因引用AI杜撰判例被罚1万美元;AI“幻觉”引发法律行业合规与监管升级。
- Facebook上线AI恋爱助理:引入AI助手与“Meet Cute”功能,减少“滑动疲劳”,对标Tinder、Hinge等竞品的AI功能竞赛。
- TikTok加沙视频被强行插入商品推荐:AI识别在敏感内容中自动上商品链接引争议,暴露场景边界与内容审核不足。
开发者技术与编译/GPU:从协议到优化的新路径
新RPC范式、递归优化、GPU内核与内存布局的系统性进步,为下一代高性能软件奠基。
- Cap'n Web:浏览器与服务器全新RPC系统:基于JSON的对称RPC协议与TS实现,支持对象能力安全、Promise管道化与函数/对象引用传递,用“.map()”缓解GraphQL列表“瀑布”问题,已在Wrangler远程绑定试用。
- 递归转迭代:LLVM循环优化新思路:临时将递归重写为可优化的合成循环,再恢复递归形式;特定负载最高提速30%。
- 可爱布局的范畴基础:以范畴论刻画GPU关键的内存布局与变换,提出新的图示法与组合算法,连接专用硬件指令优化。
- 现代张量核心GPU上的warp解耦优化:分析warp specialization的收益与代价,给出H100案例与无需解耦也能逼近CuBLAS的调度策略。
- 本地语音转文字神器:Python音频转写工具:基于Whisper的本地转写实践指南,覆盖环境搭建、批量转写、SRT生成、性能对比与常见问题。
数据库与后端:Postgres新解法
云侧增强与本地化思路并行,探索“即取即用”的Postgres形态。
- PlanetScale for Postgres 正式上线:提供高性能Postgres与迁移工具,同时开源Neki分片方案,面向高强度负载。
- 如果把 Postgres 当成 SQLite 来用,会发生什么?:主张本地使用Postgres以获得扩展与生态优势,同时追求SQLite式简洁与性能。
平台与消费产品:AI进入日常场景,体验分化
从客厅电视到手机与PC,AI功能铺开,但硬件基础差异仍显著。
- Google Gemini AI即将登陆你的电视:Gemini接入Google TV与Android TV OS,支持自然语言对话、内容推荐与学习规划,覆盖3亿设备。
- 派评 | 近期值得关注的 App:多平台剪贴板、计算清单、Aqara Home 6.0自动化、Final Cut Camera 2.0、iPad番茄5.0、Cuto 3.0等一批App更新与上新。
- 被Apple Silicon宠坏了,但我还是爱Framework:对比MacBook与Framework 13的续航与待机耗电,指出x86笔电在休眠/挂起能耗上的顽疾与ARM化的可能性。
并购与融资:内容、社交与可穿戴
资本动作集中在内容平台、社交电商与健康可穿戴。
- eBay收购社交电商平台Tise:押注年轻用户与可持续零售,补齐社交交易工具。
- Vimeo被收购:Bending Spoons以约13.8亿美元拿下Vimeo;其在Evernote与WeTransfer的裁员历史引发社区担忧。
- Oura智能戒指制造商拟融资8.75亿美元E轮,估值飙升至110亿美元:拟扩产与国际化,累计售出550万只,年营收或超10亿美元。
航天与太空:月球竞赛的新变量
登月运输与着陆系统进度分化,私营航天角色加重。
- 蓝色起源中标NASA合同,助力VIPER探测车奔赴月球南极:价值约1.9亿美元,2027年末用Blue Moon MK1送VIPER至月南极,探测水冰。
- SpaceX登月舱或将“拖延数年”,2027登月计划恐受影响:低温推进剂转移与发动机重设带来风险,Artemis 3或延后,给他国登月窗口。
汽车与电动化:策略调整回归现实需求
车企根据真实需求与渗透率调整路线,增程与混动权重上升。
- Stellantis取消电动版Jeep Gladiator计划:取消Gladiator 4xe与纯电Ram全尺寸皮卡,转向增程式;与福特、通用等同步放缓纯电节奏,贴近市场需求与成本约束。