AI模型与机器人:多模态与性能新进展
以更长时长、更强一致性和更快推理为目标的多模态与机器人能力明显提升。
- VibeVoice:开源前沿文本转语音模型:用超低帧率语音分词器与“下一词元扩散”框架,合成长达90分钟、多人对话、说话人一致的高质量音频。
- Voyager——实时D重建的交互式视频生成模型:从单图与相机路径生成世界一致的3D点云视频,并对齐RGB/深度用于3D重建,代码与权重开源。
- AI加持Metal内核,PyTorch推理在苹果设备上飞起来:自动生成Metal内核,让部分PyTorch工作负载平均提速87%,个别任务快数百倍。
- 这款机器人只靠一个AI模型就能学会人类般的动作:波士顿动力Atlas用单一模型同时学会行走与抓取,并出现“涌现”能力,如掉落后自行捡起物品。
- 瑞士发布自研AI模型,训练数据全部公开:Apertus在HuggingFace公开代码、数据与过程,支持1800+语言,遵循欧盟版权与AI准则。
AI开发与编程:从编辑器到工作流控制
开发者工具更贴近实际编码与协作,强调可控、可追溯与上下文丰富。
- Claude Code:Zed 上线 Beta 版:通过新协议ACP把Claude Code带进Zed,支持实时代码编辑、细粒度审查与自定义工作流,并兼容其他ACP代理。
- Warp上线全新差异追踪工具,AI编程竞赛再升级:Warp Code提供更细的diff与操作视图,形成“结对编程”式的紧密反馈回路。
- OpenAI向免费用户开放ChatGPT项目:“项目”可按主题组织对话、设定自定义指令并引用文件(免费用户可传5个),推动更多人试用与升级。
- 打造AI数据分析师的那些坑与经验:仅靠Text-to-SQL不够;需要多步骤计划、Python工具、语义层(如Malloy)、精准检索与多智能体协作。
产业与资本:AI、芯片与航天的攻防与扩张
融资、并购、诉讼与政策同时上演,产业格局加速重排。
- 法国AI巨头Mistral有望斩获亿美元估值:拟以140亿美元估值完成20亿欧元融资,跻身欧洲最具价值初创之一。
- Scale AI起诉前员工及竞争对手Mercor,指控其试图挖走最大客户:涉百余份机密文件与客户引荐,折射对新对手Mercor崛起的警惕。
- CoreWeave 收购智能体训练初创公司 OpenPipe:把强化学习与高性能AI云结合,助企业打造定制AI代理。
- xAI首席财务官成马斯克AI公司最新离职高管:CFO离任,延续近期高层流失;其任内完成50亿美元融资并推进数据中心扩张。
- 美国政府为何入股英特尔:将拨款转为约10%股权,附带代工持股条款,配合产业回流与AI战略。
- SpaceX获批佛州发射次数翻倍:卡纳维拉尔角Falcon 9年发射配额由50增至120,并新设现场着陆区。
Google与Android:系统升级与AI助手入家
Pixel功能下放更广、音频共享更易用,AI助手将走向家庭中枢。
- 更多 Pixel 手机迎来 Google 全新 Android 界面:Material 3 Expressive扩展至Pixel 6及更新机型,Buds/Watch与快速分享等也获改进。
- Pixel手机上线双人音乐共享功能:LE Audio与Auracast支持同时连接两副耳机,并可创建私人广播。
- Google NotebookLM上线AI播客语气自定义功能:可选“深度探讨/简报/评论/辩论”等风格,新增视频概述与独立移动App。
- Google将于月日公布更多Gemini智能家居新计划与设备:Gemini将取代Assistant进入家庭场景,配合新Nest设备,提供免费与订阅版。
Apple与iPad:发布会在即,系统测试曝Bug,iPad迎来关键App
新品临近发布,开发者版Bug引关注;iPad生态补齐短板。
- 苹果月日“惊艳发布会”观看指南:预计发布iPhone 17系列(或含超薄款)、Apple Watch与智能家居新品,支持直播观看。
- macOS Tahoe 开发者预览版 Beta:第九个开发者版问题集中(UI错位、稳定性差等),或影响正式版进度。
- iOS 开发者预览版 Beta:大量既有Bug未修,开发者对正式版体验表示担忧。
- 苹果iOS 公测版发布:你的iPhone能升级吗?快来查查这份名单:带来“液态玻璃”等新设计与功能,XR/XS系列不再支持,预计9月中旬发布。
- Instagram 终于要上线 iPad 版应用:原生适配大屏,默认Reels视图,功能与手机端一致,结束多年缺位。
安全、隐私与监管:平台合规与数据跨境的拉锯
从内容审核到数据传输再到反垄断,平台义务与用户权益持续博弈。
- Pornhub母公司因未能有效拦截不良内容,向FTC支付五百万美元和解金:Aylo同意加强内容审核与数据安全,并接受十年独立审计。
- 欧洲法院裁定支持最新美欧数据传输框架:确认保障充分且申诉机制独立,为跨境数据流动提供确定性。
- 上诉法院恢复被解雇的民主党联邦贸易委员会委员职务:依据最高法院先例,总统不得无因罢免FTC委员。
- Google 搜索终极指南:反垄断裁决免拆分与默认协议禁令,但要求与竞争对手共享部分搜索数据,被视为谷歌阶段性胜利。
- 自动勒索间谍软件偷拍受害者浏览色情内容:Stealerium可截屏并调用摄像头勒索,同时窃取银行与加密钱包信息。
- 全球最大非法体育直播平台被一锅端:Streameast被查封、嫌疑人落网,年访次超16亿。
- Roblox 推广年龄识别技术,推出统一分级标准:面向全体用户推行年龄估算,并与IARC合作引入全球统一分级,加强未成年人保护。
开发与基础软件:从编译器到数据系统与经典源码
轻量化实现、可维护架构与历史源码,共同启发工程实践。
- 用行Python写一个C语言编译器():仅用约500行Python实现C到WASM编译,详解词法、类型、控制流到代码生成的取舍与实现。
- 用SQLite和Clojure打造平民版双时态数据系统:用不可变与幂等理念,借SQLite特性构建低复杂度、易维护的SaaS数据架构。
- Microsoft BASIC 微处理器版——.版本:公开1976–1978年的6502 BASIC 1.1汇编源码,展示早期多平台条件编译与个人计算机软件起点。
- NF 文件格式:提出6NF友好的双时态数据交换格式,强调扁平结构、UTC、PostgreSQL风格与UTF-8。
- 用极简案例读懂Transformers:可视化展示解码器Transformer的嵌入、注意力与预测过程,帮助理解最小规模上的泛化机制。