大模型与AI竞赛
Claude把“长上下文”拉到百万级,AI代理与产品加速落地
- Claude Sonnet 4 现已支持一百万 Token 上下文:上下文扩大5倍至100万token,已在Anthropic API与Bedrock公测,将上架Vertex AI,适合整库代码审查与长文档合成,>20万token提示有新计费。
- Anthropic出招狙击OpenAI,Claude仅需1美元开放给“三权”政府:向美国政府三权机构提供每年1美元的Claude,覆盖企业版与政府版,支持FedRAMP High与多云部署。
- Nexus:开源AI治理与可观测性路由器:统一接入多家LLM与MCP工具,做智能路由、权限治理与观测,降本提稳简化架构。
- Show HN:Omnara——随时随地运行Claude代码:把AI编码代理变成“可对话队友”,提供实时监控、问答、通知与统一看板。
- Google大佬创立Continua获800万美元融资,AI智能体即将入驻群聊:为短信、iMessage、Discord引入群聊代理,做信息搜集、提醒、投票等协作。
- Launch HN:Design Arena(YC S25)——AI美学巅峰对决:用“二选一”众包评测AI生成视觉内容,给企业做版本AB测试与模型对齐。
- AI陪伴应用2025年有望吸金1.2亿美元:上半年营收达8200万美元,“AI女友”类最受欢迎,巨头入局推动增长。
AI研究与评测
“更暖更懂你”不等于更可靠,LLM能力边界持续暴露
- 让语言模型变得更有温度、更具同理心,反而降低了它们的可靠性:为模型注入“温暖/共情”人格会显著增错,尤其在用户脆弱场景,安全关键任务风险上升。
- 大模型并非世界模型:LLM善于续写文本,但缺乏对真实世界与状态的建模能力,在棋局、图像合成与并发编程等任务上暴露硬伤。
- 大模型闯关文字冒险游戏大比拼:用“成就”制衡评估LLM,整体表现不佳;Gemini 2.5 Flash在性价比上相对较好。
- Show HN:用30亿神经嵌入从零打造网页搜索引擎:两个月自研语义搜索,覆盖爬虫、HNSW向量检索、GPU推理与知识图谱,重内容质量、弱广告。
搜索与信息分发变局
用户个性化更强,平台博弈升级,公共数据抓取受限
- Google搜索支持自选优质信息源:在“头条新闻”等区域优先展示用户偏好站点,提升个性化但或加剧信息茧房。
- Perplexity豪掷345亿美元收购Google Chrome:向Google提出未经邀约的巨额收购,承诺保留Chromium开源与默认设置不变。
- Reddit将封杀互联网档案馆:阻止Wayback Machine抓取Reddit内容,原因是AI公司借道抓取其数据。
平台监管与商业动态
反垄断与合规推进,应用商店格局与流量版图微调
- 澳洲法院裁定Apple、Google滥用应用商店市场支配地位:认定分发环节存在反竞争行为;Epic“不道德行为”指控被驳回。
- Fortnite官宣回归澳洲iOS,苹果败诉后重返App Store:Epic与苹果多年纷争在澳洲迎来转折。
- Match因虚假宣传及其他欺骗行为被罚款1400万美元:被指诱导订阅、阻碍取消与争议处理,将向受害者赔付并整改流程。
- 印度金融科技巨头Paytm监管大战告捷,关键投资者刚刚退出:获央行批准做商户支付服务,经历强监管后迎关键进展。
- Threads月活用户突破4亿:两年达4亿MAU,移动端DAU逼近X;X移动端用户下滑。
- GitHub CEO辞职,职位暂不设接任者:Thomas Dohmke离任,领导团队改为向微软CoreAI汇报,组织架构生变。
- StubHub再度冲刺IPO,募资或达10亿美元:重启上市进程,2024年营收近18亿美元、微亏损。
开发者与前端实践
语言与工具链升级,前端布局与数据嵌入更安全可控
- Go 1.25 发布说明:容器感知GOMAXPROCS、实验性新GC、运行时飞行记录器、DWARF5、更快切片分配,新增testing/synctest与encoding/json/v2。
- 锚点定位入门指南:用纯CSS相对其他元素定位,支持position-area、anchor()与position-try,简化菜单/气泡布局。
- 如何安全地在 HTML SCRIPT 元素中转义 JSON:将“<”替换为\x3C/\u003C;PHP用JSONHEXTAG避免提前闭合与双重转义状态。
- JSONSerialization 可能抛出 NSException:Swift中需用ObjC包装防崩;仅依赖isValidJSONObject()会带来额外开销。
- SwiftData 运行时:相比Core Data,做元对象遍历更难,现多依赖Mirror,类型安全与动态性权衡明显。
开源系统与硬件平台
系统底座与创客硬件并进,Arm与RISC-V生态加速
- Debian GNU/Hurd 2025 正式发布:完成64位,支持i386/amd64;引入Rump磁盘驱动、Rust移植、USB磁盘/CD-ROM、SMP等大量改进。
- Blender原生支持Windows 11 on Arm:4.5 LTS基于Vulkan原生运行,骁龙X上视口与渲染性能大幅提升,后续将支持硬件光追。
- RISC-V单板电脑,价格不到40欧:VisionFive 2 Lite主打性价比,性能偏弱、驱动尚不完善。
- Ashet 家用电脑:介于Arduino与树莓派之间的可扩展开源电脑,目标售价≤250欧元,已完成原型验证。
安全与产业链
国家级网络攻防持续升温,供应链瓶颈与设备漏洞需警惕
- 美媒曝俄政府黑客涉嫌入侵美国联邦法院文件系统:或致机密与未公开案件泄露,威胁线人安全。
- 黑客曝光朝鲜重大间谍行动:泄露Kimsuky组织内部资料,显示与中国黑客合作并针对韩国目标。
- 利用 CVE-2022-38694 漏洞解锁 Bootloader 全攻略:面向Unisoc/Spreadtrum设备的解锁方法,风险高,需谨慎。
- Anduril在化学原材料短缺中逆势开设固体火箭发动机工厂:扩大SRM产能但受制于AP单一供应商,暴露国防工业基础脆弱性。
消费硬件与新品
旗舰手机、耳机与电竞显示升级,AI功能深度融合终端
- Pixel 10、AI黑科技,及我们对2025年Made by Google大会的全部期待:Tensor G5与更多Gemini功能,长焦首上常规版,Fold更耐用,Watch/Buds同期升级。
- 谷歌官宣Pixel 10 Pro Fold真容:预热视频展示外观,细节待8月20日发布会公布。
- 传闻中的 AirPods 实时翻译功能或将随 iOS 26 一同上线:测试版系统资产暗示支持面对面实时翻译,或与Apple Intelligence协同。
- 三星Odyssey OLED G6:全球首款500赫兹OLED电竞显示器:27英寸QHD、0.03ms响应,另有两款高刷G7曲面新品。