大模型与 AI 生态
多家厂商更新模型与底座,长上下文更便宜,算力利用更高,AI 正进入更多日常场景。
- 最强开源模型 DeepSeek V4 发布,1M上下文,运行成本大降:支持百万 token 上下文,稀疏注意力降算力与显存,代码能力显著提升;Flash 版降价、Pro 版涨价,暂不支持本地部署。
- DeepSeek 第四代:API 兼容 OpenAI/Anthropic,提供 v4-flash 与 v4-pro;deepseek-chat/reasoner 将于 2026-07-24 废弃,给出流式/非流式调用示例。
- 中国DeepSeek发布新AI模型,震惊美国竞争对手一年后再发力:宣称性能逼近顶级闭源,编码能力大增,支持国产芯片;训练成本与硬件细节未披露,遭到美方质疑。
- 派早报:OpenAI 发布 GPT-5.5 系列模型等:GPT-5.5 提升复杂任务与安全防护;谷歌发布新一代 TPU 8t/8i;还涉及电纸书新品、相机与供应链投毒风险提示等。
- TorchTPU:在谷歌级别 TPU 上原生运行 PyTorch:深度集成 XLA/StableHLO,分布式训练提速 50%+,支持自定义算子与动态形状,后续将开源并扩展生态。
- Claude 正在直接连接你的个人应用,如 Spotify、Uber Eats 和 TurboTax:新增多款生活应用连接器,可在对话中按需调用;操作前确认,数据不用于训练,随时断连。
- HN展示:LLM工作原理——基于Karpathy讲座的互动可视化指南:从数据收集、分词、预训练到 SFT/RLHF 与 RAG 的可视化入门,帮助快速理解 LLM 全流程。
安全与合规
供应链攻击、国家级恶意代码与 AI 误导并发,预测市场内幕交易引发监管聚焦。
- 又是 npm 包投毒,密码管理器 Bitwarden CLI 中招(放心:本体安全):恶意代码于安装时窃取令牌、SSH 私钥与云凭证等;官方称密码库与后端未受影响,未用 CLI 的用户无须担心。
- 新破解的破坏性恶意软件或曾针对伊朗核计划,其历史甚至早于震网病毒:Fast16 可悄然篡改高精度仿真结果,疑为国家级武器,最早可追溯至 2005 年。
- 韩国警方逮捕因AI生成逃跑狼图误导当局的男子:AI 假图干扰搜寻行动,涉妨碍公务;最高可判 5 年或处以罚金。
- 美国特种部队士兵因Polymarket赌注参与马杜罗突袭被捕:被指用机密信息下注获利超 40 万美元,或成预测市场内幕交易首案,面临重刑。
开发者与系统
新版系统与新工具齐发,强化安全、性能与跨平台,简化构建与交付。
- Ubuntu 26.04版本介绍:LTS 如期发布,新增 TPM 全盘加密、权限控制改进与 Arm Livepatch,桌面/服务器/云提供 5 年维护。
- Spinel:Ruby AOT 原生编译器:将 Ruby 编译为独立可执行文件,性能较 CRuby 提升显著;限制包括不支持 eval、动态元编程与线程。
- Show HN:Gova —— Go 语言的声明式 GUI 框架:跨平台原生桌面 GUI,单一静态二进制,显式响应式状态与热重载,预发布阶段。
- Show HN:Tolaria——开源 macOS 应用,助你管理 Markdown 知识库:文件/Git 优先、离线可用、无锁定,支持多种 AI 集成,面向重度笔记与团队知识库。
设备与应用
新形态硬件与实用工具并进,关注大屏效率、验机便捷与本地化体验。
- 手机和平板间的新品类:华为 Pura X Max 漫谈:宽比例与内外屏一致设计,兼顾便携与沉浸,多任务与常驻 AI 助手强化生产与创作一体化。
- 换了新显示器怎么验?我做了一个开箱即用的全平台屏幕检测工具:网页端“视觉族”集成坏点、色彩、烧屏、拖影与刷新率测试,跨设备免安装,附定制化指南。
- 保时捷全新Cayenne Turbo Coupé Electric,0-60英里加速仅需2.5秒:电动轿跑版风阻 0.23,三款配置,最高性能与豪华配置并重,续航约 350 英里。
- 让 Apple Music 正确显示日文、韩文、中文歌曲名:JiBA:自动恢复被罗马音化或英文化的曲目名,通过 iCloud 同步到多端。
观点
反思软件堆栈碎片化与企业“熟悉偏见”,呼吁以新模型与新架构正面解题。
- 写作文不该这么难:指出系统内部模型割裂导致脆弱与低效,主张构建通用且领域对齐的封闭模型,提升开发与验证效率。
- 熟悉带来的陷阱:企业系统为何六十年来屡战屡败:批判“熟悉感驱动”的采购与技术选型,提倡用 LLM 自动抽取结构化知识+图数据库与审计日志,构建可追溯的知识管理体系。