人工智能与大语言模型
从推理能力到行业应用,AI 正在重塑开发流程与科研效率。
- 迄今为止,我在 Opus 4.5 上的体验,和以往常规的 AI Agent 完全不一样:作者分享了 Claude Opus 4.5 在自动化开发、调试和复杂应用构建中的惊人表现,认为其将彻底改变现有的开发方式。
- 现实渗透测试中:AI Agent 与网络安全工程师谁更胜一筹:一项真实测试显示,名为 ARTEMIS 的多代理框架在发现漏洞和执行效率上已优于多数人类专家,但在图形界面任务上仍有短板。
- 30B 参数 Qwen 模型跑进树莓派,还能实时运行:通过 ByteShape 优化,30B 参数的模型可以在树莓派 5 上实现每秒 8 个 Token 的实时生成,展示了边缘端运行大模型的潜力。
- LMArena 上线产品四个月即获 17 亿美元估值:这家由伯克利研究项目演变而来的 AI 评测公司,凭借众包模型排名服务在短时间内完成了高额融资。
- 分层自回归建模:面向内存高效的语言生成:提出 PHOTON 模型,通过多分辨率层次结构减少 KV 缓存压力,显著提升长文本推理的吞吐量和效率。
- xAI 宣布完成 200 亿美元 E 轮融资:马斯克旗下的 AI 公司获得英伟达、思科等巨头注资,资金将用于扩展数据中心和 Grok 模型的研发。
- 符号电路蒸馏:证明程序与 LLM 电路等价:一种将黑盒神经网络电路自动转换为人类可读代码的方法,推动了 AI 模型的可解释性研究。
CES 2026 特辑
全球最大的科技盛会开启,AI 硬件、新型显示器与奇异机器人成为焦点。
- CES 2026 开幕前瞻:周一发布会上那些你可能错过的重磅消息:综述了英伟达、英特尔、索尼、乐高和三星等厂商的首日发布重点。
- 英伟达 G‑Sync Pulsar 技术,让玩家告别运动模糊:通过独立的背光脉冲控制,大幅提升画面流畅度,解决高频运动下的视觉模糊问题。
- ASUS Zenbook Duo 在 2026 CES 上完成一次惊艳大改款:双 3K OLED 屏间隙大幅缩小,搭载 99Wh 电池和最新 Intel 芯片,显著提升了双屏本的耐用性与性能。
- Dreame 最新概念扫地机器人配备“长腿”,能爬上整段楼梯:展示了具备攀爬楼梯能力的 Cyber X 原型机,有望解决多层住宅的自动清洁难题。
- Pebble 创始人,也许正是那个最适合做 AI 戒指的人:Pebble 创始人回归,推出了一款带物理按钮、长续航且不可充电的 AI 智能戒指 Index 01。
- 亚马逊刚发布自家版三星「画框」电视:Ember Artline 系列采用 4K QLED 屏,主打艺术品展示功能和 AI 环境感应。
开发工具与后端技术
高性能 I/O 优化、代码检索以及极富数学趣味的 Git 工具。
- 基于 iouring 的高性能数据库系统:何时用、怎么用:研究证明 iouring 能为 PostgreSQL 等数据库带来约 14% 的性能提升,并提供了系统化的设计指导。
- Show HN:Mantic.sh——面向 AI Agent 的结构化代码搜索引擎:本地运行的代码搜索引擎,不依赖向量数据库,能在大型代码库中实现毫秒级的结构化检索。
- Show HN:每次 git 提交都生成 48 位质数:一款有趣的工具,通过调整提交哈希中的随机数,让你的每个 Git Commit ID 对应的数字都是一个素数。
- 用 Rust 为 WebAssembly 编写特征值求解器:详细介绍了在浏览器中利用 Rust 进行高性能数学运算和数据可视化的实现过程。
- Mole:最好用的免费 Mac 清理工具:一款开源的命令行工具,支持缓存清理、应用卸载和系统监控,轻量且高效。
政策、安全与隐私
从监管法案到反间谍软件,技术边界正受到法律的进一步约束。
- 越南下狠手:全面封杀不可跳过广告:2026 年起实施新规,要求视频广告必须在 5 秒后提供跳过按钮,禁止误导性交互。
- iOS 26.2:日本开放第三方浏览器引擎:受当地法规推动,苹果开始在日本市场允许开发者在特定应用中使用非 WebKit 引擎。
- 加州议员提议:未来四年禁止在儿童玩具中使用 AI 聊天机器人:为了保护未成年人隐私及心理健康,加州拟立法暂停销售具备 AI 交互功能的玩具。
- 间谍软件厂商 pcTattletale 创始人认罪:该工具允许秘密监控他人设备,其创始人因黑客攻击和非法销售监控软件面临法律制裁。
- 加州推出一键数据删除工具:加州居民现在可以通过官方平台 DROP 一站式向数百家数据中介发出删除个人信息的请求。
科技生活与硬件趋势
软件膨胀、硬件回归实体键以及自建服务的兴起。
- 大众重新启用实体按键:在经历了触控按键的用户负评后,大众在新款 ID.Polo 中全面回归物理开关设计。
- 为什么 Gmail 应用会膨胀到 700 MB?:分析了 iOS 常用应用体积飞速增长的现象,指出其功能增长与空间占用极不成正比。
- 在 Hetzner 上用 Jellyfin 和 Wireguard 自建媒体库:不满流媒体平台涨价与广告,技术用户开始回归“自给自足”的媒体存储方案。
- 最新健康潮流:开始“盯紧”你的尿液:随着智能传感器降价,尿液实时监测正成为继智能手表后新的家庭健康追踪趋势。
- HTML 在 ePub 中如何演变:深入探讨电子书格式 ePub 背后的 XHTML 标准及其对现代网页技术的支持局限。
行业文化与深度观察
黑客眼中的金钱运作,以及知名框架作者的离去。
- 召集全体黑客:一文看懂 2024 年的金钱运作机制:深度剖析加密货币与风投市场的运作逻辑,呼吁技术人员掌握财务知识以实现更有意义的创业。
- Masonite 作者 Joe Mancuso 去世:Python 框架 Masonite 的核心开发者不幸离世,社区计划继续推进其遗愿。
- Show HN:Foundertrace——盘点由 YC 员工创立的一串 YC 初创公司:通过数据展示了 YC 体系内惊人的创始人衍生率,Airbnb、Stripe 成为名副其实的“创业黄埔军校”。
- 网红内容:互联网痴迷型政府的最佳燃料:探讨了社交媒体上的假消息如何通过算法放大,进而左右政府决策和公共议程。