AI 与大模型:推理速度、本地运行、开发方式在变
一边是更快的推理和更小的模型,一边是把模型搬到本地和浏览器;同时也在倒逼代码协作工具升级。
- 加速 LLM 推理的两招绝活:Anthropic 用更小的批处理换来约 2.5 倍提速,保留完整模型能力;OpenAI 借助 Cerebras 芯片推小型蒸馏模型,速度冲到 1000 tokens/s 以上,但能力下降。文章讨论了速度、成本和准确性的取舍。
- MDST Engine:用 WebGPU/WASM 在浏览器中跑 GGUF 模型:用 WebGPU + WASM 让 GGUF 模型在浏览器本地跑,减少对云的依赖;主打易用、端到端加密与协作,并提供 WebGPU 跑分榜。
- Git 就是个文件系统,我们还得给代码配个数据库:作者认为 git 对“结构化代码”和 LLM 时代的合并需求不够用,建议转向基于 AST 与 CRDT 的版本管理,让合并更确定、可逆,也更利于机器理解。
开发者工具与开源生态:安全、文档、轻量前端
从模块供应链安全,到文档维护者,再到“少依赖、少框架”的前端工具,核心都是更可靠、更省心。
- 查看 Go Modules 的源码:解释 Go 校验和数据库如何防止模块被篡改;并介绍 pkg.geomys.dev 与浏览器扩展,方便直接查看模块真实源码,减少“标签被改”的风险。
- 我超喜欢 ArchWiki 维护者们的工作:感谢自由软件文档维护者,点名 ArchWiki 对排错和学习的价值;也呼吁用捐赠等方式支持长期维护。
- Oat——超轻量、语义化、零依赖的 HTML UI 组件库:8KB 左右的 HTML+CSS 组件库,不靠框架和构建工具;用语义标签/属性减少类名污染,并强调可访问性与主题定制。
隐私与平台治理:年龄验证引发的新担忧
合规压力下的平台“身份验证”更常见,但第三方机构、数据保存周期和用途不清,会直接触发信任问题。
- Discord 与 Peter Thiel 的 Palantir 年龄验证公司划清界限:Discord 为满足英国《在线安全法》测试年龄验证,使用第三方 Persona;因其背后投资关系引发隐私争议。Discord 称数据仅保存七天,但长期方案仍不明确。
教育与就业:计算机科学降温,学生转向 AI
学生没有离开科技,而是在把“CS”换成“AI”;高校也在被迫重排课程和资源。
- 计算机科学“大迁徙”(以及学生们都转去哪儿了):加州大学系统 CS 招生下降,但 UCSD 新设 AI 专业;文章对比中美高校的 AI 教育推进,并指出家长与院系对“更不易被 AI 替代”的专业选择有影响。
实用软件与替代方案:更少广告、更可控的网络
一些工具主打“少打扰”和“可控”:不被推荐流牵着走,也更方便按需走代理。
- NewPipe:没有竖屏视频和算法信息流的 YouTube 客户端:开源安卓客户端,强调无广告、隐私保护、去信息流;支持 YouTube/PeerTube/Bandcamp 等,并可通过 F-Droid 更新。
- ProxyBridge:Proxifier 的免费开源替代,让任意程序走代理(Win/macOS):系统层把不支持代理的软件“强制走代理”,支持 HTTP/SOCKS5 与 TCP/UDP;更适合需要开源、可定制和 UDP 的场景。
数字保存与学习资源:把会消失的内容留住,把难懂的概念讲清
一个在保存网页游戏,一个在用可视化讲概率统计:都在做“让知识更容易被继续使用”。
- Flashpoint Archive——保存了 20 多万款网页游戏和动画:社区项目,长期保存依赖 Flash 等旧技术的网页游戏/动画;提供开源播放与管理工具,避免内容随技术淘汰而消失。
- 看见理论:用交互可视化讲概率与统计,从分布到贝叶斯与回归;适合用来补基础概念和直觉。
科学与观测:从手指缝到深空,都能动手看见
一组是“抬头就能用”的观星指南与光学小实验,一组是太空历史影像。
- 真实天空、真实设备的实用观星指南:按真实设备与观测条件给目标清单和笔记,少讲理论,多讲怎么选目标、怎么看得见。
- 手指缝里形成的干涉图样并非单缝衍射:解释两指缝看到的条纹更像“半无限屏幕衍射”,条纹周期与缝宽无关;用很低门槛展示光的波动现象。
- 在太空自由翱翔:回顾 1984 年首次无系绳太空漫步与 MMU 装置,说明其工作方式与后来被 SAFER 替代的原因。
游戏与聚会:春节多人游戏清单
面向“多人同乐”的快速推荐,覆盖合作、对抗、恐怖等不同口味。
- 春节玩什么 | 过年聚会担心冷场?不妨试试这 10 款多人游戏:整理 10 款聚会向多人游戏,并补充 1 款单人作品与 2026 年多人新作前瞻,重点是“好上手、能带动气氛”。