AI 编程方法与大模型推理/硬件
一边把“怎么做”写清楚,一边把“怎么跑更快”做到极致:从工作流到芯片和推理引擎,核心都在减少返工和带宽瓶颈。
- 我是怎么用 Claude Code 的:把规划和执行分开:先调研代码并写“研究文档”,再写可执行的实现计划,反复批注确认后才让模型动手编码。用流程约束 AI,减少错写和返工。
- Taalas 如何把 LLM“印”到芯片上?:Taalas 用专用 ASIC 把 Llama 3.1 8B 权重硬编码进硅片,宣称比 GPU 快 10 倍、能耗低 10 倍。思路是绕开显存带宽瓶颈,用更简单的低位宽计算单元提高吞吐。
- Show HN:在单张 RTX 3090 上跑 Llama 3.1 70B,通过 NVMe-to-GPU 绕过 CPU:用分层流式加载和 NVMe 直通 GPU,把 70B 模型“边读边算”跑在 24GB 显存的 3090 上。主打零依赖、支持多种量化和多级缓存,面向 Linux/CUDA 环境。
安全事件与密码学“踩坑”
真实世界的安全问题往往不是“算法不够强”,而是默认值、维护态度和系统被滥用。
- 一个 Botnet 不小心干掉了 I2P:I2P 遭遇超大规模 Sybil 攻击,约 70 万恶意节点涌入,远超正常活跃规模。团队 6 天内发布 2.11.0,加固网络并默认启用后量子加密等防御。
- 密码学里的粗心大意 vs. 精益求精:aes-js 和 pyaes 在 AES-CTR 默认固定 IV,导致大量密钥/IV 重用风险,影响众多下游项目。文章对比了“继续放着不管”和“快速迁移到更安全模式并给出方案”的差别。
系统与开发工具:更快的查询、更稳的重构、更轻的隔离
把性能和可维护性做出来,常靠小而准的工程改动:一个位、一个规则引擎、一个更简单的隔离模型。
- 两位胜一位:让布隆过滤器准确率翻倍:在同一个 uint32 里用“双位”策略降低布隆过滤器误判率(约减半),减少无效解压和探测,带来显著查询加速。
- Coccinelle:源码到源码的转换工具:面向 C 代码的“规则式重构”工具,能做复杂、可控且尽量保留原风格的源码转换,适合批量修 API、迁移模式和清理老代码。
- 重返 FreeBSD:第一篇:回顾 FreeBSD jails 作为早期轻量隔离方案的思路与历史。隔离做得很强,但缺少统一打包分发标准,生态没长成 Docker/K8s 那样。
平台生态:iOS 替代应用商店
规则变化带来新入口,但也带来新的成本和责任分配。
- 苹果靠边站:来看看欧盟及其他地区可用的替代应用商店:DMA 让欧盟用户可用替代应用商店(如 AltStore PAL、Epic Games Store、Aptoide 等),商店自行审核与售后,苹果仍通过公证流程和新商业条款收取费用;部分商店因条款复杂退出。
实用小站与纯前端工具
不装客户端、不传文件、打开就用:小工具在“足够好用”时就能活得很久。
- 日本浮世绘版画搜索:可上传图片找相似浮世绘版画,覆盖 22 万多幅作品,适合做图像溯源、研究和收藏检索。
- Gamedate——让“凉了”的多人游戏起死回生的网站:无需注册,直接找人开局或加入冷门/老游戏联机房间,帮小社区把人重新聚起来。
- Show HN:极简故障艺术生成器(100% 纯前端):本地实时处理视频或摄像头画面,调扫描线、抖动和阈值,直接导出 WebM,不需要上传素材。
太空与观测:火星影像与月全食
一边是任务留下的历史影像,一边是很快就能看到的天空事件。
- 火星机器人之影:回顾“机遇号”在耐力坑内的影子照片与任务成果:找到古水证据、远超原定寿命,最终在沙尘暴后失联。
- 3 月 3 日如何观看“血月”月全食:介绍 2026-03-03 月全食可见范围与观测方法:多数情况下不需设备,选开阔视野即可,月全食阶段约 12 分钟。