音频与数字内容鉴别
用简单工具看穿“标称高品质”的水货内容,少踩坑。
- 一日一技|用频谱分析找出「假无损」音乐:用频谱图识别“无损/高解析”是否由 MP3、AAC 转码或 CD 升频而来。常见特征是高频被截断、噪声不自然;DSD 仅靠频谱不太够,还要配合别的方法。
AI 学习与实践
从“最小可用实现”到课程体系,再到把 LLM 用得更稳。
- Microgpt:用约 200 行纯 Python 手写一个简化 GPT:数据、分词、自动微分、Transformer、训练与推理全链路。用名字数据集做字符级训练,展示模型如何学到统计规律并生成新名字。
- 决策树——嵌套决策规则那不讲理的强大力量:讲清决策树怎么训练:熵衡量“纯度”,信息增益选分裂点,ID3 递归生成树。也提醒它易过拟合、对扰动敏感,并给出剪枝和随机森林等改进方向。
- 10-202:现代 AI 导论(CMU):CMU 2026 春季入门课,覆盖监督学习、神经网络、Transformer、微调与 AI 安全等。可在线免费学(延迟发布),作业可用 AI 辅助,但闭卷考试禁用。
- 用 LLMs 进行确定性编程:直指 LLM 输出不稳定的问题。建议用类型系统、静态检查、单测等“硬约束”把结果锁住,让 LLM 负责提速,而不是当最终裁判。
编程与数据工程
从运行时细节到数据格式性能,再到“为自己写的软件”。
- 为什么 C++ 的第一次(内存)分配/释放总是 72 KB?:解释 Linux 上常见的“启动就先分配约 72KB”:来自 libstdc++ 的异常处理紧急内存池,用于 malloc 失败时仍能抛异常。旧版 Valgrind 可能会把它误报成泄漏。
- Hardwood:Apache Parquet 的全新解析器:新的开源 Parquet 解析器(现代 Java),主打多线程、高性能、少依赖,支持全部列类型和压缩算法,并提供行式/列式 API。当前为 Alpha 版,后续计划做谓词下推与写入。
- 写给室内植物编程的一曲颂歌(2025):倡导“只在我机器上跑就行”的小工具式开发:为自己定制、慢慢养,不追求通用和完美。也区分一次性脚本(bouquet programming)与长期自用项目。
网络安全与基础设施
浏览器和证书体系在为“后量子时代”做准备。
- 稳健高效的量子安全 HTTPS:Chrome 推动用 Merkle 树证书(MTC)替代传统 X.509 链的一部分,用更紧凑的证明降低带宽并保持透明度。计划分阶段推进,并建设面向后量子的根证书体系。
软件与工具更新
老牌工具继续打磨,逐步走向可当主力用。
- Everything 1.5 Alpha 进入全面稳定期:Everything 1.5 Alpha 经多次迭代后稳定性大幅提升,强化安全机制、索引与数据库性能、UI 体验和网络服务能力,作者认为已接近“主力可用”。
实时 3D 与多人同步
把“状态同步”下沉到数据库层,简化多人实时应用。
- SpacetimeDB 对 ThreeJS 的支持:SpacetimeDB 2.0 强调低延迟实时同步:客户端用 WebSocket 订阅差异更新,适合 Three.js 的多人 3D、协作编辑和持久世界。它更像“低延迟状态数据库”,而不是完整游戏引擎。
国际新闻与平台信息污染
冲突升级带来政局震荡,也把社交平台的虚假信息问题推到台前。
- 伊朗最高领袖阿亚图拉·阿里·哈梅内伊在以色列空袭中身亡,36年统治落幕:NPR 报道称哈梅内伊在空袭中身亡,伊朗权力结构与地区局势将进入不确定期,后续走向取决于继任与内部权力再分配。
- 在美国和以色列袭击伊朗后,X 被虚假信息淹没:Wired 指出 X 在重大事件中充斥旧视频、错位画面、AI 图与游戏画面冒充战况;部分高流量内容来自付费蓝标账号。社区注释能纠错,但覆盖有限。
科技产业与监管冲突
“安全立场”与政府订单、监管态度之间的矛盾开始反噬。
- Anthropic 给自己挖的坑:TechCrunch 称美国政府因 Anthropic 拒绝参与大规模监控和自主武器,切断合作并列入黑名单,带来巨额合同损失。文章也借学者观点批评行业一边谈安全一边反对监管,导致风险累积。
版权与流媒体现实
盗版不只是不守规矩,很多时候是“买不到、付不了、用不顺”。
- 流媒体平台无解的盗版难题:在中东和北非,制裁、支付困难和内容限制让正规流媒体难普及,盗版靠“更便宜、更方便”长期占上风。平台尝试替代支付与灵活订阅,但结构性问题短期难解。
天文一瞥
用一次长曝光般的时间尺度,看清月食的全过程。
- 月全食时的月亮:NASA 展示 2018 年一次 5 小时月全食视频,月亮变暗并呈红色“血月”,背景恒星的移动也清晰可见;并提示部分地区将迎来类似观测机会。