AI 与模型
模型的进步正越来越偏向编程、约束遵守和可解释性。通用语言能力还在涨,但速度慢,工程价值更直接的方向更受重视。
- 大语言模型正在变成大编程模型:Arena AI 的数据表明,近一年模型的语言能力提升不大,编程能力进步更明显。厂商的资源也更偏向短期更好卖的代码场景。
- DeepSeek V4 Pro 在精准度上击败 GPT-5.5 Pro:在一组强调格式、约束和细节的任务里,DeepSeek V4 Pro 得分更高。差别主要不在“会不会做”,而在是否足够稳、会不会乱加内容。
- 你能构建的最小大脑:用 Python 实现感知机:文章用很基础的例子讲清了感知机、权重、偏置、学习率和训练轮次。适合从零理解神经网络最早的一层。
- 玩转视觉嵌入:作者尝试拆解图像嵌入,看到草莓、拱门、螺丝等视觉特征如何叠加在一起。这说明视觉模型内部并非完全不可理解。
- 可轻松改造的微型 CUDA 语言模型实现:这是一个尽量简洁的 GPT 实现,按字节建模,代码直接,方便自己改结构和跑训练。适合把“知道原理”变成“看懂实现”。
开源生态与技术主权
欧洲正在把“少依赖外部平台”变成具体政策,开源成了现实工具。开发者这边,工具链整合、开源中立和 AI 参与开发,也都成了新焦点。
- 欧盟开源战略:欧盟把开源放到数字主权的核心位置,重点放在云、AI、芯片和网络安全等领域。目标很直接:少依赖外部专有技术,把采购、维护和人才一起补上。
- 欧洲正在以各种方式抛弃美国技术:从政府、学校到企业,欧洲都在试着换掉美国的软件、云和平台。阻力仍然很大,但“去依赖”已经不只是口号。
- 派早报:乘用车越造越重,12 年增重近 400 公斤:这则早报里有几条值得看。新能源车让整车越来越重,带来能耗和道路负担;Cloudflare 收购 Vite 母公司 VoidZero 后承诺继续保持开源中立;rsync 因是否使用 AI 辅助开发引发争论;OpenAI 也在和美国政府讨论怎样让公众分享 AI 带来的收益。
- 在 Raspberry Pi Pico 2 W 上使用 Rust 实现的 Matter Wi-Fi 灯泡:这个仓库把 RP2350、Rust 和 Embassy 异步框架放到一起,给出 Matter 灯泡、传感器和显示等完整示例。很适合做嵌入式和智能家居实验。
- 关于 GCC 单向旋转算法的一项新发现:文章重新解释了 gcc 里的旋转实现,指出新旧算法本质上是同一种方法,只是交换元素时的方向和看法不同。对理解标准库细节很有帮助。
安全、隐私与算法治理
问题不只是系统更强了,而是它们越来越难被外界看清。数据泄露通知在变慢,招聘算法又集中在少数供应商手里,出错时影响会更大。
- 1000 起数据泄露之后,披露延迟更严重了:Have I Been Pwned 收录到第 1000 起泄露事件后,作者发现企业通知用户的速度反而更慢。很多公司在数据已经流出很久后,仍以“还在评估”为由拖延披露。
- 招聘中的算法单一化:研究显示,美国大量雇主依赖少数几家供应商的招聘算法筛人,结果带来更集中的偏差和更相似的拒绝结果。按岗位细看,比看总体平均值更能发现歧视问题。
技术与人的关系
两篇文章一新一旧,说的是同一件事:机器应该帮人,而不是反过来塑造人的注意力、判断和生活节奏。
- 多巴胺开采:文章批评把爱好、文化和关系不断量化、优化、商业化的习惯。短期看更刺激,长期却会让真实体验变薄,人也更依赖“合成快感”。
- 人机共生 J. C. R. Licklider(1960):这篇老文章很早就说清了分工:人来定目标、做判断,机器负责检索、计算和模拟。今天再看,很多关于 AI 助手的讨论,其实还没有走出这条线。