AI:开源大模型、版权争议与“反偷听”焦虑
一边是更多国家和团队把大模型开源化、工程化;另一边是训练数据的版权边界仍在拉扯,隐私焦虑也催生了新硬件。
- Sarvam 105B:印度首个具备竞争力的开源 LLM:Sarvam 开源 30B 与 105B 推理模型,强调多语言(覆盖印度多种语言与脚本)、MoE 架构和更易部署;用预训练+微调+强化学习跑完整流程,瞄准本地化与可控性。
- 通过 BitTorrent 上传盗版书籍也算合理使用?Meta 如是辩称:Meta 因用盗版书训练 Llama 被诉,争议点从“训练是否合理使用”延伸到“用 BT 下载并上传是否构成直接侵权”,案件走向会影响 AI 训练数据的获取方式。
- 这款干扰器想让“永远在偷听”的 AI 可穿戴设备失灵,但大概率没戏:Spectre I 试图用超声波等手段干扰录音并“检测麦克风”,但被质疑技术可行性;更像是隐私焦虑的产物,短期难成可靠解决方案。
编程与工程:标准库、上下文追踪、数据库性能坑与超大规模向量检索
工程问题更“具体”:接口是否该进标准库、取消信号怎么追因、类型不匹配如何让索引失效,以及向量检索到底要多少内存。
- UUID 包即将加入 Go 标准库:Go 社区讨论把 UUID 生成/解析纳入标准库(v3/v4/v5),理由是依赖太常见、第三方接口稳定,且多数主流语言已有内置支持。
- 是谁把我的 Go context 给取消了?:讲清 Go 1.20/1.21 的 context cause-tracking:用
WithCancelCause、context.Cause把“谁取消、为何取消”记录下来,并指出WithTimeoutCause的一些易踩点与替代写法。 - C# 字符串正在悄悄让你在 SQL Server 里的索引失效(Dapper 也跑不掉):varchar 列遇到 nvarchar 参数会触发隐式转换,导致索引失效、全表扫描;用
DbType.AnsiString显式匹配类型和长度可直接救性能。 - 查询 30 亿向量:从朴素 map-reduce 到向量化/数据类型优化,速度能上去,但 30 亿向量仍会被内存(TB 级)卡死;结论是先把需求、精度和硬件说清,再谈分批、落盘与底层实现。
- 与日本工程师共事与沟通:跨语言团队更容易“误解成本爆炸”;建议用更简单的英语、提前写清会议目标、补齐常用技术日语词汇,并把语言学习变成团队习惯。
开源与系统:编辑器、客厅桌面、版本控制、监控与 Linux 内核交换区
工具在变“开箱即用”,内核在动更底层的结构:更好用和更难改同时发生。
- Helix:一款后现代文本编辑器:Rust 终端编辑器,主打多光标与 Tree-sitter/LSP 深度集成,尽量减少“装一堆插件才能用”的前期成本。
- Plasma Bigscreen:KDE Plasma 的 10 英尺界面:面向电视/HTPC 的开源大屏桌面,遥控器/手柄可操作,强调隐私与可定制,可与 Steam、Kodi、Jellyfin 等配合。
- 用 Jujutsu 以补丁格式编辑改动:用
jj diffedit把改动导出成补丁文件,直接编辑再应用回去;适合 LSP 不靠谱、需要精确改动的场景。 - Show HN:Kula——轻量级、开箱即用的 Linux 服务器监控工具:单一二进制、无外部数据库依赖,靠读取
/proc和/sys做采集,提供 Web/终端界面与 API,适合轻量自建监控。 - 让交换更现代:虚拟交换空间:Linux 交换子系统尝试引入“虚拟交换空间”,把页与具体交换设备解耦,利于迁移与设备管理;代价是额外开销与可能的性能回退,仍在评估与打磨。
平台与产品:散户买私募、帖子里塞商品、硬件路线图与漏洞奖励
平台在找新的钱:金融更“散户化”,社交更“带货化”;硬件和安全则继续拉扯。
- Robinhood 创业基金纽交所首秀遇挫:Robinhood 推散户可买的私募初创基金,但首轮募资不及预期、股价首日下跌;核心问题是“最想要的标的很难进”,散户买私募仍不轻松。
- X 正在测试一种将帖子与产品关联起来的新广告形式:在提及品牌/产品的帖子下方插入购买链接,目标是做“看起来不像广告的广告”;对信息流的可信度是长期消耗。
- DJI 将向那位误黑进 7,000 台 Romo 扫地机器人的男子支付 3 万美元:研究者入侵扫地机器人网络后获得奖金,说明家用物联网的攻击面仍很大,也再次验证漏洞奖励机制的价值。
- Valve 表示仍计划在 2026 年推出 Steam Machine:Valve 仍押注客厅硬件生态(Steam Machine/Frame/Controller),但时间表与执行细节仍有不确定性。
技术随笔与科学:界面细节、底层调试、历史循环与“发声”的互联网
这些文章不讲“趋势”,讲人如何用技术、被技术改变,以及技术如何反过来塑形社会。
- 这段 CSS 证明我是人类:从大小写、破折号、字体与“刻意的不完美”谈写作风格;核心观点是:格式不是洁癖,它也承载了人的个性。
- 带着狠劲锁定滚动条:从 Scroll Lock 的历史讲到今天流媒体/网页里的“锁定式滚动”,指出一些新 UI 其实在重复旧问题,只是换了包装。
- 我的应用程序员直觉在调试汇编时翻车了:裸汇编里一个
ret、一个结构体偏移、一个宽松语法都可能让你迷路;抽象层消失后,调试思路也得重学。 - 也许这里面有点门道?:回顾多项“本为善意”的技术如何被战争吸走,强调发明动机与实际后果经常分道扬镳。
- 《渴望》(1999):谈互联网带来的“重新拥有声音”的机会,对抗过度规范化的表达;今天读仍像在提醒:平台越大,个人声音越容易被磨平。
- 沙罗周期 133 的两次日食:用两次几乎相同的月食图讲清萨罗斯周期(约 18 年 11 天),说明天体周期如何让“下一次”变得可预测。
生活观察:高房租不等于好居住
贵并不自动等于舒适;居住体验常被噪音、潮湿、虫害和空间设计这些小事拖垮。
- 年度征文|在新加坡,住最昂贵的房子,过最憋屈的日子:作者用多次租房经历写出“高成本+低体验”的细节:隔音差、潮湿、蟑螂、临路噪声、户型缺陷;最后落到一个朴素结论——想找更舒服也更便宜的生活地。