每日科技摘要-03-12-晚报

AI 不再只是聊天框，开始接管“收集—整理—执行”的一段流程，但计费、权限和透明度仍是硬问题。

Notion 年度更新评测：7 个案例聊聊 Custom Agent：Notion 推出 Custom Agent，可用触发器+指令自动汇总信息、跟进任务、写邮件、回复咨询、发推文/博客，还能接外部 API。强依赖你在 Notion 里的数据积累；积分计费和权限稳定性仍待观察。
Perplexity 的个人电脑：把“操作系统执行命令”改成“AI 接受目标并代你操作”。强调本地文件与应用访问、操作需用户确认和可追溯，但目前更像一个等待名单中的产品概念。
我被 AI 机器人面试了，找工作也太魔幻了吧：AI 面试官用于初筛，号称扩大候选人覆盖并减少偏见；但偏见可能从训练数据里“换个形式继续存在”，也让求职者更难与真人沟通。

论文、代码都能更快产出，但“好不好”越来越依赖人类评审与清晰标准。

年度征文｜Vibe Research：社会科学的第一次 AI 危机？：作者把 AI 视为“数字分身”，能改写定性研究与写作流程；同时也指出学界抵触来自路径依赖与价值观冲突。未来更看重研究判断力而不只是产量。
许多能通过 SWE-bench 的 PR 也未必能被合并：研究发现，通过自动基准不等于能进真实仓库：约一半 AI 生成 PR 即便过了 SWE-bench，也不会被维护者合并。问题集中在质量、完整性、对现有代码影响与缺少迭代反馈。
LLM 时代的可靠软件：用可执行规格语言 Quint 做“验证层”，再配合 LLM 改复杂共识协议，号称一周完成大改并更可验证。重点是用规格与模型测试压住 AI 代码的不确定性。
别发 AI 生成或 AI 润色过的评论。HN 是人和人交流的地方。：Hacker News 明确反对 AI 生成评论，强调社区讨论要基于真实阅读与真实观点，降低“自动灌水”对交流质量的破坏。

基础能力在补短板：多模态检索、时间处理、跨语言组件化，都是“让工程能落地”的变化。

派早报：Google 发布 Gemini Embedding 2 模型等：Gemini Embedding 2 做多模态嵌入（文本/图像/视频/音频/文档），面向检索与推荐等场景；同时还提到联发科 IoT 芯片平台更新、ComfyUI 增加更易用的 App 模式，以及多款硬件新品。
Temporal：修复 JavaScript 时间问题的 9 年征程：Temporal 试图终结 JS Date 的老毛病：不可变、时区/历法支持、日期运算更可靠。文章回顾 TC39 多年推进与跨引擎实现路径，指向 Web 生态更一致的时间处理方式。
让 WebAssembly 成为 Web 上的一等语言：Mozilla 介绍 WebAssembly 组件模型：把可执行物打包成标准组件，减少 JavaScript “胶水代码”，并朝更直接调用 Web API 的方向走，目标是让多语言上 Web 更自然。
BitNet：1-bit LLM 推理框架：微软开源 bitnet.cpp，用于高效跑 1-bit/1.58-bit 模型，主打 CPU 也能推大模型、能耗更低。对本地推理和边缘设备更友好，但仍受模型生态与工具链成熟度影响。

新风险不只来自黑客，也来自产品设计：把权限交给代理、把人名塞进 AI 功能，都可能出事。

10亿条身份记录在身份验证数据泄露事件中遭曝光：疑似与身份验证公司相关的未加密数据库暴露，涉及姓名、地址、出生日期等敏感信息。建议包括冻结信用、减少短信验证依赖、加强账户防护。
Grammarly 一位“专家”因其涉嫌盗用身份的 AI 功能起诉公司：被指未经许可使用真人身份作为“专家评审”AI 建议来源，引发集体诉讼。核心争议是肖像/隐私与“AI 引用权威”的边界。
国家互联网应急中心：OpenClaw 风险提示：风险点包括提示词注入、误操作、插件投毒与漏洞等，可能带来隐私泄露和系统被控。建议隔离环境使用、谨慎装插件、从可信渠道获取。
Show HN：一个面向 Claude Code 的上下文感知权限守卫：用“预执行钩子”拦截命令，根据上下文细分权限（路径、操作类型等），可审计、可扩展，用来降低 AI 工具误删文件、越权访问等风险。
谷歌敲定收购 Wiz 交易：Wiz 宣布并入谷歌，主打多云安全与威胁研究能力整合。文章口吻偏官方，但并购本身意味着云安全市场继续集中化。

硬件更像“服务入口”，软件和数据能力成差异点。

MacBook Neo：一台据称 600 美元、用 A18 Pro 的入门 MacBook。卖点是续航与整体体验，短板是 8GB 内存等配置取舍，定位更偏大众主力机。
Google Play 上新：更多付费与 PC 游戏、试玩、社区帖子等功能来了：Google Play 增加付费/PC 游戏、试玩、愿望单、社区帖子等，强调移动与 PC 跨端体验与“试玩后再买”。
Nuro 正在东京街头测试其自动驾驶车辆技术：Nuro 在东京用丰田普锐斯做路测，车上有安全员；强调端到端模型与“零样本”适应新城市，体现其从送货车转向对外授权技术的路线。

一类是硬核实验，一类是用文本挖出结构化数据，都是“把不可测变得可测”。

NASA 的 DART 探测器改变了一颗小行星绕太阳运行的轨道：DART 撞击实验不仅改了小行星互绕轨道，也首次观测到其绕太阳轨道发生可测变化；后续将由 ESA Hera 进一步确认。
Google 正在用旧新闻报道和 AI 预测突发洪水：谷歌用 Gemini 从 500 万篇新闻中抽取洪水事件，做成时空数据集，再训练模型预测闪洪风险，面向气象基础设施薄弱地区做预警补位。
中国脑机接口初创公司 Gestala 上线仅两个月就融资 2100 万美元：主打超声非侵入式 BCI，用于神经刺激与慢性疼痛、精神健康等方向；融资后将扩团队、建厂，并计划用临床数据支撑 AI 解码。
Galaxy Zoo：老牌公民科学项目，靠志愿者分类星系形态帮助研究星系演化，也提供面向公众的科学参与入口。

不靠玄学优化：先找瓶颈，再改数据结构、算法和近似方法。

聊聊内存压力、锁竞争与数据导向设计：Matrix Rust SDK 的聊天室列表排序曾卡到“几分钟不动”，根因是大量分配+锁竞争+算法波动。用数据导向设计把所需字段缓存成紧凑结构后，排序耗时降 98.7%。
绕开三角函数（2013）：图形学里能用向量点积/叉积构造旋转，就别在核心循环里频繁 acos/cos/sin，能省性能也更稳。
更快的 asin() 原来一直藏在眼皮底下：作者为光追做 asin 近似优化，最终发现旧工具包里的 Minimax 多项式实现更快更准，提醒“先查现成方法再造轮子”。
实测：DVD±RW 到底能重写多少次？方法与结果：长期自动化测试显示，多数 DVD±RW 实际重写次数远低于标称 1000 次，普遍只有几百次；寿命受盘片材料、写入速度与光驱兼容影响很大。