AI 代理进入日常工具与职场
AI 不再只是聊天框,开始接管“收集—整理—执行”的一段流程,但计费、权限和透明度仍是硬问题。
- Notion 年度更新评测:7 个案例聊聊 Custom Agent:Notion 推出 Custom Agent,可用触发器+指令自动汇总信息、跟进任务、写邮件、回复咨询、发推文/博客,还能接外部 API。强依赖你在 Notion 里的数据积累;积分计费和权限稳定性仍待观察。
- Perplexity 的个人电脑:把“操作系统执行命令”改成“AI 接受目标并代你操作”。强调本地文件与应用访问、操作需用户确认和可追溯,但目前更像一个等待名单中的产品概念。
- 我被 AI 机器人面试了,找工作也太魔幻了吧:AI 面试官用于初筛,号称扩大候选人覆盖并减少偏见;但偏见可能从训练数据里“换个形式继续存在”,也让求职者更难与真人沟通。
AI 进入知识生产:效率飙升,评价体系跟不上
论文、代码都能更快产出,但“好不好”越来越依赖人类评审与清晰标准。
- 年度征文|Vibe Research:社会科学的第一次 AI 危机?:作者把 AI 视为“数字分身”,能改写定性研究与写作流程;同时也指出学界抵触来自路径依赖与价值观冲突。未来更看重研究判断力而不只是产量。
- 许多能通过 SWE-bench 的 PR 也未必能被合并:研究发现,通过自动基准不等于能进真实仓库:约一半 AI 生成 PR 即便过了 SWE-bench,也不会被维护者合并。问题集中在质量、完整性、对现有代码影响与缺少迭代反馈。
- LLM 时代的可靠软件:用可执行规格语言 Quint 做“验证层”,再配合 LLM 改复杂共识协议,号称一周完成大改并更可验证。重点是用规格与模型测试压住 AI 代码的不确定性。
- 别发 AI 生成或 AI 润色过的评论。HN 是人和人交流的地方。:Hacker News 明确反对 AI 生成评论,强调社区讨论要基于真实阅读与真实观点,降低“自动灌水”对交流质量的破坏。
开发平台与模型:多模态、时间 API、WebAssembly 更进一步
基础能力在补短板:多模态检索、时间处理、跨语言组件化,都是“让工程能落地”的变化。
- 派早报:Google 发布 Gemini Embedding 2 模型等:Gemini Embedding 2 做多模态嵌入(文本/图像/视频/音频/文档),面向检索与推荐等场景;同时还提到联发科 IoT 芯片平台更新、ComfyUI 增加更易用的 App 模式,以及多款硬件新品。
- Temporal:修复 JavaScript 时间问题的 9 年征程:Temporal 试图终结 JS Date 的老毛病:不可变、时区/历法支持、日期运算更可靠。文章回顾 TC39 多年推进与跨引擎实现路径,指向 Web 生态更一致的时间处理方式。
- 让 WebAssembly 成为 Web 上的一等语言:Mozilla 介绍 WebAssembly 组件模型:把可执行物打包成标准组件,减少 JavaScript “胶水代码”,并朝更直接调用 Web API 的方向走,目标是让多语言上 Web 更自然。
- BitNet:1-bit LLM 推理框架:微软开源 bitnet.cpp,用于高效跑 1-bit/1.58-bit 模型,主打 CPU 也能推大模型、能耗更低。对本地推理和边缘设备更友好,但仍受模型生态与工具链成熟度影响。
安全与隐私:数据泄露、AI 署名与“代理权限”成焦点
新风险不只来自黑客,也来自产品设计:把权限交给代理、把人名塞进 AI 功能,都可能出事。
- 10亿条身份记录在身份验证数据泄露事件中遭曝光:疑似与身份验证公司相关的未加密数据库暴露,涉及姓名、地址、出生日期等敏感信息。建议包括冻结信用、减少短信验证依赖、加强账户防护。
- Grammarly 一位“专家”因其涉嫌盗用身份的 AI 功能起诉公司:被指未经许可使用真人身份作为“专家评审”AI 建议来源,引发集体诉讼。核心争议是肖像/隐私与“AI 引用权威”的边界。
- 国家互联网应急中心:OpenClaw 风险提示:风险点包括提示词注入、误操作、插件投毒与漏洞等,可能带来隐私泄露和系统被控。建议隔离环境使用、谨慎装插件、从可信渠道获取。
- Show HN:一个面向 Claude Code 的上下文感知权限守卫:用“预执行钩子”拦截命令,根据上下文细分权限(路径、操作类型等),可审计、可扩展,用来降低 AI 工具误删文件、越权访问等风险。
- 谷歌敲定收购 Wiz 交易:Wiz 宣布并入谷歌,主打多云安全与威胁研究能力整合。文章口吻偏官方,但并购本身意味着云安全市场继续集中化。
终端与出行:更便宜的 Mac、更多 PC 游戏、自动驾驶出海测试
硬件更像“服务入口”,软件和数据能力成差异点。
- MacBook Neo:一台据称 600 美元、用 A18 Pro 的入门 MacBook。卖点是续航与整体体验,短板是 8GB 内存等配置取舍,定位更偏大众主力机。
- Google Play 上新:更多付费与 PC 游戏、试玩、社区帖子等功能来了:Google Play 增加付费/PC 游戏、试玩、愿望单、社区帖子等,强调移动与 PC 跨端体验与“试玩后再买”。
- Nuro 正在东京街头测试其自动驾驶车辆技术:Nuro 在东京用丰田普锐斯做路测,车上有安全员;强调端到端模型与“零样本”适应新城市,体现其从送货车转向对外授权技术的路线。
科学与工程:从防小行星到“用旧新闻喂模型”
一类是硬核实验,一类是用文本挖出结构化数据,都是“把不可测变得可测”。
- NASA 的 DART 探测器改变了一颗小行星绕太阳运行的轨道:DART 撞击实验不仅改了小行星互绕轨道,也首次观测到其绕太阳轨道发生可测变化;后续将由 ESA Hera 进一步确认。
- Google 正在用旧新闻报道和 AI 预测突发洪水:谷歌用 Gemini 从 500 万篇新闻中抽取洪水事件,做成时空数据集,再训练模型预测闪洪风险,面向气象基础设施薄弱地区做预警补位。
- 中国脑机接口初创公司 Gestala 上线仅两个月就融资 2100 万美元:主打超声非侵入式 BCI,用于神经刺激与慢性疼痛、精神健康等方向;融资后将扩团队、建厂,并计划用临床数据支撑 AI 解码。
- Galaxy Zoo:老牌公民科学项目,靠志愿者分类星系形态帮助研究星系演化,也提供面向公众的科学参与入口。
工程实践与性能:把卡顿、函数调用和老介质“测清楚”
不靠玄学优化:先找瓶颈,再改数据结构、算法和近似方法。
- 聊聊内存压力、锁竞争与数据导向设计:Matrix Rust SDK 的聊天室列表排序曾卡到“几分钟不动”,根因是大量分配+锁竞争+算法波动。用数据导向设计把所需字段缓存成紧凑结构后,排序耗时降 98.7%。
- 绕开三角函数(2013):图形学里能用向量点积/叉积构造旋转,就别在核心循环里频繁 acos/cos/sin,能省性能也更稳。
- 更快的 asin() 原来一直藏在眼皮底下:作者为光追做 asin 近似优化,最终发现旧工具包里的 Minimax 多项式实现更快更准,提醒“先查现成方法再造轮子”。
- 实测:DVD±RW 到底能重写多少次?方法与结果:长期自动化测试显示,多数 DVD±RW 实际重写次数远低于标称 1000 次,普遍只有几百次;寿命受盘片材料、写入速度与光驱兼容影响很大。