每日科技摘要-12-19-早报
人工智能技术与应用
大语言模型持续进化,正从简单的对话工具转向具备专业编码、多模态处理和任务执行能力的智能代理。
- GPT-5.2-Codex:OpenAI 发布针对软件工程和网络安全优化的新模型,提升了大规模代码重构和漏洞发现能力,将逐步向付费用户开放。
- OpenAI 在 ChatGPT 里上线了自己的应用商店:ChatGPT 正式开放应用目录,用户可直接在聊天中调用 Booking、Spotify 等第三方服务来处理杂货订购或查找房源。
- T5Gemma 2:新一代编码器-解码器模型:谷歌发布基于 Gemma 3 架构的多模态长上下文模型,支持 128K 窗口和 140 多种语言,适合设备端部署。
- FunctionGemma 270M 模型:专门针对“函数调用”微调的轻量级模型,能将自然语言精准转化为 API 操作,可在手机等边缘设备运行。
- TRELLIS.2:新一代 4B 级三维生成模型巅峰之作:微软开源的 3D 生成模型,支持高分辨率图像到 3D 资产的高保真转换,突破了复杂几何结构的生成限制。
- Luma 推出全新 AI 模型,可根据起始帧和结束帧自动生成完整视频:新模型 Ray3 Modify 支持通过参考图修改视频角色,并能根据起止两帧自动补全过渡画面。
- Meta Segment Anything Model 音频:Meta 推出 SAM Audio,可根据文字或视觉提示,从复杂环境中精准分离出特定的声音、音乐或人声。
- Google 推出 Gemini 应用,可检测视频是否由 Google AI 生成:通过扫描专有的 SynthID 水印,Gemini 现在可以识别并指出视频中由 AI 生成的具体部分。
网络安全与个人隐私
供应链漏洞威胁大型平台安全,智能硬件的隐私监控和 AI 驱动的新型诈骗引发广泛关注。
- 我们通过供应链攻击拿下了 X、Vercel、Cursor 和 Discord:16 岁黑客利用 AI 文档平台 Mintlify 的漏洞,成功入侵数百家公司的文档系统并窃取凭证,暴露出供应链单一环节失守的巨大风险。
- 德州起诉所有电视巨头:偷偷监控你在看什么:三星、索尼、LG 等厂商被控通过自动内容识别技术频繁截屏用户画面并收集数据用于广告,涉嫌违反欺诈贸易法。
- 用超逼真 AI 换脸技术驱动的恋爱骗局平台:一款名为“昊天”的换脸软件因其实时视频伪装能力被东南亚诈骗团伙广泛使用,涉案金额巨大。
- 英格兰 NHS 技术服务商确认发生数据泄露:医疗技术公司 DXS 遭勒索软件攻击,约 300GB 数据被窃,目前正排查是否涉及患者敏感信息。
- OpenAI 和 Anthropic 将开始预测用户是否为未成年人:为提升青少年安全,AI 巨头正在开发识别未成年用户的新方法,并更新了更严格的互动指南。
行业政策与全球竞争
各国监管机构加强对科技巨头的反垄断审查,同时中国在半导体关键领域取得进展。
- 中国版“曼哈顿计划”:如何打造对抗西方的 AI 芯片体系:中国科学家据称已成功研发出极紫外光刻机(EUV)原型机,旨在 2030 年前实现先进制程芯片的自主生产。
- 苹果在日本向竞争对手开放其 App Store:受日本新规压力,苹果允许在当地使用第三方应用商店和支付方式,但仍通过复杂的收费结构维持收入。
- 特朗普媒体将与聚变能源公司 TAE Technologies 达成超 60 亿美元合并交易:特朗普旗下的社交媒体公司宣布跨界进入核聚变领域,计划建设全球首个实用规模的聚变电站。
- 本田将暂停日本和中国工厂生产:由于芯片供应链再次出现短缺,本田宣布暂时关闭部分生产线,反映出半导体贸易限制的持续影响。
开发趋势与软件工程
“氛围编码(Vibe Coding)”兴起,开发者正利用 AI 改变传统的代码编写与验证流程。
- 两种 Vibe 编码方式:开发者分享如何让 AI 自主编写上万行复杂代码。核心规则是:先自动化测试,再测试测试本身,人类需转向“元认知”管理。
- 主打“氛围编码”的初创公司 Lovable 融资 3.3 亿美元:瑞典公司 Lovable 估值飙升至 66 亿美元,其工具能根据简单提示生成企业级应用。
- 你的工作是交付你已经验证可用的代码:作者强调在 AI 时代,开发者的职责不再是写代码,而是确保代码经过手动和自动化的双重验证,避免浪费他人的评审时间。
- 这些年我一直把环形缓冲区写错了(2016):一篇经典的工程分析文章,探讨了如何利用无符号整数溢出自动回绕来编写最高效的环形缓冲区代码。
- 请先试试用 HTMX:作者呼吁回归简洁,认为 HTMX 是 React 等复杂前端框架的绝佳替代方案,能大幅减少代码量并提升开发体验。
其他值得关注的消息
- 自 2026 年 1 月起,所有 ACM 出版物将全面开放获取:计算机科学领域的重要学术出版机构 ACM 将全面转型为开放获取模式。
- 自 2026 年 1 月起,所有 ACM 出版物将全面开放获取:计算机科学领域的重要学术出版机构 ACM 将全面转型为开放获取模式。
- 亚马逊推出全新 Alexa+ 功能:为 Ring 门铃加入对话式 AI:Alexa 现在可以根据视觉识别访客身份(如快递员或推销员),并代领留言或指示包裹存放位置。
- Rivian 推出全新「通用免手」驾驶功能:更新后的系统支持在美加 350 万英里的道路上实现脱手驾驶,覆盖范围大幅增加。
- PDF Craft – 基于 DeepSeek OCR 的高保真转换工具:一款开源工具,利用 DeepSeek 技术将扫描版 PDF 转换为高质量的 Markdown 或 EPUB,特别擅长公式处理。