Synth Daily

派早报:Google 发布 Gemma 4 开源系列模型、智谱发布 GLM-5V-Turbo 多模态模型等

近期科技领域动态频出,Google 发布了新一代开源模型 Gemma 4,具备强大的多模态处理能力和本地运行优势。智谱也推出了专为 Agent 场景优化的多模态模型 GLM-5V-Turbo。同时,Google 宣布将对 Wear OS 应用强制推行 64 位支持。此外,中国广电演员委员会发布声明,严禁未经授权的 AI 换脸和声纹克隆等侵权行为,并呼吁建立合规的授权机制。

Google 发布新一代开源模型 Gemma 4

Google 推出了 Gemma 4 系列开源模型,该系列基于 Gemini 技术构建,特别强调 “参数效率”(即每单位参数的智能程度)和本地运行能力。

  • 多版本覆盖: 提供从 E2B 到 31B Dense 四种规模,满足从移动设备到高性能 GPU 的不同部署需求。其中,31B 模型在性能上已进入开源模型前三。
  • 技术能力强大: 支持最长 256K 上下文窗口,并具备多模态处理能力,可以输入图像、视频和音频。
  • 为开发者优化: 原生支持函数调用、结构化 JSON 输出和系统指令,非常适合用于构建 Agent 工作流,并强化了代码生成能力。
  • 开放与兼容: 采用 Apache 2.0 开源许可证,与 Hugging Face、Ollama 等主流工具链兼容,方便在本地或云端部署。

Gemma 4 的目标是推动人工智能在移动端与边缘计算领域的进一步普及。

智谱发布多模态模型 GLM-5V-Turbo

智谱推出了新的视觉语言模型 GLM-5V-Turbo,旨在解决模型在视觉理解和代码生成能力之间的 “跷跷板效应”,实现二者的平衡。

  • 原生多模态设计: 通过 CogViT 视觉编码器直接处理图像、视频等复杂内容,并结合多 Token 预测架构提升推理效率。
  • 平衡各项能力: 通过覆盖 30 多项任务的联合强化学习训练,在 STEM 推理、视频分析和工具调用等多个方面实现了能力均衡。
  • 适配 Agent 场景: 深度集成了主流工作流,能够基于视觉输入生成代码并完成界面操作,在多模态编程和 GUI 交互等任务中表现出色。

Google 强制 Wear OS 应用支持 64 位

Google 宣布,将把已在手机端实施多年的 64 位应用要求扩展到 Wear OS 智能手表系统。

  • 实施时间: 自今年 9 月起,所有向 Play 商店发布的新应用及更新都必须提供 64 位版本。
  • 执行方式: 不满足要求的版本将无法通过 Play Console 上传。
  • 现有设备: 目前,使用 32 位处理器或系统的设备 暂不受影响,仍可继续运行 32 位应用。

演员委员会就 AI 侵权问题发布声明

针对日益猖獗的 AI 换脸、声纹克隆和素材滥用等行为,中国广播电视社会组织联合会演员委员会发布了严正声明。

任何主体未经书面授权,不得擅自采集、使用或传播演艺人员的肖像、声音及艺术形象。

  • 权利明确: 声明强调演艺人员依法享有 肖像权、声音权及艺术形象权
  • 侵权界定: 即使内容被标注为 “非商用” 或 “公益分享”,擅自使用演员形象或声音的行为依然构成侵权。
  • 平台责任: 要求短视频、直播等平台 加强内容审核,全面排查并下架侵权作品。
  • 未来方向: 委员会将启动常态化维权行动,并倡导建立统一的 授权与收益分配机制,以支持 AI 技术在合规前提下发展。

值得一看的其他消息

  • 据报道,三星下半年将发布的 Galaxy Z Fold 8、Z Flip 8 等多款折叠屏手机将继续采用 M13 基材 的 OLED 面板。
  • Google 升级了每月 20 美元的 AI Pro 订阅,云存储容量提升至 5 TB,并增强了 Gemini 总结邮件和利用网络信息的能力。
  • 有爆料称,索尼 PlayStation 6 掌机 在图形渲染性能上将全面超越微软现款的 Xbox Series S 主机。