Gemini 3

谷歌发布了其最新、最智能的 AI 模型 Gemini 3,该模型在推理、多模态理解和编码方面实现了显著飞跃。其核心版本 Gemini 3 Pro 在多项基准测试中表现出博士级水平,能够处理文本、图像、视频等多种信息。即将推出的 Gemini 3 Deep Think 模式将进一步增强其解决复杂问题的能力。该模型现已集成到谷歌搜索、Gemini 应用及开发者平台中,并推出了名为 Google Antigravity 的新开发平台,旨在负责任地推动 AI 技术发展。

新一代智能模型:Gemini 3

Gemini 3 是谷歌 AI 发展的新里程碑,它整合了前几代模型的全部功能,旨在帮助用户将任何想法变为现实。与前代相比,Gemini 3 能够更好地理解用户请求背后的背景和意图,从而提供更精准的回答。

AI 在短短两年内,已经从简单地阅读文本和图像,发展到了能够“察言观色”的水平。

目前,Gemini 3 已全面应用于谷歌的各项产品中,包括首次在发布当天就集成到谷歌搜索的 AI 模式中。

卓越的性能与推理能力

Gemini 3 Pro 在所有主要的 AI 基准测试中都显著优于之前的模型,展现了其顶尖的性能。

    • 博士级推理: 在 Humanity’s Last Exam (人类最后的考试) 和 GPQA Diamond 等高难度测试中取得高分。
    • 数学与编码新标准: 在 MathArena Apex 等数学基准测试中创造了新的纪录。
    • 多模态理解: 在处理图像、视频等多种媒体的 MMMU-Pro 和 Video-MMMU 测试中得分领先。
    • 事实准确性: 在 SimpleQA Verified 测试中表现出色,证明其在处理事实性问题上的可靠性。

Gemini 3 Pro 的回答智能、简洁且直接,它更像一个真正的思想伙伴,能提供深刻的见解,而不是客套话。

Gemini 3 Deep Think:挑战更复杂的问题

Gemini 3 Deep Think 是一个增强的推理模式,旨在将模型的智能水平推向新的高度,以解决更复杂、更具挑战性的问题。

    • 在测试中,Deep Think 模式在 Humanity’s Last Exam 等基准上的表现甚至超过了 Gemini 3 Pro
    • 它在 ARC-AGI-2 测试中取得了前所未有的成绩,展示了其解决全新挑战的强大能力。

实际应用:学习、构建与规划

Gemini 3 强大的多模态和推理能力使其在日常生活中非常实用。

    • 学习任何事: 它可以将不同语言的手写食谱翻译整理成家庭食谱,或将学术论文和视频讲座转化为互动式学习卡片。
    • 构建任何事: 作为一款出色的“氛围编码”和代理编码模型,它可以帮助开发者更高效地将想法变为现实。它能处理复杂的指令,生成更丰富的交互式网页界面。
    • 规划任何事: Gemini 3 能够可靠地规划更长期的任务,例如管理一个模拟的自动售货机业务,或在现实生活中处理预订本地服务、整理收件箱等多步骤工作流。

面向开发者:Google Antigravity 平台

谷歌推出了一个全新的代理式开发平台 Google Antigravity,旨在重塑开发者的工作体验。

    • 从工具到伙伴: 该平台将 AI 从开发工具包中的一个工具,提升为一个能够自主工作的主动合作伙伴
    • 自主执行: 平台中的 AI 代理可以直接访问编辑器、终端和浏览器,从而能够自主规划和执行复杂的端到端软件任务,并验证自己的代码。

负责任的开发与推广

Gemini 3 是谷歌迄今为止最安全的模型,经过了最全面的安全评估,增强了对提示注入和网络攻击等滥用行为的抵御能力。

目前,Gemini 3 已开始陆续向以下用户推出:

    • 普通用户: 通过 Gemini 应用和谷歌搜索的 AI 模式。
    • 开发者: 通过 AI Studio、Google Antigravity 平台和 Gemini CLI。
    • 企业用户: 通过 Vertex AI 和 Gemini Enterprise。

Gemini 3 Deep Think 模式将在完成额外的安全评估后,于未来几周内向 Google AI Ultra 订阅者开放。