Gemini 3

谷歌发布了其最新、最智能的 AI 模型 Gemini 3，该模型在推理、多模态理解和编码方面实现了显著飞跃。其核心版本 Gemini 3 Pro 在多项基准测试中表现出博士级水平，能够处理文本、图像、视频等多种信息。即将推出的 Gemini 3 Deep Think 模式将进一步增强其解决复杂问题的能力。该模型现已集成到谷歌搜索、Gemini 应用及开发者平台中，并推出了名为 Google Antigravity 的新开发平台，旨在负责任地推动 AI 技术发展。

新一代智能模型：Gemini 3

Gemini 3 是谷歌 AI 发展的新里程碑，它整合了前几代模型的全部功能，旨在帮助用户将任何想法变为现实。与前代相比，Gemini 3 能够更好地理解用户请求背后的背景和意图，从而提供更精准的回答。

AI 在短短两年内，已经从简单地阅读文本和图像，发展到了能够“察言观色”的水平。

目前，Gemini 3 已全面应用于谷歌的各项产品中，包括首次在发布当天就集成到谷歌搜索的 AI 模式中。

卓越的性能与推理能力

Gemini 3 Pro 在所有主要的 AI 基准测试中都显著优于之前的模型，展现了其顶尖的性能。

博士级推理： 在 Humanity’s Last Exam (人类最后的考试) 和 GPQA Diamond 等高难度测试中取得高分。
数学与编码新标准： 在 MathArena Apex 等数学基准测试中创造了新的纪录。
多模态理解： 在处理图像、视频等多种媒体的 MMMU-Pro 和 Video-MMMU 测试中得分领先。
事实准确性： 在 SimpleQA Verified 测试中表现出色，证明其在处理事实性问题上的可靠性。

Gemini 3 Pro 的回答智能、简洁且直接，它更像一个真正的思想伙伴，能提供深刻的见解，而不是客套话。

Gemini 3 Deep Think：挑战更复杂的问题

Gemini 3 Deep Think 是一个增强的推理模式，旨在将模型的智能水平推向新的高度，以解决更复杂、更具挑战性的问题。

在测试中，Deep Think 模式在 Humanity’s Last Exam 等基准上的表现甚至超过了 Gemini 3 Pro。
它在 ARC-AGI-2 测试中取得了前所未有的成绩，展示了其解决全新挑战的强大能力。

实际应用：学习、构建与规划

Gemini 3 强大的多模态和推理能力使其在日常生活中非常实用。

学习任何事： 它可以将不同语言的手写食谱翻译整理成家庭食谱，或将学术论文和视频讲座转化为互动式学习卡片。
构建任何事： 作为一款出色的“氛围编码”和代理编码模型，它可以帮助开发者更高效地将想法变为现实。它能处理复杂的指令，生成更丰富的交互式网页界面。
规划任何事： Gemini 3 能够可靠地规划更长期的任务，例如管理一个模拟的自动售货机业务，或在现实生活中处理预订本地服务、整理收件箱等多步骤工作流。

面向开发者：Google Antigravity 平台

谷歌推出了一个全新的代理式开发平台 Google Antigravity，旨在重塑开发者的工作体验。

从工具到伙伴： 该平台将 AI 从开发工具包中的一个工具，提升为一个能够自主工作的主动合作伙伴。
自主执行： 平台中的 AI 代理可以直接访问编辑器、终端和浏览器，从而能够自主规划和执行复杂的端到端软件任务，并验证自己的代码。

负责任的开发与推广

Gemini 3 是谷歌迄今为止最安全的模型，经过了最全面的安全评估，增强了对提示注入和网络攻击等滥用行为的抵御能力。

目前，Gemini 3 已开始陆续向以下用户推出：

普通用户： 通过 Gemini 应用和谷歌搜索的 AI 模式。
开发者： 通过 AI Studio、Google Antigravity 平台和 Gemini CLI。
企业用户： 通过 Vertex AI 和 Gemini Enterprise。

Gemini 3 Deep Think 模式将在完成额外的安全评估后，于未来几周内向 Google AI Ultra 订阅者开放。