谷歌推出了升级版 AI 模型 Gemini 3.1 Pro,该模型显著提升了核心推理能力,能更好地解决复杂问题。目前,新模型已通过 API、企业平台和消费者应用等多种渠道向用户开放预览。其主要应用场景包括数据综合、复杂主题解释和创意编程等高级任务,旨在推动智能代理工作流的发展。
核心能力升级:更强的推理
Gemini 3.1 Pro 的核心进步体现在其更强的推理和解决复杂问题的能力上。它不仅仅是简单的更新,而是在智能基准上实现了重大飞跃,使其能够处理需要深度思考的挑战。
在一项评估模型解决全新逻辑模式能力的基准测试(ARC-AGI-2)中,3.1 Pro 的得分达到了 77.1%,其推理性能是上一代 3 Pro 的两倍以上。
实际应用场景示例
这种增强的智能使 Gemini 3.1 Pro 在多种实际应用中表现出色,尤其是在那些简单答案不足以解决问题的领域。
- 代码动画生成: 能根据文本提示直接生成可在网站使用的 SVG 动画代码。这种动画文件小,且在任何尺寸下都保持清晰。
- 复杂系统整合: 能够理解复杂的 API,并将其转化为用户友好的界面。例如,模型曾成功配置了一个公共遥测数据流,用以实时可视化国际空间站的轨道。
- 交互式设计: 不仅能生成复杂的 3D 视觉代码,还能构建沉浸式体验,例如允许用户通过手部追踪与虚拟鸟群互动。
- 创意编码: 能够将文学作品的主题(如《呼啸山庄》的氛围)转化为功能性的代码和现代化的网站设计,捕捉作品的精髓。
如何获取与未来展望
谷歌正在通过多个平台推出 Gemini 3.1 Pro,以便开发者、企业和普通消费者都能体验其强大功能。
- 开发者: 可通过 Gemini API、Vertex AI、Gemini CLI 和 Android Studio 等工具进行预览。
- 企业用户: 可通过 Vertex AI 和 Gemini Enterprise 进行访问。
- 普通消费者: Gemini 应用和 NotebookLM 的部分付费用户(Pro 和 Ultra 套餐)可以开始使用。
此次预览发布的目的是为了验证更新,并为未来实现更具雄心的 “智能代理工作流” 收集反馈,之后将很快正式发布。