Claude 推出的 Opus 4.6 和 Sonnet 4.6 模型现已全面开放 100 万(1M)令牌的上下文窗口。该功能以标准价格提供,支持极高容量的多模态输入(如 600 张图片或 PDF),显著解决了长文本任务中常见的上下文压缩和信息丢失问题。通过提升召回率和推理能力,新版本让法律审核、代码分析和科学研究等复杂任务变得更加高效、精准。
核心更新与技术参数
- 全容量,无溢价:100 万令牌窗口按标准价格收费,无长文本附加费。Opus 4.6 为每百万令牌 $5(输入)/$25(输出),Sonnet 4.6 为 $3/$15。
- 满额速率限制:在整个 1M 窗口内,用户享有与标准长度一致的账户吞吐率,不会因输入过长而被限速。
- 多媒体支持提升 6 倍:单次请求现可处理最多 600 张图片或 PDF 页面(原为 100 张)。
- 无缝集成:无需特殊的 Beta 请求头,超过 200K 令牌的请求将自动处理。该功能已在 Claude Code 以及 Team 和 Enterprise 版本中默认启用。
解决“信息丢失”痛点
以往处理超长文本时,系统往往需要进行“上下文压缩”或清理,这会导致关键细节丢失。1M 窗口的普及改变了这一现状:
“100 万令牌的上下文意味着你可以加载整个代码库或数千页合同,而不再需要进行有损压缩。对话内容能保持完整,逻辑不再中断。”
- 精准召回:Opus 4.6 在 1M 长度下的 MRCR v2 测试中得分 78.3%,在同类模型中表现顶尖。
- 更高效的执行:大窗口减少了智能体(Agent)反复读取和处理碎片的开销,实际运行中更加节省令牌。
- 减少调试循环:在开发场景中,模型可以一次性检索数据库、日志和源码,直接提出修复建议,避免了因记忆模糊导致的低效调试。
典型应用场景
- 法律行业:律师可以在单一会话中对比多轮、数百页的协议,追踪谈判的完整脉络,无需在不同版本间反复切换。
- 软件工程:能够处理超大规模的代码差分(Diff),保持文件间的依赖关系,提供更高质量的代码审查。
- 科学研究:支持同时分析数百篇论文、数学框架和模拟代码,加速物理等基础学科的研究进程。
- 故障排查:在处理大型生产系统事故时,模型能从第一个警报到最终修复方案,全程锁定所有信号和技术理论。
获取途径
1M 上下文窗口现已在 Claude Platform 原生可用,并同步上线至 Amazon Bedrock、Google Cloud Vertex AI 以及 Microsoft Azure Foundry。针对 Claude Code 的高级用户,系统将自动默认使用该窗口。