Opus 4.6 和 Sonnet 4.6 现已正式开放 1M 上下文

Claude 推出的 Opus 4.6 和 Sonnet 4.6 模型现已全面开放 100 万（1M）令牌的上下文窗口。该功能以标准价格提供，支持极高容量的多模态输入（如 600 张图片或 PDF），显著解决了长文本任务中常见的上下文压缩和信息丢失问题。通过提升召回率和推理能力，新版本让法律审核、代码分析和科学研究等复杂任务变得更加高效、精准。

核心更新与技术参数

全容量，无溢价：100 万令牌窗口按标准价格收费，无长文本附加费。Opus 4.6 为每百万令牌 $5（输入）/$25（输出），Sonnet 4.6 为 $3/$15。
满额速率限制：在整个 1M 窗口内，用户享有与标准长度一致的账户吞吐率，不会因输入过长而被限速。
多媒体支持提升 6 倍：单次请求现可处理最多 600 张图片或 PDF 页面（原为 100 张）。
无缝集成：无需特殊的 Beta 请求头，超过 200K 令牌的请求将自动处理。该功能已在 Claude Code 以及 Team 和 Enterprise 版本中默认启用。

解决“信息丢失”痛点

以往处理超长文本时，系统往往需要进行“上下文压缩”或清理，这会导致关键细节丢失。1M 窗口的普及改变了这一现状：

“100 万令牌的上下文意味着你可以加载整个代码库或数千页合同，而不再需要进行有损压缩。对话内容能保持完整，逻辑不再中断。”

精准召回：Opus 4.6 在 1M 长度下的 MRCR v2 测试中得分 78.3%，在同类模型中表现顶尖。
更高效的执行：大窗口减少了智能体（Agent）反复读取和处理碎片的开销，实际运行中更加节省令牌。
减少调试循环：在开发场景中，模型可以一次性检索数据库、日志和源码，直接提出修复建议，避免了因记忆模糊导致的低效调试。

典型应用场景

法律行业：律师可以在单一会话中对比多轮、数百页的协议，追踪谈判的完整脉络，无需在不同版本间反复切换。
软件工程：能够处理超大规模的代码差分（Diff），保持文件间的依赖关系，提供更高质量的代码审查。
科学研究：支持同时分析数百篇论文、数学框架和模拟代码，加速物理等基础学科的研究进程。
故障排查：在处理大型生产系统事故时，模型能从第一个警报到最终修复方案，全程锁定所有信号和技术理论。

获取途径

1M 上下文窗口现已在 Claude Platform 原生可用，并同步上线至 Amazon Bedrock、Google Cloud Vertex AI 以及 Microsoft Azure Foundry。针对 Claude Code 的高级用户，系统将自动默认使用该窗口。