核心能力
- 1M 上下文窗口 — 默认 1M Token,最大输出 Token 为 128K
- 自适应思维 — 默认开启,可通过
output_config.effort控制深度,或使用thinking: {"type": "disabled"}关闭 - API 形状不变 — 请求、响应和流式输出与 Claude Sonnet 4.6 保持一致
- 新的 tokenizer — 相同文本大约会比 Claude Sonnet 4.6 多 30% Token
- 模型 ID — 使用
claude-sonnet-5
快速示例
参数说明
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
model | string | 是 | 固定为 claude-sonnet-5 |
messages | array | 是 | { role, content } 对象数组 |
max_tokens | integer | 是 | 最大生成 Token 数。Claude Sonnet 5 最多支持 128K 输出 Token。 |
output_config | object | 否 | 使用 {"effort":"low" | "medium" | "high" | "xhigh" | "max"} 控制自适应思维深度。默认 high |
thinking | object | 否 | 省略时使用默认自适应思维,或使用 {"type":"disabled"} 关闭思维。 |
stream | boolean | 否 | 开启 SSE 流式传输,默认 false |
stop_sequences | array | 否 | 触发停止生成的序列 |
Claude Sonnet 5 默认使用自适应思维。请用
output_config.effort 调整推理深度(low、medium、high、xhigh 或 max)。手动扩展思维(thinking: {type: "enabled", budget_tokens: N})会返回 400 错误,temperature、top_p、top_k 设为非默认值也会返回 400 错误。要关闭思维时,请使用 thinking: {type: "disabled"}。Claude Sonnet 5 使用了新的 tokenizer。相同文本大约会比 Claude Sonnet 4.6 多 30% Token,所以迁移前要重新统计提示词和
max_tokens 预算。涉及被禁止或高风险网络安全主题的请求可能会被拒绝。被拒绝时会返回
stop_reason: "refusal"。API 参考
查看 Claude Sonnet 5 的交互式 API Playground。