核心能力
- OpenAI 兼容 — 可直接替换 OpenAI SDK,无需修改其他代码
- 256K 上下文 — 262,144 tokens,支持大规模文档和多轮对话
- 多模态输入 — 支持文本、图片和视频输入
- 思考模式 — 通过
thinking参数开启/关闭,返回reasoning_content推理过程,并支持 Preserved Thinking - 长程编码 — 在 Rust、Go、Python 等多语言和前端、运维、性能优化等场景下更可靠
- 丰富能力 — 支持 Tool Calls(函数调用)、JSON Mode、Partial Mode、联网搜索与自动上下文缓存
快速示例
注意:image_url和video_url支持两种格式:base64 数据 URI(data:image/png;base64,.../data:video/mp4;base64,...)或文件引用(ms://<file_id>)。命中上下文缓存的 Token 数会在响应的usage.prompt_tokens_details.cached_tokens中体现。
参数说明
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
model | string | 是 | 固定为 kimi-k2.6 |
messages | array | 是 | { role, content } 对象数组。content 可为字符串,或包含 text/image_url/video_url 的多模态数组 |
thinking | object | 否 | 控制思考模式,如 {"type": "enabled"}(默认)或 {"type": "disabled"};keep: "all" 可启用 Preserved Thinking |
max_completion_tokens | integer | 否 | 最大生成 Token 数。(max_tokens 已弃用且不生效) |
temperature | float | 否 | 0–2,控制随机性,默认 1 |
stream | boolean | 否 | 开启 SSE 流式传输,默认 false |
top_p | float | 否 | 核采样阈值,默认 1 |
response_format | object | 否 | 设为 {"type": "json_object"} 可启用 JSON Mode |
tools | array | 否 | 模型可调用的工具列表(函数调用) |
stop | string / array | 否 | 触发停止生成的序列,最多 5 个,每个不超过 32 字节 |
API 参考
查看 Kimi-K2.6 的交互式 API Playground。