跳转到主要内容
Kimi-K2.6 是月之暗面(MoonShot)最新最智能的模型,通过 Anyfast 以 OpenAI 兼容接口提供。相比 Kimi-K2.5,在智能体编码(agentic coding)、长上下文推理、长周期执行和前端设计上有较大升级,同时支持文本、图片与视频输入,以及思考与非思考模式。

核心能力

  • OpenAI 兼容 — 可直接替换 OpenAI SDK,无需修改其他代码
  • 256K 上下文 — 262,144 tokens,支持大规模文档和多轮对话
  • 多模态输入 — 支持文本、图片和视频输入
  • 思考模式 — 通过 thinking 参数开启/关闭,返回 reasoning_content 推理过程,并支持 Preserved Thinking
  • 长程编码 — 在 Rust、Go、Python 等多语言和前端、运维、性能优化等场景下更可靠
  • 丰富能力 — 支持 Tool Calls(函数调用)、JSON Mode、Partial Mode、联网搜索与自动上下文缓存

快速示例

curl https://www.anyfast.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kimi-k2.6",
    "messages": [
      { "role": "user", "content": "用简单的语言解释量子纠缠。" }
    ]
  }'
注意: image_urlvideo_url 支持两种格式:base64 数据 URI(data:image/png;base64,... / data:video/mp4;base64,...)或文件引用(ms://<file_id>)。命中上下文缓存的 Token 数会在响应的 usage.prompt_tokens_details.cached_tokens 中体现。

参数说明

参数类型必填说明
modelstring固定为 kimi-k2.6
messagesarray{ role, content } 对象数组。content 可为字符串,或包含 text/image_url/video_url 的多模态数组
thinkingobject控制思考模式,如 {"type": "enabled"}(默认)或 {"type": "disabled"}keep: "all" 可启用 Preserved Thinking
max_completion_tokensinteger最大生成 Token 数。(max_tokens 已弃用且不生效)
temperaturefloat02,控制随机性,默认 1
streamboolean开启 SSE 流式传输,默认 false
top_pfloat核采样阈值,默认 1
response_formatobject设为 {"type": "json_object"} 可启用 JSON Mode
toolsarray模型可调用的工具列表(函数调用)
stopstring / array触发停止生成的序列,最多 5 个,每个不超过 32 字节

API 参考

查看 Kimi-K2.6 的交互式 API Playground。