GPT-5.4 Mini - Anyfast

GPT-5.4 Mini 通过 Anyfast 以 OpenAI Responses API (/v1/responses) 提供服务。它将 GPT-5.4 的能力带到更快、成本更低的模型中，适合高并发和高调用量场景。

核心能力

Responses API — 使用新版 /v1/responses 端点，用 input 替代 messages
推理控制 — 可配置推理工作量：none（默认）、low、medium、high 或 xhigh
编码和智能体 — 针对编码、计算机使用和子智能体任务优化
长上下文 — 支持 400K token 上下文窗口，最多 128K 输出 token
多模态输入 — 支持文本和图片输入，输出文本
工具调用 — 支持函数调用，以及 Responses API 中的 web search、file search、code interpreter、computer use 等工具
流式输出 — 通过 SSE 实现实时 Token 流式传输

快速示例

curl https://www.anyfast.ai/v1/responses \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gpt-5.4-mini",
    "input": [
      { "role": "user", "content": "用简单的语言解释量子纠缠。" }
    ],
    "reasoning": {
      "effort": "medium",
      "summary": "auto"
    },
    "text": {
      "format": { "type": "text" },
      "verbosity": "medium"
    },
    "store": true
  }'

参数说明

参数	类型	必填	说明
`model`	string	是	固定为 `gpt-5.4-mini`
`input`	array	是	`{ role, content }` 对象数组
`stream`	boolean	否	开启 SSE 流式传输，默认 `false`
`top_p`	float	否	核采样阈值，默认 `1`
`max_output_tokens`	integer	否	最大输出 Token 数
`reasoning`	object	否	`{ effort, summary }` — 控制推理深度。`effort` 支持 `none`、`low`、`medium`、`high`、`xhigh`
`text`	object	否	`{ format, verbosity }` — 控制输出格式和详细度
`tools`	array	否	模型可调用的工具列表
`store`	boolean	否	存储响应以供后续检索，默认 `true`

API 参考

查看 GPT-5.4 Mini 的交互式 API Playground。

​核心能力

​快速示例

​参数说明

API 参考

核心能力

快速示例

参数说明