/v1/responses) 提供服务。它将 GPT-5.4 的能力带到更快、成本更低的模型中,适合高并发和高调用量场景。
核心能力
- Responses API — 使用新版
/v1/responses端点,用input替代messages - 推理控制 — 可配置推理工作量:none(默认)、low、medium、high 或 xhigh
- 编码和智能体 — 针对编码、计算机使用和子智能体任务优化
- 长上下文 — 支持 400K token 上下文窗口,最多 128K 输出 token
- 多模态输入 — 支持文本和图片输入,输出文本
- 工具调用 — 支持函数调用,以及 Responses API 中的 web search、file search、code interpreter、computer use 等工具
- 流式输出 — 通过 SSE 实现实时 Token 流式传输
快速示例
参数说明
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
model | string | 是 | 固定为 gpt-5.4-mini |
input | array | 是 | { role, content } 对象数组 |
stream | boolean | 否 | 开启 SSE 流式传输,默认 false |
top_p | float | 否 | 核采样阈值,默认 1 |
max_output_tokens | integer | 否 | 最大输出 Token 数 |
reasoning | object | 否 | { effort, summary } — 控制推理深度。effort 支持 none、low、medium、high、xhigh |
text | object | 否 | { format, verbosity } — 控制输出格式和详细度 |
tools | array | 否 | 模型可调用的工具列表 |
store | boolean | 否 | 存储响应以供后续检索,默认 true |
API 参考
查看 GPT-5.4 Mini 的交互式 API Playground。