跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.anyfast.ai/llms.txt

Use this file to discover all available pages before exploring further.

Gemini 3 Pro Image Preview(流式)通过 Anyfast 以原生 Gemini API 提供服务,支持实时 SSE 流式返回图片生成结果。思考 chunk 先行推送,最终图片 chunk 紧随其后。
流式输出需要 Direct 分组令牌,需在控制台选择 Direct 分组。

核心能力

  • SSE 流式输出 — 实时推送思考 chunk 与图片 chunk
  • 思考模式 — 内部推理 chunk(thought: true)在图片之前流式输出
  • 文生图 — 根据文本描述生成图片
  • 图片编辑 — 在 inline_data 中传入参考图,配合文字指令进行编辑
  • 宽高比控制1:14:33:416:99:16
  • 分辨率控制1K(~1024px)、2K(~2048px)、4K(~4096px,按长边)

SSE 响应格式

流式端点返回换行分隔的 SSE 数据行,每行以 data: 开头,后跟 JSON 对象。共有三种 chunk 类型:
  1. 思考 chunk — 最先到达;parts[0].thoughttrue
  2. 图片 chunk — 包含 parts[0].inlineData,含 mimeType 和 base64 data(注意:流式响应中为驼峰命名)
  3. 最终用量 chunk — 包含顶层 usageMetadata,含 thoughtsTokenCount 及各模态 token 详情
data: {"candidates":[{"content":{"role":"model","parts":[{"text":"...","thought":true}]}}],"usageMetadata":{"trafficType":"ON_DEMAND"},"modelVersion":"gemini-3-pro-image-preview","createTime":"...","responseId":"..."}

data: {"candidates":[{"content":{"role":"model","parts":[{"inlineData":{"mimeType":"image/png","data":"<base64>"}}]}}],...}

data: {"usageMetadata":{"promptTokenCount":8,"candidatesTokenCount":1120,"totalTokenCount":1392,"trafficType":"ON_DEMAND","promptTokensDetails":[{"modality":"TEXT","tokenCount":8}],"candidatesTokensDetails":[{"modality":"IMAGE","tokenCount":1120}],"thoughtsTokenCount":264}}
流式响应中图片字段名为 inlineData(驼峰),而请求体中字段名为 inline_data(下划线)。这是原生 Gemini API 的行为。

文生图示例

curl "https://www.anyfast.ai/v1beta/models/gemini-3-pro-image-preview:streamGenerateContent?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          { "text": "生成一张山间日落的图片" }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["TEXT", "IMAGE"],
      "imageConfig": {
        "aspectRatio": "16:9",
        "imageSize": "1K"
      }
    }
  }'

图片编辑示例(传入参考图)

在同一个 parts 数组中同时传入 text 指令和 inline_data 参考图。
# 先将图片转为 base64:
# BASE64=$(base64 -i your_photo.jpg)
#
# 然后发送请求:
curl "https://www.anyfast.ai/v1beta/models/gemini-3-pro-image-preview:streamGenerateContent?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "这是我的一张照片,请在我旁边加一只羊驼"
          },
          {
            "inline_data": {
              "mime_type": "image/jpeg",
              "data": "<YOUR_BASE64_ENCODED_IMAGE>"
            }
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["TEXT", "IMAGE"],
      "imageConfig": {
        "aspectRatio": "1:1",
        "imageSize": "1K"
      }
    }
  }'

参数说明

参数类型必填说明
keystringAPI 密钥(查询参数)
altstring设为 sse 可显式开启 SSE 模式(可选,流式为默认行为)
contents[].parts[].textstring文字提示或指令
contents[].parts[].inline_data.mime_typestring参考图类型:image/jpegimage/pngimage/webp
contents[].parts[].inline_data.datastringBase64 编码的参考图数据
generationConfig.responseModalitiesarray["IMAGE"]["TEXT", "IMAGE"]
generationConfig.imageConfig.aspectRatiostring1:1 / 4:3 / 3:4 / 16:9 / 9:16
generationConfig.imageConfig.imageSizestring1K / 2K / 4K(默认 1K

API 参考

查看 Gemini 3 Pro Image Preview(流式)的交互式 API Playground。