跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.anyfast.ai/llms.txt

Use this file to discover all available pages before exploring further.

Gemini 2.5 Flash Image(流式)通过 Anyfast 以原生 Gemini API 提供服务,支持实时 SSE 流式返回图片生成结果。思考 chunk 先行推送,最终图片 chunk 紧随其后。
流式输出需要 Direct 分组令牌,需在控制台选择 Direct 分组。

核心能力

  • SSE 流式输出 — 实时推送思考 chunk 与图片 chunk
  • 思考模式 — 内部推理 chunk(thought: true)在图片之前流式输出
  • 文生图 — 根据文本描述生成图片
  • 图片编辑 — 在 inline_data 中传入参考图,配合文字指令进行编辑
  • 宽高比控制1:14:33:416:99:16
  • 分辨率控制1K(~1024px)、2K(~2048px)、4K(~4096px,按长边)

SSE 响应格式

流式端点返回换行分隔的 SSE 数据行,每行以 data: 开头,后跟 JSON 对象。共有三种 chunk 类型:
  1. 思考 chunk — 最先到达;parts[0].thoughttrue
  2. 图片 chunk — 包含 parts[0].inlineData,含 mimeType 和 base64 data(注意:流式响应中为驼峰命名)
  3. 最终用量 chunk — 包含顶层 usageMetadata,含 thoughtsTokenCount 及各模态 token 详情
data: {"candidates":[{"content":{"role":"model","parts":[{"text":"...","thought":true}]}}],"usageMetadata":{"trafficType":"ON_DEMAND"},"modelVersion":"gemini-2.5-flash-image","createTime":"...","responseId":"..."}

data: {"candidates":[{"content":{"role":"model","parts":[{"inlineData":{"mimeType":"image/png","data":"<base64>"}}]}}],...}

data: {"usageMetadata":{"promptTokenCount":8,"candidatesTokenCount":1120,"totalTokenCount":1392,"trafficType":"ON_DEMAND","promptTokensDetails":[{"modality":"TEXT","tokenCount":8}],"candidatesTokensDetails":[{"modality":"IMAGE","tokenCount":1120}],"thoughtsTokenCount":264}}
流式响应中图片字段名为 inlineData(驼峰),而请求体中字段名为 inline_data(下划线)。这是原生 Gemini API 的行为。

文生图示例

curl "https://www.anyfast.ai/v1beta/models/gemini-2.5-flash-image:streamGenerateContent?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          { "text": "生成一张山间日落的图片" }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["TEXT", "IMAGE"],
      "imageConfig": {
        "aspectRatio": "16:9",
        "imageSize": "1K"
      }
    }
  }'

图片编辑示例(传入参考图)

在同一个 parts 数组中同时传入 text 指令和 inline_data 参考图。
# 先将图片转为 base64:
# BASE64=$(base64 -i your_photo.jpg)
#
# 然后发送请求:
curl "https://www.anyfast.ai/v1beta/models/gemini-2.5-flash-image:streamGenerateContent?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          {
            "text": "这是我的一张照片,请在我旁边加一只羊驼"
          },
          {
            "inline_data": {
              "mime_type": "image/jpeg",
              "data": "<YOUR_BASE64_ENCODED_IMAGE>"
            }
          }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["TEXT", "IMAGE"],
      "imageConfig": {
        "aspectRatio": "1:1",
        "imageSize": "1K"
      }
    }
  }'

参数说明

参数类型必填说明
keystringAPI 密钥(查询参数)
altstring设为 sse 可显式开启 SSE 模式(可选,流式为默认行为)
contents[].parts[].textstring文字提示或指令
contents[].parts[].inline_data.mime_typestring参考图类型:image/jpegimage/pngimage/webp
contents[].parts[].inline_data.datastringBase64 编码的参考图数据
generationConfig.responseModalitiesarray["IMAGE"]["TEXT", "IMAGE"]
generationConfig.imageConfig.aspectRatiostring1:1 / 4:3 / 3:4 / 16:9 / 9:16
generationConfig.imageConfig.imageSizestring1K / 2K / 4K(默认 1K

API 参考

查看 Gemini 2.5 Flash Image(流式)的交互式 API Playground。