跳转到主要内容
Gemini 2.0 Flash 是 Google 的多模态模型,具有图片编辑能力,通过 AnyFast 以原生 Gemini API 提供服务。可以根据文本指令编辑已有图片。

核心能力

  • 图片编辑 — 使用自然语言指令修改已有图片
  • 多模态输入 — 同时接受文本指令和源图片
  • 文本生成 — 同时支持标准文本生成任务
  • 高效灵活 — 适用于各种多模态任务

快速示例

curl "https://www.anyfast.ai/v1beta/models/gemini-2.0-flash:generateContent?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [
          { "text": "把背景换成海滩场景" },
          { "inline_data": { "mime_type": "image/png", "data": "BASE64_DATA" } }
        ]
      }
    ],
    "generationConfig": {
      "responseModalities": ["IMAGE"]
    }
  }'

参数说明

参数类型必填说明
keystringAPI 密钥(查询参数)
contentsarray包含 text 和 inline_data 的 { role, parts } 数组
generationConfig.responseModalitiesarray必须包含 IMAGE

API 参考

查看 Gemini 2.0 Flash 的交互式 API Playground。