核心能力
- 文生图 — 根据文本描述生成图片
- 图片编辑 — 在
inline_data中传入参考图,配合文字指令进行编辑 - 宽高比控制 —
1:1、4:3、3:4、16:9、9:16 - 分辨率控制 —
1K(~1024px)、2K(~2048px)、4K(~4096px,按长边) - 多模态输出 — 通过
responseModalities: ["TEXT", "IMAGE"]同时返回图片和文字说明
文生图示例
图片编辑示例(传入参考图)
在同一个parts 数组中同时传入 text 指令和 inline_data 参考图。
参数说明
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
key | string | 是 | API 密钥(查询参数) |
contents[].parts[].text | string | 是 | 文字提示或指令 |
contents[].parts[].inline_data.mime_type | string | 否 | 参考图类型:image/jpeg、image/png、image/webp |
contents[].parts[].inline_data.data | string | 否 | Base64 编码的参考图数据 |
generationConfig.responseModalities | array | 是 | ["IMAGE"] 或 ["TEXT", "IMAGE"] |
generationConfig.imageConfig.aspectRatio | string | 否 | 1:1 / 4:3 / 3:4 / 16:9 / 9:16 |
generationConfig.imageConfig.imageSize | string | 否 | 1K / 2K / 4K(默认 1K) |
API 参考
查看 Gemini 3 Pro Image Preview 的交互式 API Playground。