Google 已于 2026 年 5 月 28 日发布
gemini-3-pro-image,这是原生视觉模型 Gemini 3 Pro Image(Nano Banana Pro)的正式版(GA)。请使用这个稳定模型 ID 替代 gemini-3-pro-image-preview,后者已弃用并计划于 2026 年 6 月 25 日关停。核心能力
- 文生图 — 根据文本描述生成图片
- 图片编辑 — 在
inline_data中传入参考图,配合文字指令进行编辑 - 宽高比控制 —
1:1、4:3、3:4、16:9、9:16 - 分辨率控制 —
1K(~1024px)、2K(~2048px)、4K(~4096px,按长边) - 多模态输出 — 通过
responseModalities: ["TEXT", "IMAGE"]同时返回图片和文字说明
注意: 如果需要生成的图片返回 URL,请在创建 API 令牌时选择 Aggregate-NanoUrl 分组。
文生图示例
图片编辑示例(传入参考图)
在同一个parts 数组中同时传入 text 指令和 inline_data 参考图。
参数说明
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
key | string | 是 | API 密钥(查询参数) |
contents[].parts[].text | string | 是 | 文字提示或指令 |
contents[].parts[].inline_data.mime_type | string | 否 | 参考图类型:image/jpeg、image/png、image/webp |
contents[].parts[].inline_data.data | string | 否 | Base64 编码的参考图数据 |
generationConfig.responseModalities | array | 是 | ["IMAGE"] 或 ["TEXT", "IMAGE"] |
generationConfig.imageConfig.aspectRatio | string | 否 | 1:1 / 4:3 / 3:4 / 16:9 / 9:16 |
generationConfig.imageConfig.imageSize | string | 否 | 1K / 2K / 4K(默认 1K) |
API 参考
查看 Gemini 3 Pro Image 的交互式 API Playground。