nano-banana、gpt-image

通过 VAPI 的 OpenAI 兼容图像 API 生成图像。支持 nano‑banana 与 gpt‑image 系列模型,默认模型为 nano‑banana‑pro,图像不会保存。

安装

概览

nano-banana 和 gpt-image 是由 VAPI 提供的 OpenAI 兼容图像生成 API,专为开发者设计,用于快速调用先进的 AI 图像模型。该工具通过统一的接口支持多种图像生成模型,默认采用 nano-banana-pro 作为首选模型,具备高效、灵活和可扩展的特点。用户可以通过简单的命令行操作生成高质量图像,而无需关心底层复杂的 API 调用细节。生成的图像以 URL 或 base64 编码形式返回,满足不同应用场景的数据处理需求。由于图像不会自动保存到本地磁盘,因此特别适合需要即时获取链接或嵌入数据的开发流程。整体架构简洁,配置灵活,支持自定义输出路径、分辨率比例及生成数量,极大提升了在自动化脚本、内容创作平台或多媒体应用中的集成效率。

核心功能特点

  1. 支持 nano-banana 与 gpt-image 系列模型,默认使用 nano-banana-pro 生成高质量图像
  2. 可指定高分辨率版本(如 -2k 或 -4k),满足对清晰度要求较高的场景
  3. 支持自定义宽高比(如 16:9)和多图批量生成(最多 10 张)
  4. 默认不保存图像文件,仅返回媒体 URL,保障数据隐私与存储效率
  5. gpt-image 系列模型始终返回 base64 数据并自动保存至本地媒体目录
  6. 提供灵活的保存选项:本地目录、OSS 存储或自定义路径

适用场景

该工具非常适合需要快速集成 AI 图像生成能力的应用场景。例如,在内容管理系统中,开发者可通过脚本自动生成配图并直接插入文章,显著提升运营效率。对于数字营销团队而言,利用多图生成功能可迅速产出多样化素材,适配不同社交媒体平台的发布需求。在教育与培训领域,教师或课程设计师可以使用高分辨率图像辅助教学资源制作,增强视觉表达效果。此外,自动化测试、原型设计或创意头脑风暴等场景中,nano-banana 系列模型因其响应速度快、输出稳定而成为理想选择。若项目要求保留原始图像数据以便后续编辑或存档,则应选用 gpt-image 系列模型,其内置的 base64 返回机制天然支持本地持久化存储。总体来看,无论是轻量级的内容生成还是复杂的多模态应用构建,该工具都能提供可靠且高效的图像生成解决方案。