Nanobanana Pro

Nano Banana Pro 支持自动模型回退,通过 Gemini Image API 生成或编辑图像。运行命令:uv run {baseDir}/scripts/generate_image.py --prompt '描述' --filename '输出.png' [--resolution 1K|2K|4K] [-i 输入.png]。支持文生图及图生图…

安装

概览

Nano Banana Pro 是一款专为图像生成与编辑设计的命令行工具,基于 Google Gemini 的视觉模型 API 构建。它通过自动化模型回退机制确保高可用性,即使首选模型失败也能无缝切换至备用方案。用户可通过简洁的命令行接口调用该工具,支持文生图、图生图以及多图合成等多样化创作需求。所有操作必须使用 `uv run` 命令执行,直接使用 `python3` 将导致依赖缺失无法运行。该工具特别适用于需要稳定输出高质量图像的开发者或内容创作者,尤其适合集成到自动化工作流中。其设计注重实用性与可靠性,内置时间戳命名规范和多分辨率支持,便于批量处理和版本管理。

核心功能特点

  1. 支持自动模型回退机制,优先尝试 gemini-2.5-flash-image,失败后自动切换至 gemini-2.0-flash-exp-image-generation
  2. 提供文生图、单图编辑及最多14张图片的多图合成功能,满足复杂视觉创作需求
  3. 支持三种分辨率输出:1K(默认)、2K 和 4K,适配不同场景的质量要求
  4. 必须使用 uv run 命令执行脚本,避免直接调用 python3 以确保环境依赖正确加载
  5. 自动生成带时间戳的文件名建议格式(yyyy-mm-dd-hh-mm-ss-name.png),提升文件组织效率
  6. 输出时打印 MEDIA: 前缀路径,便于 OpenClaw 等平台自动识别并附加生成的图像

适用场景

Nano Banana Pro 特别适合那些需要在自动化流程中生成或处理图像的终端用户。例如,在开发内容管理系统时,可以将其嵌入后台任务队列,根据文本描述自动生成配图;或者在数据可视化项目中,批量生成高分辨率图表插图。对于设计师和插画师而言,该工具可用于快速原型验证——先以低分辨率生成草稿,再按需提升至 4K 精修。由于其具备图生图能力,也常被用于素材优化,比如将手绘草图转化为数字艺术作品,或将旧照片进行风格化重绘。此外,在多图合成场景下,用户可一次性上传多个参考图像,由 AI 将其融合为连贯场景,非常适合制作信息图或社交媒体长图。整体来看,任何需要稳定、可控且无需图形界面即可完成图像生成的专业用途,都是 Nano Banana Pro 的理想应用场景。