Generate/edit images via Tuzi API (default), Google Gemini, OpenAI, DashScope, Replicate. Text-to-image + image-to-image editing; 1K/2K/4K resolution. Use for image create/modify/edit requests incl. –input-image.

通过 Tuzi API(默认)、Google Gemini、OpenAI、DashScope、Replicate 生成/编辑图片。支持文生图+图生图编辑;1K/2K/4K 分辨率。使用 fo...

安装

概览

Nano Banana 是一款专为开发者设计的图像生成与编辑工具,支持通过多种主流 AI 模型快速创建或修改图片。其核心优势在于多平台 API 集成能力,默认采用 Tuzi(兔子API)服务,同时兼容 Google Gemini、OpenAI、DashScope 和 Replicate 等主流图像生成接口。用户可通过命令行直接调用,无需复杂配置,极大简化了文生图与图生图的实现流程。该工具不仅支持基础的文字描述生成图像,还能对已有图片进行精细化编辑,满足从创意草图到高质量成品的全流程需求。 工具的运行方式高度灵活,采用 TypeScript 脚本结构,通过 npx + bun 执行,确保在任何工作目录下均可正确输出文件。它内置智能分辨率识别机制:未指定分辨率时默认为 1K(约1024px),可根据用户需求自动映射“低清”“高清”等自然语言指令至对应档位(1K/2K/4K)。特别值得一提的是其迭代式创作流程设计——建议先以 1K 分辨率快速验证提示词效果,待画面方向明确后再提升至 4K 输出最终版本,兼顾效率与质量。 此外,Nano Banana 充分考虑了实际开发场景中的异常处理与安全机制。它严格遵循环境变量优先级加载规则(命令行参数 > 项目级 .env > 全局 .env),并支持自定义 API 端点。对于图像编辑任务,系统会自动检测输入图片尺寸并据此设定输出分辨率;若未指定则沿用原图规格。所有生成的图像均以带时间戳的 PNG 格式保存于当前工作目录,脚本会返回完整文件路径供后续调用,但不会主动读取图像内容,保持轻量化操作逻辑。

核心功能特点

  1. 支持 Tuzi、Google Gemini、OpenAI、DashScope、Replicate 等多平台图像生成与编辑
  2. 提供文生图与图生图双重功能,适配创意构思到细节优化的全流程
  3. 内置 1K/2K/4K 三档分辨率选项,支持自然语言自动映射分辨率等级
  4. 采用命令行驱动设计,通过 npx + bun 直接执行,避免环境切换问题
  5. 具备智能文件名生成机制,按时间戳+描述性标签自动命名输出文件
  6. 支持环境变量管理与 API 密钥动态注入,保障生产环境安全性

适用场景

Nano Banana 特别适合需要快速原型验证的设计团队和独立开发者。例如在产品原型阶段,设计师可以用 1K 分辨率迅速生成多个风格变体,通过对比选择最优方案,大幅缩短反馈周期。当确定视觉方向后,再切换至 4K 模式输出可用于宣传的高清素材,实现‘小步快跑’式的创作迭代。对于内容创作者而言,该工具能轻松将文字灵感转化为可视化资产,无论是社交媒体配图还是博客插图,都能在数秒内完成从零到一的转化。 在开发自动化工作流方面,Nano Banana 也展现出强大潜力。结合 CI/CD 系统,它可以被集成进文档生成流程,自动生成示意图或流程图;也可用于测试环境的 Mock 数据构建,快速产出界面截图辅助前端联调。尤其适合技术写作人员制作图文并茂的技术手册,或是教育类博主制作教学演示图。其图生图编辑功能同样实用——用户可上传手绘草稿,通过简洁指令如‘添加背景虚化’‘调整色彩饱和度’等实现专业级后期处理,无需掌握 Photoshop 等专业软件。 更进阶的应用场景中,该工具可作为创意编程项目的组成部分。开发者可在代码中动态调用不同提供商模型,比较各平台输出差异;或通过批量脚本生成系列主题图像,训练自定义模型。对于需要频繁产出视觉内容的营销团队,它提供了比传统设计工具更高的灵活性和可扩展性,真正实现‘所想即所得’的数字创作体验。