Gemini Image Generator 是一款基于 Google Gemini 模型开发的图像生成与编辑工具,专为内容创作者、设计师及开发者打造。该工具支持通过自然语言指令生成高质量图像、编辑现有图片以及合成多张图像,适用于制作海报、图标、横幅、徽标等多种视觉素材。其核心优势在于兼容 OpenAI 格式和 Google 原生 API 两种调用方式,用户可根据自身需求灵活选择接口规范。通过命令行参数或环境变量配置,工具可自定义 API 密钥、端点地址、模型名称等关键信息,极大提升了部署的便捷性与灵活性。 该工具采用模块化设计,内置自动轮询机制以应对服务不可用情况,确保在首选模型失效时能无缝切换至备用模型继续执行任务。同时,脚本对常见错误如限流(429)和超时具备自动重试能力,增强了系统稳定性。输出文件采用时间戳命名规则,避免冲突,并默认保存至 `output/images` 目录,路径支持相对与绝对形式,方便集成到各类工作流中。此外,工具严格遵循 OpenClaw 媒体输出协议,通过 `MEDIA:` 行自动附加生成的图像到聊天上下文,无需手动处理附件逻辑。 Gemini Image Generator 不仅适用于独立使用场景,还可作为技能模块嵌入更大规模的 AI 应用生态中。无论是快速原型设计、批量内容生成还是自动化图像处理流水线,该工具都能提供高效可靠的图像创作支持。借助其丰富的参数选项,用户可实现从基础文生图到复杂多图合成的全链路操作,满足多样化的视觉表达需求。
核心功能特点
- 支持文生图、图片编辑与多图合成三大核心功能
- 兼容 OpenAI 和 Google 原生两种 API 调用格式
- 内置模型自动轮询机制,提升服务可用性
- 支持自定义分辨率(1K/2K/4K)、宽高比与输出质量
- 具备限流与超时自动重试能力,增强鲁棒性
- 自动附加生成图像到聊天上下文,符合 OpenClaw 媒体协议
适用场景
Gemini Image Generator 非常适合需要快速生成视觉内容的场景。例如,市场营销团队可以借助该工具批量制作社交媒体海报、活动横幅或产品宣传图,显著缩短创意落地周期。设计师在构思初期可通过文生图快速获取灵感,再结合编辑功能微调细节,实现从概念到成品的高效转化。对于自媒体运营者而言,定期产出封面图、头像或配图素材也能变得更为轻松,只需输入简短描述即可自动生成符合风格要求的图像。 在企业级应用中,该工具可作为内部内容生成平台的一部分,集成进文档生成系统或客服机器人流程中。当用户请求创建品牌标识(Logo)、会议背景图或培训课件插图时,系统可自动调用此技能完成图像生产,减少人工干预。特别是在多模态交互场景中,如智能助手回答‘画一只小猫’这类指令后,能够即时返回生成结果,极大提升用户体验。此外,开发者在构建 AI 原型或测试多模态模型时,也可利用该工具验证文本到图像的映射效果,降低开发门槛。
