Gemini Image Generator 是一款基于 Google Gemini 模型开发的图像生成与编辑工具，专为内容创作者、设计师及开发者打造。该工具支持通过自然语言指令生成高质量图像、编辑现有图片以及合成多张图像，适用于制作海报、图标、横幅、徽标等多种视觉素材。其核心优势在于兼容 OpenAI 格式和 Google 原生 API 两种调用方式，用户可根据自身需求灵活选择接口规范。通过命令行参数或环境变量配置，工具可自定义 API 密钥、端点地址、模型名称等关键信息，极大提升了部署的便捷性与灵活性。该工具采用模块化设计，内置自动轮询机制以应对服务不可用情况，确保在首选模型失效时能无缝切换至备用模型继续执行任务。同时，脚本对常见错误如限流（429）和超时具备自动重试能力，增强了系统稳定性。输出文件采用时间戳命名规则，避免冲突，并默认保存至 `output/images` 目录，路径支持相对与绝对形式，方便集成到各类工作流中。此外，工具严格遵循 OpenClaw 媒体输出协议，通过 `MEDIA:` 行自动附加生成的图像到聊天上下文，无需手动处理附件逻辑。 Gemini Image Generator 不仅适用于独立使用场景，还可作为技能模块嵌入更大规模的 AI 应用生态中。无论是快速原型设计、批量内容生成还是自动化图像处理流水线，该工具都能提供高效可靠的图像创作支持。借助其丰富的参数选项，用户可实现从基础文生图到复杂多图合成的全链路操作，满足多样化的视觉表达需求。

核心功能特点

支持文生图、图片编辑与多图合成三大核心功能
兼容 OpenAI 和 Google 原生两种 API 调用格式
内置模型自动轮询机制，提升服务可用性
支持自定义分辨率（1K/2K/4K）、宽高比与输出质量
具备限流与超时自动重试能力，增强鲁棒性
自动附加生成图像到聊天上下文，符合 OpenClaw 媒体协议

适用场景

Gemini Image Generator 非常适合需要快速生成视觉内容的场景。例如，市场营销团队可以借助该工具批量制作社交媒体海报、活动横幅或产品宣传图，显著缩短创意落地周期。设计师在构思初期可通过文生图快速获取灵感，再结合编辑功能微调细节，实现从概念到成品的高效转化。对于自媒体运营者而言，定期产出封面图、头像或配图素材也能变得更为轻松，只需输入简短描述即可自动生成符合风格要求的图像。在企业级应用中，该工具可作为内部内容生成平台的一部分，集成进文档生成系统或客服机器人流程中。当用户请求创建品牌标识（Logo）、会议背景图或培训课件插图时，系统可自动调用此技能完成图像生产，减少人工干预。特别是在多模态交互场景中，如智能助手回答‘画一只小猫’这类指令后，能够即时返回生成结果，极大提升用户体验。此外，开发者在构建 AI 原型或测试多模态模型时，也可利用该工具验证文本到图像的映射效果，降低开发门槛。

概览

核心功能特点

适用场景

相关推荐

Guizang PPT Skill：AI 驱动的网页幻灯片生成工具

Anime Image Downloader (Safebooru, Download Only)

email-designer

Bible QA (OpenClaw Church)

VietQR

Filtrix Video Gen

biliup-skills

XReplyAI – Social Post Manager