OpenRouter Image Generation 是一个基于 OpenRouter 多模态图像生成 API 的命令行工具,通过调用兼容 OpenRouter 的图像模型(如 Google Gemini 2.5 Flash Image),实现新图像的创建与现有图像的编辑。该工具封装了 OpenRouter 的 Chat Completions API 接口,使用户能够以自然语言描述的方式驱动 AI 生成高质量图像,并支持对已有图片进行局部修改或风格调整。所有生成的图像默认保存至 `~/.openclaw/media/outbound/` 目录,便于后续在 OpenClaw 生态系统中流转和处理。 该工具采用 uv 作为依赖运行器,支持灵活的参数配置,包括提示词、输出文件名、目标模型、宽高比、分辨率等关键生成参数。用户可通过命令行直接指定 `–prompt` 提供图像描述,系统将自动构建请求并返回生成的图像数据。对于图像编辑任务,用户需额外传入 `–input-image` 参数指向原始图片路径,并在提示词中明确说明修改意图,例如“仅更改天空为晚霞色调,其余保持不变”。工具内置了时间戳命名机制,确保每次输出文件具有唯一标识,避免覆盖。同时支持高级配置项,如通过 `–image-config-json` 注入特定于提供商或模型的扩展字段。
核心功能特点
- 基于 OpenRouter 多模态 API 实现图像生成与编辑
- 支持通过自然语言提示词控制图像内容和风格
- 可指定模型、分辨率、宽高比等生成参数
- 自动生成带时间戳的唯一文件名,防止冲突
- 默认输出路径适配 OpenClaw 工作流集成
- 支持图像到图像的局部编辑模式
适用场景
该工具特别适合需要快速原型设计或批量内容创作的开发者与创意工作者。例如在产品摄影领域,设计师可以输入‘哑光黑机械键盘在木质桌面上,暖窗光’这样的描述,迅速获得可用于宣传素材的高清产品图;而在广告迭代过程中,只需微调提示词即可对比不同光影效果,无需重复绘制。对于视频制作团队而言,它能高效生成动态场景中的静态帧或背景元素,显著提升前期制作效率。 在教育与科研场景中,教师可用其可视化复杂概念——如将‘太阳系行星运行轨道’转化为直观插图;研究人员也能借此快速生成实验示意图或数据图表辅助论文撰写。此外,独立创作者和内容生产者常面临灵感枯竭问题,此工具可作为创意伙伴,根据一句话构思出完整画面构图,降低从零开始设计的门槛。 尤其值得一提的是,其图像编辑功能适用于精细化后期处理:摄影师可在不破坏原片结构的前提下,仅调整天空色彩或移除干扰物;UI/UX 设计师则能基于线稿草图添加纹理细节或配色方案,加速原型验证流程。整体来看,无论是商业级内容生产还是个人兴趣探索,OpenRouter Image Generation 都提供了一个轻量化、可编程且高度可控的 AI 图像解决方案。
