Image Generator 是一个基于智谱 AI 的 CogView-3-Flash 和 GLM-Image 文生图接口开发的技能工具,专为在对话场景中快速生成高质量图片而设计。该工具通过调用 `https://open.bigmodel.cn/api/paas/v4/images/generations` API,支持用户输入自然语言提示词即可自动生成符合要求的图像内容,并以聊天图片形式直接发送至飞书等即时通讯平台。其核心优势在于轻量集成与自动化处理流程——当用户在对话中提出画图需求时,系统可自动执行脚本、下载图片并返回本地文件路径,极大提升了交互体验的流畅度。此外,工具默认开启水印以保障版权合规,同时允许开发者灵活控制是否保留水印。整体架构简洁高效,适合嵌入智能助手或 Agent 系统中作为视觉内容生成模块。
核心功能特点
- 支持智谱 AI 的 cogview-3-flash 与 glm-image 双模型,满足不同风格与性能需求
- 提供命令行与 OpenClaw Skill 两种调用方式,便于集成到各类对话系统
- 自动解析 API 响应并下载图片至本地,输出路径可直接用于飞书等平台发送
- 内置尺寸与长宽约束校验,确保生成图片符合各模型推荐规格(如 1024×1024、1280×1280 等)
- 支持自定义提示词、分辨率及水印开关,参数配置灵活且易用
适用场景
Image Generator 最适用于需要实时生成视觉内容的对话场景,例如在企业级智能客服或办公助手(如飞书机器人)中,当用户请求绘制特定风格的插画、产品示意图或节日海报时,该工具能迅速响应并返回高清图片。由于支持中文提示词输入且模型针对中文语义优化良好,特别适合面向中文用户的本地化应用。此外,在创意协作、教学演示或原型设计中,若需快速验证概念草图,也可借助此工具实现从文字描述到图像的快速转化。对于开发者和系统集成方而言,其标准化的 API 调用流程和清晰的错误日志机制,使其成为构建多模态 AI 应用时的可靠组件。无论是单张图片生成还是批量任务处理,均能保持较高的生成速度与稳定性。
