Chatgpt Image Generation

利用 Playwright 浏览器自动化技术,通过 ChatGPT 生成图片。自动打开 ChatGPT、发送提示词、等待生成并保存结果图片。

安装

概览

ChatGPT Image Generation 是一款基于 Playwright 浏览器自动化技术的实用工具,旨在通过调用 ChatGPT 的网页界面实现批量图片生成。用户只需提供一系列文本提示词,该工具便会自动在 Chrome 浏览器中打开 ChatGPT 页面,依次输入每个提示词并等待 AI 生成对应的图像。整个过程无需手动操作,极大提升了内容创作与测试的效率。生成的图片将按顺序保存为编号文件(如 `001.png`),同时还会记录每次请求的详细日志到 `results.jsonl` 文件中,方便后续追踪与调试。 该工具支持多种运行模式以适应不同需求:可在有头(headful)模式下观察生成过程,便于排查问题;也支持无头(headless)模式,适合后台批量处理。此外,若中途因网络或系统原因中断,用户还可从指定索引位置恢复执行,避免重复劳动。首次使用时,若未登录 ChatGPT 账户,程序会自动打开浏览器窗口引导用户完成登录,之后会自动保存会话状态,确保后续运行无需再次认证。 整体而言,这款工具将复杂的网页交互流程封装成简洁的命令行操作,特别适合需要大量视觉素材的内容创作者、设计师、研究人员以及开发者。无论是用于原型设计、A/B 测试还是创意探索,它都能显著减少人工干预,提高产出速度和一致性。

核心功能特点

  1. 基于 Playwright 实现浏览器自动化,自动打开 ChatGPT 网页界面
  2. 支持从 JSON 文件批量读取提示词,一键生成多张图片
  3. 自动检测并下载生成的图像,按序号保存至指定目录
  4. 支持断点续跑功能,可从任意索引位置继续执行任务
  5. 兼容有头与无头两种运行模式,适应开发与生产环境
  6. 自动管理登录状态,首次登录后自动保存会话信息

适用场景

该工具非常适合需要快速获取大量高质量图像内容的场景。例如,设计师在进行用户界面原型设计时,可以通过输入不同的布局描述或风格关键词,批量生成多样化视觉参考图,从而加速创意迭代过程。对于内容创作者而言,无论是制作社交媒体配图、短视频素材,还是撰写图文并茂的文章,都可以利用此工具高效产出符合特定主题或情绪的视觉元素,大幅缩短内容生产周期。 在教育与研究领域,教师或学生可能需要根据课程主题生成教学插图或概念可视化素材。使用 ChatGPT Image Generation 工具,他们可以一次性提交多个知识点相关的提示词,自动生成配套图像,辅助课堂讲解或学习笔记整理。同样,产品经理在开发新功能前,也可借助此类工具快速生成界面草图或用户流程示意图,用于内部评审或客户演示。 此外,开发者在测试前端组件库或 UI 框架时,常需验证不同状态下的视觉效果。通过自动化生成对应场景的图片,不仅能提升测试覆盖率,还能确保视觉风格的一致性。总之,任何涉及高频次、多类型图像生成的专业或创意工作流,都能从中受益,实现从“手动绘制”到“智能生成”的转型升级。