Veo 3 Video Gen (Gemini API)

通过Gemini API调用Google Veo 3.x生成并拼接短视频。适用于从提示词生成视频(广告、UGC短片、产品演示),并提供可复现的CLI工作流(生成、轮询、下载MP4、可选拼接多片段)。

安装

概览

Veo 3 Video Gen (Gemini API) 是一个基于 Google Gemini API 的视频生成工具,专门用于通过文本提示自动生成高质量短视频内容。该工具利用 Google 最新的 Veo 3.x 模型,支持从简单的文字描述直接生成 MP4 格式的视频文件,极大简化了 AI 视频创作的流程。它不仅适用于快速原型制作或创意探索,还能满足商业级内容生产需求,如广告短片、用户生成内容(UGC)以及产品演示视频等场景。通过命令行接口,用户可以灵活控制生成参数,包括画面比例、风格一致性、多片段拼接等功能,实现高度可定制的工作流。整个系统以轻量级脚本为核心,依赖 uv 包管理器和标准 Python 环境即可运行,无需复杂部署。同时,工具内置轮询机制自动等待任务完成并下载结果,确保生成过程稳定可靠。对于需要批量处理或自动化产出的团队而言,该工具提供了一种高效、可扩展的解决方案,将复杂的 AI 视频生成转化为简单的一行命令操作。

核心功能特点

  1. 支持通过文本提示调用 Google Veo 3.1 模型生成短视频
  2. 可生成单段或多段视频并自动拼接为更长片段
  3. 提供命令行参数控制画面比例、风格延续与参考图像引导
  4. 内置轮询机制自动等待任务完成并下载 MP4 文件
  5. 支持提取前一段末尾帧用于下一段视频的时空连贯性
  6. 兼容 ffmpeg 实现多段视频无缝拼接输出

适用场景

Veo 3 Video Gen 特别适合需要快速产出视觉内容的创作者与营销团队。在广告行业,它可以将品牌文案或产品卖点迅速转化为吸引眼球的短视频素材,用于社交媒体投放或客户提案,显著缩短内容制作周期。对于电商平台或 SaaS 企业,该工具可用于自动生成产品使用演示、功能讲解或用户体验展示视频,提升官网或落地页的视觉吸引力。在 UGC(用户生成内容)场景中,内容创作者可通过输入具体描述快速获得定制化短片,用于个人账号运营或社群互动,降低创作门槛。此外,教育机构或培训组织也可利用其生成教学动画或操作步骤演示,辅助知识传播。由于支持多段拼接和风格延续,该工具尤其适合制作超过 8 秒的连续剧情或动态展示类内容,例如城市风光漫游、产品拆解过程或角色故事叙述。结合 `–reference-image` 参数,用户还能上传实物图片作为视觉参考,确保生成内容与真实商品或设计风格高度一致,满足电商详情页或品牌宣传对真实感的要求。整体而言,无论是敏捷创意项目还是标准化内容流水线,该工具都能提供强大而灵活的支撑。