drama generator

基于 OpenAI TTS、Whisper 和 Remotion 的自动化多角色剧情视频生成器,实现从脚本到视频的全流程制作

安装

概览

Drama Generator 是一款基于 OpenAI TTS、Whisper 和 Remotion 技术的自动化短剧视频生成工具,旨在实现从剧本到专业视频的端到端全流程制作。用户只需提供符合标准格式的剧本文本,系统即可自动解析角色、分配语音、生成时间戳,并渲染出高质量的竖屏短剧视频。该工具支持多角色对话、场景切换、旁白等多种短剧元素,内置六种不同风格的语音选项,涵盖中性男声、沉稳男声、英式优雅旁白、深沉领导音、活泼女声及温暖柔和女性音,满足不同角色塑造需求。输出视频采用 1080×1920 分辨率与 30fps 帧率,适配抖音、快手、视频号等主流短视频平台,音频部分通过 Whisper API 实现精确同步,确保口型与字幕高度匹配。整个流程完全自动化,仅需一条命令即可完成从文本输入到 MP4 文件输出的全过程,极大提升了内容创作效率。

核心功能特点

  1. 支持标准短剧格式自动解析,识别场景、角色与对话结构
  2. 集成六种专业 TTS 语音,智能匹配角色性别与性格特征
  3. 利用 Whisper API 提取精准时间戳,实现语音与视觉元素的同步
  4. 内置美观场景转场动画与专业对话框样式,提升视觉表现力
  5. 一键式全自动化流水线,无需手动剪辑或后期处理
  6. 兼容 OpenAI、Azure、阿里云、腾讯云等多平台 TTS 服务

适用场景

Drama Generator 特别适合需要快速产出高质量对话类内容的创作者和内容团队。在短视频内容创作领域,它可帮助自媒体人、MCN 机构高效制作剧情化信息流广告或娱乐短剧,将原本耗时的配音与剪辑环节压缩至几分钟内完成。教育培训场景中,教师或培训师可利用其生成情景模拟教学视频,例如商务谈判、客户服务演练等,通过角色对话还原真实工作场景,增强学习代入感。营销推广方面,企业可将产品介绍转化为故事化叙事短片,借助旁白引导与角色互动传递品牌价值,比传统硬广更具吸引力。此外,独立创作者、编剧爱好者甚至学生群体也可借此降低视频制作门槛,专注于创意本身而非技术实现。无论是用于个人作品集展示,还是团队协作的内容批量生产,该工具都能显著缩短从灵感到成品的时间周期。