Telegram Offline Voice

本地生成 Telegram 语音消息,支持自动清洗、分段与临时文件管理。

安装

概览

Telegram Offline Voice 是一款专为 Telegram 语音消息设计的本地语音生成工具,通过 Microsoft Edge-TTS 引擎实现高质量的中文语音合成。该工具的核心优势在于完全离线运行,所有音频处理均在本地完成,确保用户隐私不被泄露。与传统的文本转语音方案不同,它不仅支持基础语音生成,还深度优化了真实对话体验——自动清洗 Markdown 标记、智能分段超长文本,并将生成的 MP3 文件转换为 Telegram 原生支持的 OGG 格式,直接输出可发送的语音气泡路径。整个过程无需依赖任何云端 API 或付费服务,真正实现零 token 消耗,特别适合需要频繁发送语音消息的场景。 该工具由 [@sanwe] 开发并维护,针对多代理并行调用等复杂环境进行了工程级优化。它采用 UUID 机制为每个语音任务生成唯一临时文件,彻底避免并发冲突问题。同时,脚本内置自动化清洗规则,能识别并移除 `**`、`#`、`[链接]` 等干扰性符号,以及 `http/https` 开头的 URL,确保朗读内容自然流畅。对于超过单条语音长度限制的文本,系统会依据句号、感叹号等标点进行智能切分,模拟真人逐条发送语音的行为模式,极大提升沟通效率与听感舒适度。

核心功能特点

  1. 100% 本地离线运行,保护用户隐私,不经过任何云端 TTS 服务
  2. 自动清洗 Markdown 符号和链接,避免 AI 读出代码噪音
  3. 智能按标点分段超长文本,生成多个连贯语音气泡
  4. 一键封装脚本,自动完成文本→MP3→OGG 全流程转换
  5. 支持并发安全,使用 UUID 隔离临时文件防止读写冲突
  6. 零 token 消耗,基于免费 Edge-TTS 引擎降低使用成本

适用场景

Telegram Offline Voice 特别适用于需要高频发送语音消息但受限于平台限制或隐私顾虑的用户群体。例如,在团队协作中,当成员希望通过语音快速传达复杂信息时,传统 TTS 工具常因无法处理长文本或保留格式而失效;本工具则可将一段详细的工作汇报自动拆分为多条自然衔接的语音气泡,既符合 Telegram 的使用习惯,又保证信息完整传递。此外,对于注重数据安全的企业或个人用户而言,由于全程在本地处理语音,无需上传敏感内容至第三方服务器,有效规避了数据泄露风险。 另一个典型应用场景是自动化机器人或智能助手开发。许多基于 Telegram 的 AI 代理在回复用户时会尝试发送语音,但若直接调用原生 TTS 接口,不仅可能触发字数限制,还会因夹杂格式符号导致播报混乱。借助此工具,开发者可在后端无缝集成语音功能:输入任意文本,立即获得可直接发送的 OGG 文件路径。尤其适合构建多语言客服系统、教育类聊天机器人或无障碍辅助应用,显著提升交互体验的自然度与可靠性。