feishu-edge-tts-win

飞书语音消息发送技能(Windows 版)。使用 Edge TTS(微软,免费)生成语音并以飞书语音气泡发送。

安装

概览

什么是feishu-edge-tts-win

飞书语音消息发送技能(Windows 版)是一款专为 Windows 用户设计的自动化工具,旨在通过调用微软免费的 Edge TTS 技术,将任意文本快速转换为自然流畅的中文语音,并直接以飞书的语音气泡形式发送给指定联系人。该工具无需手动录制音频或处理复杂格式,只需在命令行中输入一段文字和接收方的飞书 OpenID,即可一键完成从语音合成到消息推送的全流程操作。其核心优势在于完全依赖开源组件与免费服务,不产生额外费用,同时深度集成飞书开放平台 API,确保消息能够以标准语音气泡样式呈现,而非普通文件附件。整个工作流程高度模块化,分为四个关键步骤:首先生成 MP3 格式的语音文件,随后利用 ffmpeg 将其无损转换为飞书支持的 OPUS 编码格式,再通过飞书 API 上传获取唯一文件标识符 file_key,最终构造符合规范的 audio 类型消息进行发送。这种设计既保证了输出质量,又确保了与飞书客户端的良好兼容性。

核心功能特点

  1. 基于微软 Edge TTS 引擎,提供高质量、免费的中文语音合成能力
  2. 自动完成 MP3 生成与 OPUS 格式转换,适配飞书语音气泡要求
  3. 通过飞书 API 实现语音文件上传与消息发送一体化操作
  4. 支持命令行参数化配置,可灵活指定文本内容、音色及配置文件路径
  5. 依赖环境简单,仅需 pip 安装 edge-tts 并确保 ffmpeg 在系统 PATH 中

适用场景

该工具特别适合需要频繁发送语音提醒或语音回复的场景,例如远程办公时向同事传递重要信息、向团队成员播报任务更新,或通过语音方式增强沟通的人性化体验。对于经常使用飞书但不便打字或使用语音输入的用户而言,它提供了一种高效替代方案,尤其适合会议间隙、通勤途中等不方便打字的场合。此外,开发者或自动化脚本使用者也可将其嵌入工作流中,实现定时语音通知、客服机器人语音反馈等功能。由于全程采用标准协议与公开 API,该技能具备良好的可扩展性,未来可结合其他自动化工具进一步定制。需要注意的是,当前仅支持固定音色 zh-CN-XiaoxiaoNeural,若需多样化音色则需后续升级。整体来看,这是一款轻量级、低成本、易部署的飞书语音交互增强工具,填补了原生飞书功能在主动语音发送方面的空白。