XunFei Voice Reply

语音回复技能 - 使用讯飞 TTS 生成语音并发送到飞书。当需要用语音回复用户消息时使用。触发词:用语音、语音回复、切换语音模式、语音模式。

安装

概览

什么是XunFei Voice Reply

讯飞语音回复是一款专为飞书机器人设计的智能交互技能,核心功能是通过集成科大讯飞的文本转语音(TTS)技术,将文字回复自动转换为自然流畅的语音消息并发送给用户。该工具主要面向需要提升沟通效率、增强人机交互体验的场景,尤其适用于客服、教育辅导或陪伴型机器人等角色。用户只需通过简单的触发词即可切换至语音模式,系统会自动调用后端脚本生成高质量音频文件,并以 Opus 格式推送到飞书平台。整个过程无需手动操作,实现了从文字内容到语音播报的无缝衔接。此外,工具支持多种音色选择,包括温柔女声、活泼女声和童声选项,满足不同场景下的情感表达需求。所有配置均通过 JSON 文件和环境变量管理,具备良好的可定制性与扩展性。

核心功能特点

  1. 支持一键切换文字与语音回复模式,触发词包括‘用语音’、‘语音回复’等
  2. 集成讯飞 WebSocket TTS 引擎,输出 PCM 转 Opus 格式的语音文件
  3. 提供三种预设音色:晓燕(温柔女声)、叶子(活泼女声)、凌悠(童声)
  4. 自动读取 USER.md 中的‘回复模式’字段实现状态持久化
  5. 具备完善的错误降级机制,如 TTS 超时则回退到文字回复

适用场景

讯飞语音回复特别适合那些希望增强人机互动真实感的智能助手或客服机器人使用。例如,在教育类应用中,当孩子向 AI 老师提问时,系统可以用童声进行语音反馈,使学习过程更生动有趣;在心理咨询或情感陪伴场景中,采用柔和的女声能营造温暖亲切的交流氛围,有助于缓解用户情绪。对于企业客服机器人而言,语音回复不仅能减少用户打字负担,还能通过语调传递更多情感信息,提升服务温度。此外,该技能也适合用于通知提醒、语音播报等单向信息传达场景,比如会议助理在收到日程安排后主动用语音告知参会者。由于支持快速模式切换,用户可随时根据上下文选择最合适的沟通方式,兼顾效率与体验。整体来看,这款工具为构建更具人性化特征的对话系统提供了轻量化且高效的解决方案。