macOS Local Voice

利用 macOS 原生能力实现本地语音识别与合成。通过 yap (Apple Speech.framework) 进行语音转文字,通过 say + ffmpeg 进行文字转语音。完全离线,无需 API 密钥。具备音质检测与智能选声功能。

安装

概览

macOS Local Voice 是一款专为 macOS 系统设计的本地语音处理工具,利用苹果原生框架实现完全离线的语音识别与合成功能。它通过集成 yap(基于 Apple Speech.framework)完成语音转文字(STT),并通过内置的 say 命令结合 ffmpeg 实现文字转语音(TTS),所有计算均在设备端完成,无需连接网络或使用任何云端 API。该工具特别适合注重隐私、追求低延迟或对数据安全性有严格要求的使用场景,确保用户的音频内容不会离开本机。其核心优势在于零依赖外部服务,仅需安装少量命令行工具即可运行,极大降低了使用门槛和长期维护成本。

核心功能特点

  1. 完全离线运行,不依赖网络或云服务,保护用户隐私
  2. 支持多种主流音频格式输入(如 ogg、m4a、mp3、wav 等)进行语音识别
  3. 提供多语言本地化支持,涵盖中文、英文、日文、韩文等主要语种
  4. 具备智能语音选择机制,可自动匹配文本语言并选用最佳发音人
  5. 输出高质量音频文件,支持 opus/ogg 编码以适配即时通讯平台

适用场景

macOS Local Voice 非常适合需要在本地快速处理语音内容的开发者、研究人员及普通用户。例如,在开发实时字幕生成应用时,可利用其 STT 模块将会议录音或直播音频实时转换为文字;对于语言学习者而言,它能帮助生成自然流畅的发音示范,提升听力训练效果。此外,在远程办公环境中,该工具可用于创建个性化的语音提醒或自动化脚本播报,增强工作效率。由于全程无需上传敏感音频数据,它也适用于医疗、法律等专业领域,满足合规性要求。无论是日常笔记整理还是专业级语音合成项目,该工具都能在不牺牲性能的前提下提供稳定可靠的本地解决方案。