Phone Call Agent

AI语音通话代理——支持外呼、生成浏览器通话链接、接听来电,并在通话结束后获取完整转录与摘要。支持……

安装

概览

什么是Phone Call Agent

Phone Call Agent 是一款开源、自托管的 AI 语音通话代理工具,旨在通过自然语言对话实现自动化外呼与接听功能。用户只需提供一个电话号码和任务描述,该工具即可自动拨打电话,进行拟人化的交流,并在通话结束后返回完整的转录文本与摘要结果。它支持两种主要工作模式:主动外呼(通过 SIP 协议拨打真实号码或生成浏览器通话链接)和被动接听来电(从 SIP 中继线路接入),适用于需要高频次、智能化客户沟通的场景。

该系统的核心架构基于 FastAPI 构建后端服务,集成 LiveKit 作为 WebRTC 媒体服务器,并采用 Pipecat 框架处理语音流水线。其设计强调灵活性与可扩展性,允许开发者自定义技能模块(Skills),这些技能以 Markdown 文件形式存储,包含 YAML 元数据与 LLM 系统提示词,无需修改代码即可动态加载新能力。同时,工具链深度整合了主流 AI 服务商,如 OpenAI 和字节跳动火山引擎(Volcengine),特别针对中文场景优化了低延迟语音识别与合成技术。

部署方式简便,推荐使用 Docker Compose 一键启动,内置 Web UI 提供可视化管理与分享链接生成界面。对于远程协作或第三方接入需求,可通过 Cloudflare Tunnel 暴露公网 URL,使任何人仅通过浏览器点击链接即可参与通话,无需安装应用或注册账户。整个过程由 Claude Desktop 通过 MCP(Model Context Protocol)接口无缝调用,实现“Claude 发起指令 → 生成通话链接 → 对方接听 → 获取结果”的完整闭环。

核心功能特点

  1. 支持主动外呼与被动接听双模式,兼容 SIP 电话与浏览器 WebRTC 通话
  2. 自动生成可分享的浏览器通话链接,无需手机号或 APP 即可接入
  3. 基于 Markdown 的技能系统,支持自定义任务逻辑与上下文变量
  4. 深度集成 OpenAI 及 Volcengine 等主流 AI 服务,优化中文语音交互体验
  5. 实时获取完整通话转录与结构化摘要,包括情感分析与结果总结
  6. 通过 MCP 协议与 Claude Desktop 深度集成,实现智能体自主调度

适用场景

Phone Call Agent 特别适合需要大规模执行标准化客户沟通任务的场景。例如,企业客服团队可利用其批量发送预约提醒、合同跟进或满意度调查,显著降低人工坐席成本。销售部门也可用于潜在客户初次触达,AI 代理能根据预设话术引导客户完成信息确认或意向登记。此外,在医疗随访、保险回访、教育招生等领域,该工具可定时自动联系目标人群,收集反馈并同步至管理系统。

对于开发者和 AI 研究员而言,它提供了一个高度可控的实验平台,可用于测试不同 LLM、STT/TTS 模型在真实通话环境下的表现。研究人员可以通过编写特定技能文件,快速验证多轮对话策略、情绪识别准确率或跨语言交互效果。由于支持本地部署与私有化配置,也适合对数据安全敏感的企业内部使用,避免将通话内容上传至公有云服务。

更进阶的应用还包括结合 RAG(检索增强生成)系统,让 AI 代理在通话中实时查询知识库解答复杂问题;或与 CRM 系统集成,自动更新客户状态。无论是初创公司试水 AI 客服,还是成熟企业优化运营流程,Phone Call Agent 都提供了一条低成本、高效率的技术路径。