Phone Voice Integration

通过 Twilio 电话将 ElevenLabs Agents 连接至 OpenClaw。支持来电显示认证、语音 PIN 安全、呼叫筛选、记忆注入及成本追踪。

安装

概览

Phone Voice Integration 是一项将 ElevenLabs Agents 与 Twilio 电话系统深度整合的创新解决方案,旨在让 OpenClaw 智能体具备接听和拨打电话的真实能力。该方案通过构建一个中间桥接服务器,将传统电话网络与 AI 语音助手无缝连接,实现从普通手机拨打特定号码即可与你的 AI 助手进行自然对话。整个架构采用 Cloudflare Tunnel 或 ngrok 暴露本地服务,确保安全稳定的公网访问。当用户来电时,Twilio 会接收呼叫并将其路由至 ElevenLabs Agent;Agent 则通过模拟 OpenAI API 格式,将请求转发至你本地的桥接服务器。该服务器负责注入用户的长期记忆文件(如 MEMORY.md、USER.md)以及实时上下文信息,然后调用 Anthropic Claude 大模型生成回复,最终由 ElevenLabs 的文本转语音(TTS)功能将回答传回给用户。整个过程不仅支持双向通话,还具备完整的日志记录和成本追踪机制。

核心功能特点

  1. 支持来电显示认证与白名单筛选,仅允许授权联系人直接对话,未知来电进入接待员模式
  2. 集成语音 PIN 验证机制,对高风险操作或未认证用户实施二次身份确认
  3. 自动注入跨会话记忆上下文,持续加载并融合用户历史档案与近期通话记录
  4. 内置成本追踪系统,精确统计每通电话在各环节(Twilio、ElevenLabs、Anthropic)的花费明细
  5. 提供永久隧道(Cloudflare)与临时隧道(ngrok)两种部署方式,满足不同安全与稳定性需求
  6. 支持速率限制与办公时间管控,有效防止滥用并优化运营成本

适用场景

此工具特别适合需要为个人助理或企业客服团队赋予真实电话交互能力的开发者与创业者。例如,你可以将其部署为一个全天候可用的家庭事务管家,无论何时何地,家人只需拨打指定号码就能查询日程安排、设置提醒事项或获取天气信息,而无需打开任何应用。对于远程工作者而言,它可作为虚拟前台,处理来电预约、转接重要消息,并在非工作时间提供基础咨询服务。在更商业化的场景中,中小企业可利用其搭建低成本的智能呼叫中心,自动响应客户常见问题,减轻人工坐席压力,同时保持品牌一致性。由于具备强大的安全控制层,它也适用于处理敏感个人信息的服务场景,如医疗咨询预约、会员账户管理等,确保只有经过验证的用户才能触发核心功能。此外,结合日历与待办事项集成能力,它还能主动推送会议变更通知或任务截止提醒,真正实现‘听得见’的智能助理体验。