什么是Gateway Keeper
Gateway Keeper 是一款专为 OpenClaw 网关设计的系统级看门狗工具,能够在网关进程崩溃时实现自动重启与工作会话恢复。它独立于网关主进程运行,确保即使在网关意外终止的情况下也能持续监控其健康状态,从而显著提升系统的稳定性和容错能力。通过定期执行健康检查、自动触发重启机制以及生成恢复信号文件,Gateway Keeper 为 OpenClaw 生态提供了一层关键的运行时保护层。
该工具的核心价值在于其无缝的故障恢复流程:当检测到网关无响应时,Gateway Keeper 会自动调用启动命令恢复服务,并记录崩溃与重启的时间戳信息。更重要的是,它会向代理(agent)发出恢复信号,引导其在重启后检查是否有中断的任务需要继续执行。这种设计使得长时间运行的自动化工作流在遭遇意外中断后能够快速恢复,极大减少了人工干预的需求和任务丢失的风险。
Gateway Keeper 的安装和配置过程高度自动化,支持 Windows 和 Linux/macOS 平台。安装脚本会分别为不同操作系统设置定时任务或计划服务,默认每15分钟执行一次健康检查。同时,它还会自动修改项目的 HEARTBEAT.md 文件,添加标准的恢复协议说明,指导代理如何识别恢复文件并处理未完成的工作。整个流程简洁高效,无需复杂的运维操作即可部署到生产环境中。
核心功能特点
- 独立于网关进程运行的系统级看门狗
- 每15分钟自动检测网关健康状态
- 网关崩溃后自动执行重启命令
- 生成包含时间戳的恢复信号文件
- 引导代理检查并恢复中断的工作会话
- 跨平台支持(Windows/Linux/macOS)
适用场景
Gateway Keeper 特别适用于那些依赖 OpenClaw 网关进行长期运行任务的场景,例如自动化数据采集、批处理作业调度或持续集成/部署流水线。在这些场景中,网关的中断可能导致整个工作流程停滞,造成数据丢失或进度延误。Gateway Keeper 的存在确保了即使遇到意外的系统错误或资源耗尽问题,关键任务也能在网关恢复后自动接续,最大限度减少停机时间和人为补救成本。
对于需要高可用性的开发环境或生产系统而言,Gateway Keeper 提供了必要的冗余保障。无论是本地开发机器还是远程服务器,只要网关进程可能面临崩溃风险,该工具都能有效降低因单点故障导致的服务不可用概率。结合其自动化的恢复协议,开发者可以将更多精力集中在业务逻辑而非系统维护上,特别适合团队协作项目中对稳定性要求较高的场景。
此外,在分布式或多代理协作架构中,Gateway Keeper 还能协调多个子代理之间的状态一致性。当主网关重启后,它能统一通知所有相关代理重新评估自身状态,并根据恢复日志决定是继续之前任务还是发起重试,从而避免重复执行或遗漏关键步骤,保证整个系统行为的可预测性和可靠性。
