Claude Code Supervisor

监控 tmux 中运行的 Claude Code 会话。使用 Claude Code 钩子配合 bash 预过滤(选项 D)和快速 LLM 分诊来检测错误、卡住的代理和任务完成。适配器无关——支持 OpenClaw、webhooks、ntfy 或任何通知后端。使用场景:(1) 启动需要监控的长时间运行 Claude Code 任务,(2) 为 API 错误或…

安装

概览

什么是Claude Code Supervisor

Claude Code Supervisor 是一个专为 Claude Code 设计的监控与自动化助手,它通过监听 Claude Code 的生命周期钩子事件(如停止、错误或通知),结合轻量级预过滤逻辑和快速 LLM 分诊机制,实现对长时间运行的编码代理会话的实时监控。该工具的核心价值在于减少人工干预,自动识别代理是否陷入卡死状态、遭遇 API 错误或任务完成,从而提升开发效率并确保关键进展不被遗漏。

Supervisor 采用模块化架构:首先由 Bash 脚本对原始事件进行初步筛选,排除明显无需处理的信号;对于模糊情况则交由配置化的 LLM 模型进行分类判断,输出标准化结果(如 FINE、NEEDS_NUDGE、STUCK、DONE 或 ESCALATE)。最终根据分类触发预设的通知后端,例如 OpenClaw、webhook、ntfy 或其他自定义脚本,实现与现有工作流的无缝集成。整个系统完全适配器无关,支持多种通知渠道和本地/云端 LLM 推理引擎。

其设计特别强调鲁棒性——不仅依赖 Claude Code 自身发出的钩子信号,还配备独立的纯 Bash 看门狗进程 watchdog.sh,用于检测因崩溃、账户限制或资源耗尽等原因导致钩子未触发的“静默死亡”会话。这使得即使在极端情况下也能保障监控不失效,真正做到了“双保险”式的可靠性保障。

核心功能特点

  1. 基于 tmux 会话实时监控 Claude Code 运行状态
  2. 使用 Bash 预过滤器快速处理已知模式事件,仅将复杂情况送入 LLM 分诊
  3. 支持 OpenClaw、webhook、ntfy 等多种通知后端,适配任意 Agent 框架
  4. 内置看门狗机制,防止因进程崩溃导致的监控盲区
  5. 通过 YAML 配置文件灵活定制 LLM 模型和通知命令
  6. 提供标准化分类输出(FINE/NEEDS_NUDGE/STUCK/DONE/ESCALATE)指导后续动作

适用场景

Claude Code Supervisor 最适用于需要长期运行且难以手动跟踪的编码任务场景。例如,在修复复杂 Bug、重构大型代码库或执行自动化测试等耗时较长的任务中,开发者可启动一个受监督的 Claude Code 会话,并让 Supervisor 自动检测异常。一旦代理因 API 限流、网络波动或逻辑循环而停滞不前,系统会立即发送提醒;而当任务顺利完成时,也会主动汇报成果,避免开发者反复检查终端状态。

此外,该工具特别适合团队协作环境中的远程开发场景。当多个工程师并行使用 Claude Code 处理不同项目时,Supervisor 可作为统一的监控中枢,集中报告各会话状态。配合 OpenClaw 等平台,还能实现跨设备唤醒、语音提醒甚至自动重启等功能,极大降低沟通成本。对于依赖 Claude Code 作为辅助编程工具的 DevOps 工程师而言,它同样能显著提升 CI/CD 流程中 AI 编码环节的稳定性与可观测性。

另一个典型用例是应对 Claude Code 的上下文窗口限制问题。由于模型存在 token 上限,长时间任务常需重置上下文重新开始。Supervisor 可在检测到重置事件后,依据预设的成功标准判断是否继续原任务,或建议切换至新分支,从而平滑衔接中断的工作流,保持开发连续性。