Infra Watchdog 是一款专为自托管环境设计的基础设施监控工具,属于 OpenClaw 生态中的核心技能之一。它无需依赖任何外部 SaaS 服务,完全在本地运行,实现对各类关键服务的持续健康检查与实时告警。无论是部署在家庭实验室、小型服务器还是生产环境的系统,Infra Watchdog 都能提供稳定可靠的监控能力。该工具通过命令行界面进行配置和管理,支持多种监控类型,包括 HTTP/HTTPS 端点、TCP 端口、Docker 容器状态、系统资源使用情况以及 SSL 证书有效期等。所有监控数据均存储在本地 SQLite 数据库中,确保隐私与安全。当检测到异常时,它能通过 WhatsApp、Telegram 或 Discord 发送即时通知,帮助运维人员快速响应故障,最大限度减少停机时间。 作为一款轻量级但功能完备的监控解决方案,Infra Watchdog 特别适用于那些希望摆脱商业监控平台锁定、追求更高自主控制权的开发者和技术爱好者。其设计理念强调简洁性、可定制性和零外部依赖,用户可以通过简单的命令快速添加监控项并启动自动化检查流程。同时,它也支持灵活的告警策略配置,例如设置冷却时间防止告警风暴,或在资源使用接近阈值时发出预警而非仅在下线后报警。这种细粒度的控制使得 Infra Watchdog 不仅能应对突发故障,还能预防潜在问题。 从技术实现上看,Infra Watchdog 利用 Python 编写,兼容 Python 3.8 及以上版本,并可选择性地集成 Docker API 来检测容器状态。它还支持与 Proxmox VE 虚拟化平台的本地 API 对接,实现对虚拟机或容器的直接状态查询。整个系统架构清晰,配置文件采用 JSON 格式,易于理解和修改。此外,内置的 cron 安装功能让定时自动检查变得一键完成,极大简化了日常维护工作。总体而言,Infra Watchdog 是一个集多功能、低门槛和高可靠性于一体的现代化基础设施监控工具,特别适合个人项目、创业公司内部系统以及注重数据主权的小型团队使用。
核心功能特点
- 支持 HTTP/HTTPS 端点监控,可验证状态码、响应时间及 SSL 证书有效性
- 提供 TCP 端口检测功能,适用于数据库、SSH 及其他自定义服务连通性检查
- 具备 Docker 容器状态监控能力,实时掌握运行、停止或异常容器情况
- 系统资源监控涵盖 CPU、内存和磁盘使用率,支持自定义告警阈值
- SSL 证书到期提醒机制,提前 30 天预警即将过期的 HTTPS 证书
- 可通过 WhatsApp、Telegram 或 Discord 发送告警通知,并支持告警冷却时间控制
适用场景
Infra Watchdog 非常适合用于家庭实验室(homelab)的全面监控场景。许多技术爱好者在家中搭建包含 Proxmox 虚拟化集群、Docker 应用栈(如 Nextcloud、Jellyfin、Home Assistant)、自建数据库等多种服务的复杂环境。传统云监控服务往往成本高昂且需要公网暴露,而 Infra Watchdog 作为本地部署方案,既能满足全天候监控需求,又避免了数据外泄风险。例如,当某个容器因内存泄漏崩溃时,系统会立即通过 Telegram 推送通知,让用户第一时间获知并重启服务,避免影响其他依赖组件。 对于提供 API 服务的小型开发团队或独立开发者而言,Infra Watchdog 是保障服务可用性的理想选择。尤其是在使用 RapidAPI 等平台分发接口时,客户对稳定性要求极高。一旦后端服务出现间歇性故障或网络波动导致响应超时,Infra Watchdog 会在问题发生数秒内触发告警,使运维者能在用户投诉前介入处理。结合其支持的自定义预期状态码和超时设置,可以轻松适配不同业务逻辑的健康检查规则,确保监控精准有效。 另一个典型应用场景是防止 SSL 证书意外过期带来的安全风险。许多中小型网站管理员习惯手动更新证书,容易遗忘导致服务中断。Infra Watchdog 可在证书剩余有效期不足 30 天时主动发送 WhatsApp 警告,给予足够时间完成续签操作。此外,在资源紧张的生产环境中,如磁盘空间即将耗尽或 CPU 长期高负载运行,该工具也能及时发出预警,帮助用户提前扩容或优化性能,从而构建更加健壮和可持续运行的 IT 基础设施。
