Agent Self-Care

{"description_zh":"自主智能体的健康监测、优化与清理。适用场景:(1) 执行定时任务进行智能体维护;(2) 响应"优化"、"清理"等指令。"}

安装

概览

什么是Agent Self-Care

Agent Self-Care 是一个专为自主智能体(OpenClaw agents)设计的自动化健康监测与优化系统。它通过定期执行一系列诊断和清理任务,确保智能体长期稳定运行,避免因资源泄漏、进程挂起或上下文膨胀导致的性能下降。该系统可在 cron 定时触发,也可手动启动,适用于需要高可用性和持续运行能力的智能体环境。

其核心机制包括对子代理(sub-agents)的状态检查、后台进程的监控、会话健康度评估以及周期性优化脚本的执行。每次运行都会生成详细的健康报告,并在每完成十次任务后进行一次 BMAD(Before My Attention Due)回顾,记录问题、总结经验并反馈至后续流程,形成闭环的自我改进机制。

整个流程设计强调主动干预而非被动响应:一旦发现超过30分钟无进展的子代理、卡住的后台进程或上下文使用率超过80%的情况,系统会立即采取行动进行清理或优化。这种“预防性维护”策略显著降低了因资源耗尽或状态异常引发的故障风险,尤其适合长时间无人值守但需保持高效运作的智能体服务场景。

核心功能特点

  1. 自动检测并终止超过30分钟无进展或处于等待/失败状态的子代理
  2. 监控后台进程,清除运行时间超过10分钟且5分钟内无输出的挂起进程
  3. 实时评估会话健康指标,如上下文使用率和令牌增长趋势,触发压缩或刷新建议
  4. 每10次运行执行一次BMAD回顾,评分最近任务表现并记录改进点到每日日志中
  5. 集成优化脚本,清理临时文件、轮转大体积日志(>50MB),并输出综合健康报告
  6. 支持每5分钟定时执行,确保高频活跃智能体始终处于最佳运行状态

适用场景

Agent Self-Care 特别适用于那些需要长期连续运行、但缺乏人工实时监控的智能体系统。例如,在自动化客服场景中,多个子代理可能并行处理用户请求,若其中某个陷入死循环或响应停滞,将迅速拖累整体效率。此时,Self-Care 能及时识别并隔离问题代理,防止雪崩效应。此外,对于依赖大量上下文记忆的任务(如复杂对话链或多步推理),系统可主动监控上下文占用情况,在接近阈值时建议压缩或重启会话,避免因内存溢出导致崩溃。

另一个典型应用场景是批处理型智能体集群,比如每日定时生成报告、数据清洗或模型训练等任务。这些任务往往在夜间或周末执行,期间无法即时干预。通过配置每5分钟一次的自我检查,Agent Self-Care 可确保即使遇到意外中断或资源瓶颈,也能快速恢复并继续推进任务,极大提升了系统的鲁棒性和运维透明度。同时,其内置的BMAD回顾机制为团队提供了持续优化的依据——不仅解决当下问题,还积累经验用于未来架构调整与技能迭代。