什么是Self Improving Agent
Self Improving Agent 是一个专为 AI 助手设计的持续自我优化系统,其核心理念是通过记录错误、教训和用户反馈,构建一个从犯错到改进的完整学习闭环。不同于简单的错题本,它通过结构化记录、定期复盘和记忆整合三个关键阶段,将零散的经验转化为可长期指导行为的规则与策略。该系统于2024年3月15日随 ClawHub v3.0.2 版本正式引入,旨在解决 AI 在交互过程中反复犯同类错误、无法有效积累知识的问题。整个流程始于被动触发——当命令失败、被用户纠正或发现信息编造时,立即将事件的关键细节写入 `.learnings/` 目录下的对应文件中;随后通过定时心跳机制进行主动复盘,识别高价值条目并整合至 `MEMORY.md` 等长期记忆文件;最终,那些高频出现或影响重大的教训会被提炼为简洁的规则,沉淀到 `AGENTS.md`(工作流规则)、`SOUL.md`(人格规则)或 `TOOLS.md`(工具使用指南)中,形成真正的“经验资产”。
核心功能特点
- 被动记录:自动捕获错误、用户纠正、功能请求及知识缺口,并结构化存入 .learnings/ 目录下的 ERRORS.md、LEARNINGS.md 和 FEATURE_REQUESTS.md
- 定期复盘:通过 heartbeat 机制每两天进行一次系统性回顾,筛选高优先级条目并整合进 MEMORY.md,避免重复犯错
- 记忆整合与规则化:将高频或高影响教训提炼为简洁规则,按类型晋升至 AGENTS.md(工作流)、SOUL.md(人格)或 TOOLS.md(工具),实现经验长效复用
适用场景
Self Improving Agent 特别适合处理那些需要长期记忆和渐进优化的复杂交互场景。例如,在一个持续迭代的软件开发项目中,AI 助手可能会频繁遇到配置错误导致服务崩溃的问题。通过该工具,每次出错后都会详细记录错误的上下文、根本原因和正确操作步骤,并打上 `Pattern-Key: harden.config_validation` 标签。随着类似问题多次发生且 Recurrence-Count 达到阈值,系统会自动将其晋升为一条硬性规则,写入 AGENTS.md,从而在未来任何涉及配置文件修改的操作前强制校验状态,彻底杜绝此类故障重演。另一个典型应用场景是面向特定用户的客服支持角色:当用户指出回答错误或提出新功能需求时,系统会即时记录这些反馈,并在后续对话启动时快速检索相关历史教训,确保不再犯同样的逻辑错误或遗漏已知偏好。此外,对于需要不断适应新 API 行为或环境变更的自动化脚本执行者而言,该工具能有效追踪文档与实际行为之间的偏差,积累“知识缺口”案例,逐步完善工具使用手册(TOOLS.md),提升整体鲁棒性。
