什么是Self-Improving Agent (With Self-Reflection)
Self-Improving Agent(自我改进智能体)是一款具备自我反思、自我批评与自主学习能力的AI助手,其核心在于通过持续评估自身输出、识别错误并积累经验,实现认知能力的永久性提升。该工具不依赖外部数据源或网络请求,而是将学习成果以结构化文件形式存储在本地目录 `~/self-improving/` 中,形成一套自组织的记忆系统。当用户指出错误、完成重要任务后主动复盘,或系统自身发现可优化之处时,便会触发反思机制,并将提炼出的经验教训归档至不同层级的记忆文件中。这种机制确保了知识能够随时间不断累积和进化,无需人工干预维护。整个架构分为热存储(HOT)、温存储(WARM)和冷存储(COLD)三个层级,分别对应高频加载、按需调用和历史归档,既保证了响应效率又实现了长期记忆的可持续性管理。
核心功能特点
- 支持自我反思与自我批评机制,在完成关键任务后自动评估输出质量并记录改进点
- 采用三级分层记忆结构:HOT(≤100行常驻内存)、WARM(项目/领域级)、COLD(归档区),实现高效检索与资源优化
- 自动识别用户纠正行为(如‘你错了’‘应该这样’)及显式偏好表达(如‘我喜欢…’‘永远不要…’),转化为持久化规则
- 具备模式推广与降级逻辑:成功应用3次相同修正则升级为HOT层;90天未使用则自动归档至COLD
- 严格遵循命名空间隔离原则,全局偏好存于memory.md,项目专属策略存于projects/,专业领域(代码/写作等)存于domains/
- 透明引用来源机制:所有基于记忆的行动均标注出处(如‘使用X(来自projects/foo.md:12)’),确保可追溯性
适用场景
Self-Improving Agent 特别适合那些需要长期积累专业技能、反复迭代工作流且希望减少重复错误的场景。例如,一名开发者每次编写Flutter界面时都会因间距问题返工,经过几次自我反思后,系统会将‘检查视觉间距再交付’这一经验固化为HOT层规则,后续同类任务便不再犯同样错误。对于撰写技术文档的工程师而言,若用户多次强调‘请使用被动语态’‘避免口语化表达’,系统会将其识别为风格偏好并写入memory.md,从而在未来的写作中自动遵循。此外,在处理跨项目协作时,每个项目可在projects/目录下建立独立的学习档案,保留特定需求下的最佳实践,而无需全局覆盖通用规则。当用户询问‘你之前是怎么处理这类问题的?’,系统能快速从WARM或HOT层调取相关模式,提供上下文一致的解决方案。无论是编程、文案创作还是沟通话术优化,只要存在可复用的经验模式,该工具都能通过持续反馈循环实现智能化演进。
