什么是memory-indexer
Memory Indexer 是一款专为 AI Agent 设计的短期记忆关键词索引工具,旨在为其提供长期记忆能力。该工具通过自动提取记忆中的关键词并建立高效的索引结构,使 AI 能够快速检索、关联和回顾过往信息。它支持多模式搜索(OR/AND),并能智能发现记忆之间的关联性,按时间线展示记忆内容。此外,Memory Indexer 还具备重要记忆标记、增量同步外部目录、会话备份与精简等实用功能,有效防止记忆无限膨胀,提升系统整体效率。
该工具采用 jieba 进行中文分词以提取关键词,并结合 HuggingFace 的 bge-base-zh-v1.5 模型实现向量语义搜索,支持三级级联搜索机制:从关键词匹配到向量语义再到原文检索,确保在不同精度需求下都能获得最佳结果。同时,Memory Indexer 提供了快照备份与恢复机制,在压缩或清理前自动创建备份,保障数据安全。
从 v2.0.0 版本开始,Memory Indexer 引入了 OpenClaw Hook `memory-indexer-on-new`,可在新对话启动时自动检索相关历史记忆,进一步增强上下文连贯性和响应准确性。整个系统运行于 Python 3.8+ 环境,数据默认存储在 `~/.memory-indexer/` 目录下,包括索引文件、同步状态和重要记忆标记等。
核心功能特点
- 自动提取关键词并建立高效索引,支持多关键词精确搜索(OR/AND 模式)
- 三级级联搜索机制:关键词 → 向量语义 → 原文,自动降级保证检索效果
- 基于 jieba 中文分词与 HuggingFace bge-base-zh-v1.5 模型的向量语义搜索
- 关联发现功能,自动识别并展示经常共同出现的记忆片段
- 时间线视图与重要记忆标记,便于按时间顺序管理和优先保留关键信息
- 增量同步与失效清理,仅处理新增或修改的文件,避免重复计算
适用场景
Memory Indexer 特别适合需要长期记忆能力的 AI Agent 应用场景,例如智能助手、知识管理系统或个性化推荐引擎。在这些场景中,AI 需要不断积累用户交互信息,并在后续对话中调用历史数据以提供连贯服务。通过 Memory Indexer,AI 可以在每次新会话开始时自动检索相关记忆,显著提升回答准确性和上下文理解能力。
对于开发者而言,该工具也适用于构建具有自我学习能力的聊天机器人或自动化工作流系统。例如,在一个客户支持机器人中,Memory Indexer 可帮助系统记住客户的历史问题、偏好及解决方案,从而在未来的互动中提供更精准的服务。此外,研究人员可以使用它来追踪实验过程中的关键发现和假设,形成可追溯的知识图谱。
在日常办公和创作领域,Memory Indexer 同样表现出色。写作者可以通过标记重要灵感片段并设置提醒,在写作过程中快速调取相关内容;项目经理则可利用其时间线视图回顾项目里程碑和决策记录,确保团队协作的一致性。无论是个人知识管理还是企业级应用集成,Memory Indexer 都提供了灵活且高效的解决方案。
