triple-memory-baidu-embedding

集成了百度Embedding自动召回、Git-Notes结构化记忆和基于文件的工作区搜索的完整记忆系统。适用于本地隐私的全面代理记忆、跨会话持久上下文以及多记忆后端协同管理决策、偏好和任务。

安装

概览

Triple Memory with Baidu Embedding 是一个集成了百度Embedding自动召回、Git-Notes结构化记忆和基于文件的工作区搜索的完整记忆系统。该系统采用三层架构设计,旨在实现跨会话的持久上下文保留,同时确保本地隐私安全。通过将百度Embedding技术替代原有的LanceDB,系统在保持原有功能完整性的基础上,增强了中文语义理解能力并降低了外部API依赖风险。所有向量数据存储均在本地完成,仅通过百度API进行嵌入处理,从而在提升性能的同时保障了用户数据的安全性。 该系统的核心优势在于其自动化的记忆管理流程:在每次响应前,系统会利用百度Embedding自动检索相关对话记忆;在用户做出决策或表达偏好时,自动将其捕获并存储为结构化记忆;同时,结合Git分支感知的Git-Notes机制,实现对不同开发分支中关键信息的隔离与追踪。此外,文件搜索模块支持对MEMORY.md、memory/目录下的日志文件以及整个工作区文档进行快速检索,形成覆盖全场景的记忆网络。 尽管系统功能强大,但其运行依赖于百度API凭证的有效性。当未提供有效API密钥时,系统将进入降级模式,仅保留Git-Notes和文件系统层级的记忆功能,此时自动召回与自动捕获行为将被禁用,相关工具也无法使用。因此,在生产环境中部署前需确保正确配置BAIDU_API_STRING和BAIDU_SECRET_KEY环境变量,并通过clawdhub安装必要的依赖包git-notes-memory和memory-baidu-embedding-db。

核心功能特点

  1. 集成百度Embedding实现隐私优先的自动记忆召回与存储
  2. 支持Git分支隔离的结构化记忆管理,具备实体提取与重要性分级
  3. 提供工作区级文件搜索能力,涵盖MEMORY.md及日常日志文档
  4. 三层协同架构:对话记忆、结构化决策与工作区文档无缝联动
  5. 完全本地化向量存储,仅通过百度API完成嵌入计算以保障数据安全

适用场景

该记忆系统特别适合需要长期维护项目上下文、频繁切换开发分支且重视隐私保护的技术团队。例如,在一个多人协作的软件开发项目中,每位开发者可在各自Git分支上独立记录架构决策、技术选型理由或临时调试方案,而无需担心信息泄露或污染主分支。系统会自动将这些高重要性标记的记忆按实体分类归档,并在后续对话中智能调取,避免重复询问相同问题。 对于从事自然语言处理或中文内容创作的AI助手而言,百度Embedding的深度中文优化特性尤为关键。它不仅能更精准地理解中文语境中的隐含意图(如‘我喜欢简洁的设计’实际暗示排斥复杂UI),还能在处理方言、成语或行业术语时表现出优于通用模型的理解力。这使得系统能够在多轮交互中持续捕捉用户的个性化偏好,并将其融入后续响应逻辑。 在日常办公场景中,无论是程序员记录每日代码审查要点,还是产品经理梳理用户需求变更轨迹,该系统的文件搜索与结构化记忆功能都能显著提升知识沉淀效率。通过./scripts/file-search.sh脚本快速定位历史讨论片段,或通过python3 skills/git-notes-memory/memory.py手动添加带标签的重要决定,用户可以轻松构建个人专属的知识图谱,实现从碎片化沟通到系统化记忆的平滑过渡。