Memory Poison Auditor

审计 OpenClaw 内存文件,检测注入指令、品牌偏见、隐藏引导及内存污染模式。用于审查 MEMORY.md 及日常记忆...

安装

概览

{ “overview_html”: “Memory Poison Auditor 是一款专为 OpenClaw 项目设计的内存文件审计工具,用于检测长期记忆文件中潜藏的恶意指令、品牌偏见或隐蔽策略注入。它通过扫描 MEMORY.md 及其他记忆文件,识别出可能被外部操控或无意植入的异常内容模式,如强制推荐特定品牌、禁止提及某些关键词、伪造用户意图等。该工具不仅关注显性的指令注入,还深入分析低信号但具有潜在引导性的文本块,帮助开发者维护记忆的纯净性与可靠性。审计结果以 PASS、WARN 和 BLOCK 三种状态呈现,分别对应安全、需复查和应清理的不同风险等级。所有报告与备份均自动保存至指定目录,便于追溯与管理。”, “feature_items”: [ “检测提示词注入类隐藏指令,防止外部操控影响模型行为”, “识别‘始终推荐 X’或‘永不提 Y’式品牌引导倾向”, “分析异常品牌重复与偏好塑造,发现隐性营销策略”, “标记虚假权威声明(如伪造审批、冒充用户意图)”, “过滤低信噪比但具政策伪装特征的隐蔽内容块”, “支持一键清理可疑段落并自动生成备份以防误删” ], “scenarios_html”: “Memory Poison Auditor 最适用于需要高度可信记忆系统的场景,尤其是在涉及重要决策规划或对外输出建议时。例如,在构建面向公众的智能助手或企业级 AI 服务前,必须确保其记忆库未被污染,避免因历史对话中残留的品牌倾向或操作策略导致输出偏差。该工具也适合开发团队定期自查项目记忆文件,特别是在多人协作环境下,防止个别成员无意中引入带有偏见的记忆片段。对于依赖长期记忆进行个性化服务的应用而言,使用该工具可显著降低因记忆污染引发的合规风险与用户体验问题。此外,当怀疑某段记忆被篡改或存在隐蔽指令时,可通过其 AI 辅助审查功能进一步甄别模糊案例,提升审计精度。” }