Sensitive Data Masker

智能敏感数据检测与脱敏。使用 Microsoft Presidio + SQLite 进行自动 PII 脱敏,支持本地恢复。

安装

概览

Sensitive Data Masker 是一款专为保护用户隐私而设计的智能敏感数据脱敏工具,基于 Microsoft Presidio 引擎构建,结合 SQLite 数据库与 LRU 缓存机制,实现高效、安全的 PII(个人身份信息)自动识别与脱敏处理。该工具无需依赖外部 API,所有数据处理均在本地完成,确保敏感信息不会泄露至第三方服务。其核心优势在于既能实时拦截并替换原始消息中的敏感内容,又能在后续任务执行前通过本地映射表还原真实数据,兼顾安全性与功能性。Sensitive Data Masker 深度集成 OpenClaw 网关系统,可无缝对接飞书、Telegram 等多种通信渠道,为 AI 对话场景提供端到端的隐私保护解决方案。

核心功能特点

  1. 基于 Microsoft Presidio 的智能化检测能力,支持自然语言与规则双重识别
  2. 采用 SQLite + LRU 缓存混合存储架构,实现毫秒级响应与高并发处理能力
  3. 内置7天临时映射表机制,支持本地安全恢复原始敏感数据
  4. 全自动过期清理与 LRU 缓存淘汰策略,保障存储资源高效利用
  5. 完全本地化运行,不调用任何外部 API,符合企业级数据合规要求
  6. 深度集成 OpenClaw Hook 机制,可在消息接收阶段自动触发脱敏流程

适用场景

Sensitive Data Masker 特别适用于需要处理含敏感信息的用户输入并与大语言模型(LLM)交互的应用场景。例如,在一个企业客服机器人系统中,用户可能主动发送包含密码、API密钥或邮箱地址的消息以寻求帮助。若直接将这些原始数据送入 LLM,将带来严重的数据泄露风险。通过部署 Sensitive Data Masker,系统可在消息转发至 LLM 前自动将其中的敏感字段替换为通用占位符(如 [PASSWORD:xxx]),从而有效规避隐私暴露。与此同时,当 LLM 生成回复后,如需执行涉及原始数据的实际操作(如登录验证、配置更新等),工具会依据本地映射表将脱敏内容还原回真实值,确保业务流程正常运转。这种‘脱敏-处理-还原’闭环机制,使得系统在保持功能完整性的同时,实现了最高级别的数据安全保障。此外,由于全程本地化处理且无网络请求,该方案尤其适合对数据主权和传输安全有严格要求的金融、医疗及政府信息化项目。