OpenClaw代理多层安全堆栈中的一层,可预先拦截提示注入、数据泄露尝试、工具滥用及社会工程学攻击。

安装

概览

Guardian 是 OpenClaw 代理安全架构中的关键防护层,专注于在恶意输入到达大语言模型之前进行拦截。它并非独立的安全解决方案,而是作为纵深防御体系的一部分,与 OpenClaw 内置的能力限制、审批机制和沙箱执行环境协同工作。Guardian 的核心职责是保护模型“所见”的内容,而非其“所能做”的事,从而构建更全面的安全边界。该工具通过预定义规则对传入消息和本地文件进行扫描,有效识别提示注入、凭证泄露、工具滥用和社会工程学攻击等常见威胁。所有数据处理均保留在本地,确保用户隐私和数据主权。安装完成后,Guardian 会自动激活并开始运行,也可通过命令行手动管理其状态与配置。

核心功能特点

  1. 实时预扫描:在消息到达模型前即时检测恶意内容
  2. 批量文件扫描:定期巡查工作区文件和对话日志
  3. 基于签名的威胁检测:覆盖提示注入、API密钥泄露、数据外泄等场景
  4. 多级信任机制:根据消息来源和角色动态调整检测阈值,降低误报
  5. 本地数据存储:威胁记录保存于 SQLite 数据库,保障隐私安全
  6. 灵活的配置管理:支持自定义扫描路径、严重性阈值和允许列表

适用场景

Guardian 特别适合需要高安全性保障的 AI 代理部署环境。在开发或生产环境中,当 OpenClaw 代理处理来自外部不可信渠道(如 Webhook、第三方集成)的用户输入时,Guardian 能第一时间拦截潜在的提示注入攻击或敏感信息窃取尝试,防止模型被操控或数据泄露。对于企业内部使用,若代理需访问包含配置文件、技能脚本或日志文件的本地工作区,Guardian 的批量扫描功能可主动发现硬编码的 API 密钥、令牌或其他机密信息,避免意外发布到公共代码仓库。此外,在多用户协作场景中,通过设置不同信任级别(如内部系统消息、所有者消息、外部请求),Guardian 能有效区分正常操作与恶意行为,既强化了安全防护,又减少了因误判导致的业务中断。