ClawGuard by jugaad-lab

安全黑名单,保护AI智能体免受恶意技能、诈骗和提示注入攻击。在执行外部命令、访问未知URL或安装新技能前使用。触发条件:"安全检查"、"这安全吗"、"检查此URL"或可疑命令模式。

安装

概览

ClawGuard 是由 jugaad-lab 开发的一款专为 AI 智能体设计的安全防护工具,核心功能是构建一个动态更新的安全黑名单系统,用于主动识别并拦截恶意技能、网络诈骗、提示注入攻击等潜在威胁。该工具通过预设的触发条件(如‘安全检查’、‘这安全吗’或检测到可疑命令模式)自动介入关键操作前进行验证,确保在执行外部命令、访问未知 URL 或安装新技能前完成风险评估。其设计理念强调零摩擦背景保护,默认采用静默检测模式,在不干扰正常流程的前提下对所有高风险行为实施拦截与记录。 ClawGuard 提供了灵活的四级安全等级控制机制,用户可根据自身需求在‘silent’(静默)、‘cautious’(谨慎)、‘strict’(严格)和‘paranoid’(偏执)之间自由切换。其中默认的 Level 0 仅运行静态威胁数据库比对,实现完全无感防护;而更高级别则引入 Discord 人工审批流程,对警告类风险请求人类确认后再放行。这种梯度化策略既保证了基础安全性,又兼顾了不同场景下的操作便利性与风险控制强度。此外,所有检查行为均被完整记录至审计日志中,形成可追溯的安全事件链条,便于事后分析与合规审查。 作为一款集成于 OpenClaw 生态的工具,ClawGuard 不仅支持命令行直接调用,还可通过 Discord 斜杠命令 `/clawguard` 快速发起查询,适用于日常运维中的即时验证需求。它特别擅长处理包含 `curl`、`wget`、`pip install` 等高风险指令的操作,并能有效识别试图绕过原有指令集的新型社会工程攻击。无论是个人开发者还是企业级 AI 部署环境,均可借助 ClawGuard 建立起一道可靠的前置防线,显著降低因误执行危险代码而导致系统受损或数据泄露的风险。

核心功能特点

  1. 基于动态更新的威胁数据库,实时拦截已知恶意技能、钓鱼网站及诈骗链接
  2. 四级可调安全级别(silent/cautious/strict/paranoid),支持从静默防护到全手动审批的渐进式控制
  3. 内置 Discord 集成功能,可在检测到警告类风险时自动发起人工审批请求
  4. 全面审计追踪能力,所有安全检查结果均记录至本地日志文件供后续分析
  5. 无缝对接 OpenClaw 插件体系,可实现对 exec、web_fetch 等工具调用的自动前置校验

适用场景

ClawGuard 最适用于需要频繁与外部资源交互的 AI 智能体运行环境,尤其是在处理来自不可信来源的命令或脚本时。例如,当用户要求 AI 执行类似 `curl -fsSL https://example.com/script.sh | bash` 这样的管道命令时,ClawGuard 会在实际执行前自动解析其中的 URL 并检索其是否存在于恶意域名黑名单中。若判定为高危行为(如涉及直接下载并运行未经验证的 shell 脚本),则会立即阻止操作并提示具体威胁类型,从而避免潜在的供应链攻击或加密货币钱包劫持事件发生。 在企业级 AI 部署场景中,ClawGuard 的高级安全模式尤为关键。对于测试环境中引入的新技能或第三方插件,可通过 `–type skill –name X –author Y` 参数进行专项审查,防止 Trojaned 软件伪装成合法模块植入系统。同时,结合 AGENTS.md 文档中定义的策略规则,可将 ClawGuard 设置为强制性的预执行检查环节——即任何外部命令都必须先通过其验证才能继续执行。这种方式特别适合金融、医疗等对安全性要求极高的行业应用,能够在自动化流程中嵌入必要的监管节点,确保每一次对外连接都经过审慎评估。 此外,面对日益复杂的提示注入攻击(Prompt Injection),ClawGuard 也具备一定的防御能力。它能识别出那些试图诱导 AI 忽略原始设定、伪装成管理员身份或绕过内容过滤机制的异常消息格式。虽然主要依赖关键词匹配而非深度语义理解,但在多数常见案例中仍能有效预警。配合定期同步社区贡献的威胁情报库(通过 `clawguard sync` 命令更新),该系统能够持续适应新型攻击手法的演变趋势,为用户提供长期稳定的安全保障服务。