ClawDefender – OpenClaw Security – Prompt injection, rogue skills etc

AI代理的安全扫描器和输入清理器。检测提示词注入、命令注入、SSRF、凭证泄露和路径遍历攻击。用于:(1)从ClawHub安装新技能,(2)处理邮件、日历事件、Trello卡片或API响应等外部输入,(3)验证URL后再获取,(4)对工作区进行安全审计。保护代理免受不受信任数据源中的恶意内容侵害。

安装

概览

ClawDefender 是一款专为 AI 代理设计的安全防护工具,旨在保护智能代理系统免受恶意输入和潜在攻击的侵害。它通过扫描技能包、清理外部输入以及拦截提示词注入等多种威胁,为 OpenClaw 平台上的 AI 工作流提供全面的安全保障。该工具适用于从安装新技能到处理邮件、API 响应等各类外部数据源的多种场景,是提升 AI 代理安全性的关键组件。其核心理念在于‘不信任任何外部输入’,确保所有来自不可信源的数据在传递至 AI 模型前都经过严格审查。 ClawDefender 由两个主要脚本组成:`clawdefender.sh` 和 `sanitize.sh`。前者负责执行全面的技能安全审计、URL 验证及文本内容检测;后者则作为通用过滤器,专门用于识别和标记潜在的提示词注入攻击。整个系统基于标准的 Linux 命令(如 bash, grep, sed, jq),无需额外依赖,易于集成到现有工作流中。用户可通过简单的命令行调用,快速对技能进行扫描或对任意文本进行安全检查,极大提升了安全实践的便捷性。 该工具的设计充分考虑了实际应用场景中的自动化需求。例如,它可以被配置为每日定时任务,对工作区内的所有技能进行例行审计;也可以无缝集成到 CI/CD 流程中,在构建阶段就阻断包含高危漏洞的技能包。此外,其灵活的输出模式和退出码机制,使得开发者能够轻松地将 ClawDefender 嵌入到各类自动化脚本和监控系统中,实现从被动防御到主动预防的转变。

核心功能特点

  1. 全面扫描技能包:自动检测并报告已安装技能中的恶意代码或可疑行为,支持按严重程度分级告警。
  2. 实时清理外部输入:作为通用过滤器,可拦截来自邮件、API、网页等不可信源的提示词注入攻击。
  3. 智能 URL 验证:在执行网络请求前,检查目标 URL 是否指向内网、元数据端点或已知的数据泄露服务,防止 SSRF 和数据外泄。
  4. 多模式文本检测:支持对任意文本进行 prompt injection、命令注入、路径遍历等多种威胁模式的深度分析。
  5. 自动化友好设计:提供静默模式、严格模式及报告模式,配合明确的退出码,便于集成到 Cron 任务或 CI/CD 流水线。

适用场景

ClawDefender 的核心价值在于为 AI 代理系统构建一道坚实的安全防线,尤其适用于那些需要频繁与外部世界交互的场景。当你的 AI 代理从 ClawHub 安装新的技能时,ClawDefender 会自动对其进行安全扫描,确保引入的代码不包含后门、恶意指令或危险逻辑,从而从源头杜绝安全隐患。在处理来自电子邮件、日历事件、Trello 卡片或第三方 API 的响应等外部数据时,这些内容可能包含精心构造的恶意文本,旨在诱导 AI 执行非预期操作。此时,将数据管道导向 `sanitize.sh` 脚本,即可有效过滤掉潜在的提示词注入攻击,确保 AI 仅根据预设的安全指令进行决策。 在企业级部署或持续集成环境中,ClawDefender 的自动化能力尤为突出。你可以将其设置为每日定时任务,对工作区内所有技能进行一次全面审计,及时发现并修复问题。更进一步地,可以在 CI/CD 流程中加入 ClawDefender 的检查步骤,一旦发现新引入的技能存在高危漏洞,便立即终止构建过程,防止有风险的代码进入生产环境。对于需要频繁调用外部服务的应用,如爬虫、数据聚合工具或聊天机器人,使用 `–check-url` 参数在获取内容前先验证其安全性,能有效防范服务器端请求伪造 (SSRF) 攻击和数据泄露风险。通过这些自动化措施,ClawDefender 不仅提升了单个实例的安全性,更将安全防护提升到了组织级别的标准实践。