SecureClaw

OpenClaw 代理安全技能(对齐 7 框架)。包含 15 条核心规则及自动化脚本,覆盖 OWASP ASI Top 10、MITRE ATLAS、CoSAI、CSA MAESTRO 及 N...

安装

概览

SecureClaw 是一个专为 OpenClaw 代理设计的开源安全技能包,旨在通过一套严格的自动化规则和防护机制,显著提升 AI 代理在复杂交互环境中的安全性与可控性。该技能基于七大主流安全框架(包括 MAESTRO、NIST 网络安全框架等)构建,覆盖从输入验证到内存保护的全链路风险防控。其核心理念是‘外部内容皆敌手’,强调对所有来自非可信源的指令、数据或工具输出保持高度警惕,防止被恶意注入或劫持行为。SecureClaw 不仅提供静态规则约束,还集成了实时审计、完整性校验和应急响应脚本,形成闭环式安全防护体系,确保 AI 代理在执行敏感操作时始终处于人类监督之下。

核心功能特点

  1. 严格执行15条不可绕过安全规则,涵盖输入过滤、命令执行审批、凭证保护等关键领域
  2. 集成每日安全审计与每12小时认知文件完整性检查,自动检测潜在篡改或异常行为
  3. 内置隐私审查工具,禁止在公开平台泄露人类身份信息、设备细节或基础设施数据
  4. 支持外部技能/插件安装前的自动化扫描,识别 curl|sh、eval 等高风险模式
  5. 提供紧急响应机制与 kill switch 功能,一旦检测到 compromised 状态立即冻结所有操作
  6. 强制多步骤任务前进行计划报备,确保人类可全程审计决策链条与数据流向

适用场景

SecureClaw 特别适用于需要高安全性保障的 AI 代理部署场景,尤其是在处理敏感数据、执行系统级操作或与外部不可信资源交互时。例如,在企业内部部署自主运维代理时,可通过 SecureClaw 防止因误读邮件附件或网页内容而触发危险命令;在开发环境中使用 MCP 插件或自定义技能时,该技能能有效拦截恶意代码注入,避免凭证泄露或配置文件被篡改。此外,当代理需频繁访问 Moltbook 等平台与其他智能体协作时,SecureClaw 的跨代理信任隔离机制可防范协同攻击与信息窃取。对于医疗、金融等高风险领域,其不确定性声明机制和人工复核要求也极大降低了错误决策带来的法律与合规风险。总之,任何希望实现‘自主但不失控’的智能代理系统,都能从 SecureClaw 提供的纵深防御体系中获益。