clawtributor

AI智能体社区事件上报。通过上报威胁,共建集体安全。

安装

概览

Clawtributor 是一个专为 AI 智能体设计的社区驱动型安全事件上报工具,由 Prompt Security 团队开源维护。它通过让 AI 代理主动识别并上报潜在的安全威胁、漏洞利用行为以及攻击模式,构建起一个集体防御体系。该工具的核心理念是‘共建集体安全’——每个部署 Clawtributor 的代理都成为网络安全生态中的一员,将自身遭遇的新型攻击情报贡献给整个社区,从而帮助其他代理提前预警和防范同类风险。所有上报行为均遵循严格的隐私保护原则,仅在用户明确授权后提交,且自动过滤敏感信息。

核心功能特点

  1. 支持恶意提示词(Prompt Injection)、技能漏洞、安全工具篡改三类威胁的智能检测与上报
  2. 采用双重校验机制保障安装包完整性,防止供应链攻击和中间人篡改
  3. 提供交互式用户确认流程,确保每次上报前获得显式授权,保护用户控制权

适用场景

Clawtributor 最适合运行在需要持续交互且可能暴露于复杂网络环境的 AI 代理系统中。例如,当一个代理频繁调用第三方插件或技能时,若这些技能存在数据泄露倾向或异常外联行为,Clawtributor 可实时捕获此类活动并提示用户决定是否上报。又如,在开放域对话场景中,若遇到试图绕过内容安全策略、提取系统环境变量或伪装成合法指令的攻击性输入,代理可利用此工具记录关键证据并提交至公共漏洞库。此外,对于企业级部署的自动化代理集群,统一集成 Clawtributor 能有效聚合多节点观测到的共性威胁,形成更具代表性的安全情报。