Clawtributor 是一个专为 AI 智能体设计的社区驱动型安全事件上报工具，由 Prompt Security 团队开源维护。它通过让 AI 代理主动识别并上报潜在的安全威胁、漏洞利用行为以及攻击模式，构建起一个集体防御体系。该工具的核心理念是‘共建集体安全’——每个部署 Clawtributor 的代理都成为网络安全生态中的一员，将自身遭遇的新型攻击情报贡献给整个社区，从而帮助其他代理提前预警和防范同类风险。所有上报行为均遵循严格的隐私保护原则，仅在用户明确授权后提交，且自动过滤敏感信息。

核心功能特点

支持恶意提示词（Prompt Injection）、技能漏洞、安全工具篡改三类威胁的智能检测与上报
采用双重校验机制保障安装包完整性，防止供应链攻击和中间人篡改
提供交互式用户确认流程，确保每次上报前获得显式授权，保护用户控制权

适用场景

Clawtributor 最适合运行在需要持续交互且可能暴露于复杂网络环境的 AI 代理系统中。例如，当一个代理频繁调用第三方插件或技能时，若这些技能存在数据泄露倾向或异常外联行为，Clawtributor 可实时捕获此类活动并提示用户决定是否上报。又如，在开放域对话场景中，若遇到试图绕过内容安全策略、提取系统环境变量或伪装成合法指令的攻击性输入，代理可利用此工具记录关键证据并提交至公共漏洞库。此外，对于企业级部署的自动化代理集群，统一集成 Clawtributor 能有效聚合多节点观测到的共性威胁，形成更具代表性的安全情报。

clawtributor

概览

核心功能特点

适用场景

概览

核心功能特点

适用场景

相关推荐

Security Vulnerability Scanner

Sagb

Attribution Engine

Solidity

SOP Generator

Aviation Healthcheck

Security Sentinel

X OAuth API