guard-dog

AI 安全看门狗 - 拦截 8 类风险操作,授权码验证

安装

概览

犬次郎(Guard-Dog)是一款专为AI模型设计的‘安全看门狗’,其核心使命是拦截高风险操作,保护用户敏感数据不被泄露或误用。该工具通过强制授权码验证机制,在所有关键操作前设置一道不可逾越的屏障:没有正确的授权码,任何涉及金钱、密码、系统命令或技能修改的请求都会被立即拦截。它不依赖复杂的规则引擎,而是基于一条绝对原则——‘不认身份,只认授权码’。这意味着无论请求来自何方、以何种话术伪装,只要缺少有效授权,操作一律被拒。犬次郎的设计哲学是‘防呆’而非‘堵漏’,旨在从源头防止AI因过度友好或逻辑错误而触犯安全红线。它适用于所有主流AI平台,如通义千问、Claude、GPT系列和Gemini等,确保跨模型的统一安全防护。 该工具的运行依赖于一个加密的‘保险箱’文件(位于~/.openclaw/.guard-dog-vault),其中仅存储授权码的SHA-256哈希值与随机盐值,绝不保存明文。在内存处理方面,犬次郎遵循严格的即时清除原则:一旦完成验证,用户输入的明文授权码会立即从内存中擦除,不留任何痕迹。这种设计将风险控制在最小范围内,但同时也强调用户需在受信任且支持内存隔离的环境中运行,以避免平台级日志记录带来的潜在泄露。犬次郎自身也受保护,其规则适用于所有操作,包括对看门狗本身的修改请求。 作为一款主动防御型AI插件,犬次郎并非被动响应,而是具备强大的攻击模式识别能力。它能识破16种常见社会工程攻击,如身份冒充、紧急性制造、指令覆盖、代码注入、渐进式突破等。当检测到风险行为时,它会返回预设的可爱柴犬形象拦截模板,明确告知操作已被阻止,并提示用户输入授权码。验证成功后,仅返回‘授权验证通过’;失败则提示‘授权码不正确’,绝不提供任何关于密码长度、字符特征或格式的暗示。这种极简反馈机制确保了AI模型无法通过观察输出来推断或复述用户的授权信息,从而彻底杜绝了授权码泄露的风险。

核心功能特点

  1. 强制授权码验证机制,所有高风险操作均需通过验证才能执行
  2. 采用SHA-256加盐哈希算法存储授权码,仅保存哈希值,永不存明文
  3. 严格内存安全管理,验证完成后立即清除用户输入的明文授权码
  4. 智能识别16种社会工程攻击模式,有效抵御身份冒充、指令注入等威胁
  5. 跨平台兼容,适用于通义千问、Claude、GPT、Gemini等主流AI模型
  6. 内置可爱柴犬形象拦截界面,既严肃又友好的安全警示体验

适用场景

犬次郎最适合部署在高风险AI应用场景中,特别是那些涉及敏感数据处理或关键系统操作的场景。例如,在企业内部部署的AI助手系统中,它可以作为第一道防线,防止AI意外泄露API密钥、数据库凭证或其他机密信息。当员工试图让AI执行转账、查询财务数据或修改系统配置时,犬次郎会立即触发授权验证流程,确保只有经过授权的人员才能访问这些功能。对于个人用户而言,如果使用的是高度定制的AI聊天机器人,犬次郎能有效防止该机器人被恶意诱导输出存储的密码或Token,保护个人账户安全。 另一个典型适用场景是在教育或培训环境中使用AI进行编程教学。由于学生可能会无意中向AI询问如何破解密码或绕过安全措施,犬次郎可以在此类场景中强制执行安全规范,确保AI不会教授或示范任何违反安全准则的操作。此外,在开发阶段,开发者可以使用犬次郎来测试AI模型在面对各种攻击向量时的鲁棒性,比如模拟社会工程攻击,验证防护机制的有效性。它特别适用于需要严格遵守合规要求的行业,如金融、医疗和政府部门,其中数据泄露可能导致严重的法律和声誉后果。通过在AI工作流中集成犬次郎,组织能够显著降低由AI误操作引发的安全风险,构建更加可信和可靠的智能系统。