{ “overview_html”: “Input Guard 是一款专为防御提示词注入攻击（Prompt Injection）而设计的扫描工具，适用于处理来自不可信外部来源的文本内容。它能够在 AI 智能体实际处理数据之前，对抓取的网页、社交媒体帖子、搜索结果或 API 响应进行安全检测，充当一道关键的防护层。该工具采用纯 Python 编写，不依赖任何第三方库，仅需 Python 3 环境即可运行，具备极强的可移植性。其核心能力在于识别多种隐蔽的攻击模式，并通过多语言支持覆盖英语、韩语、日语和中文等常见语言场景。用户可根据需求选择不同的敏感度等级，从‘低’到‘偏执级’，灵活平衡安全性与误报率。此外，Input Guard 提供了丰富的输出格式选项，包括人类可读模式、JSON 结构化数据和静默模式，便于集成到自动化工作流中。当检测到威胁时，工具会通过退出码明确指示风险状态，并可选地通过 OpenClaw 通道向人工发送警报，实现快速响应与团队协作。”, “feature_items”: [ “16 种检测类别覆盖指令覆写、角色伪装、越狱攻击、数据泄露等主流提示词注入手法”, “支持英文、韩文、日文、中文等多语言环境下的攻击模式识别”, “提供低、中、高、偏执四级敏感度设置，适应不同安全需求场景”, “支持命令行输入、文件读取、标准输入流等多种文本接入方式”, “内置 LLM 增强分析能力，可作为第二层检测机制应对规避型攻击”, “零外部依赖，仅使用 Python 标准库，无需安装额外包即可部署” ], “scenarios_html”: “Input Guard 最核心的应用场景是在 AI 系统从外部获取未经验证的内容时进行前置安全检查。例如，当智能体通过 web_fetch 抓取网页内容、使用 bird CLI 检索 X/Twitter 上的推文、调用 Brave Search 或 SerpAPI 获取网络搜索结果，或者接收来自第三方 API 的响应数据时，这些内容都可能被恶意用户嵌入隐蔽的提示词指令。此时，必须在内容进入大模型推理引擎前执行 Input Guard 扫描，否则可能导致系统行为失控、权限越界甚至敏感信息泄露。该工具特别适合构建在自动化数据流水线的第一环节，确保只有通过安全评估的内容才能继续参与后续处理流程。对于需要频繁访问互联网内容的应用（如新闻摘要生成、舆情监控、社交监听等），强制启用 Input Guard 是保障系统整体安全性的必要措施。此外，在开发面向公众开放的 AI 代理服务时，将其作为默认的安全校验步骤，可有效防范大规模滥用风险。” }

概览

相关推荐

Anime Image Downloader (Safebooru, Download Only)

email-designer

Bible QA (OpenClaw Church)

VietQR

Filtrix Video Gen

biliup-skills

XReplyAI – Social Post Manager

PlumeImage