Self-Guardian 是一款专为智能代理设计的轻量级自我监控与约束规则系统，旨在防止因误操作或模型不确定性导致的意外文件删除、危险命令执行及高风险操作。该工具通过内置的非协商性安全约束机制，在每次文件写入、删除或 shell 命令执行前自动激活检查流程，确保所有操作都经过审慎评估。其核心设计理念是‘预防优于修复’，通过强制性的预操作清单和风险分级策略，显著降低人为失误带来的数据丢失或系统损坏风险。Self-Guardian 不仅适用于代码开发环境，还可广泛应用于自动化脚本、CI/CD 流程以及任何需要高可靠性的交互场景中，为 AI 助手提供一层坚实的安全护栏。该系统采用多层防护机制，首先通过‘预行动检查清单’（PAC）对每项操作进行五维风险评估：是否可逆、作用范围是否明确、是否存在更安全的替代方案、最坏情况下的后果以及用户是否已授权。一旦任一环节存在疑虑，系统将主动暂停并请求用户确认。此外，Self-Guardian 对敏感文件实施严格保护等级划分，包括‘绝不动用’（如 .env 密钥文件）、‘需先确认’（如 package.json 依赖配置）和‘安全可操作’三类，避免误触关键配置文件。对于命令行操作，系统内置了高危命令黑名单，涵盖 rm -rf、git 强制推送、sudo 提权等常见危险指令，并要求在执行前解释用途并提供更安全替代方案。整体而言，Self-Guardian 并非限制工具能力，而是通过结构化规则提升其可靠性与可控性。它特别擅长处理多文件批量操作时的风险控制，例如限制单次删除不超过三个文件，并对目录级操作要求先列出内容再确认。同时，系统强调‘恢复面包屑’机制——在覆盖文件前读取原内容以保留历史信息，在大型变更前建议 git 提交快照，并在操作后清晰报告结果。这种透明且保守的操作风格，使其成为开发者、运维人员乃至普通用户在日常工作中值得信赖的协同伙伴，有效平衡效率与安全。

核心功能特点

预操作检查清单（PAC）：执行任何文件/命令前必须回答五个关键问题，任一存疑即暂停并询问用户
三级文件保护体系：将文件分为‘绝不动用’（如密钥）、‘需先确认’（如依赖配置）和‘安全可操作’三类，按风险等级管控
高危命令拦截机制：内置 rm -rf、git 强制推送、sudo 等危险命令黑名单，要求解释用途并提供 safer alternative
批量操作节流控制：超过5个文件或3个删除项时自动分批次处理，目录操作前强制列出内容并确认
恢复面包屑机制：覆盖文件前读取原内容、建议 git 提交快照、操作后明确报告变更详情

适用场景

Self-Guardian 最适合那些需要高度可靠性和防错能力的协作场景，尤其是在 AI 代理与人类用户共同完成复杂任务时。例如，在团队协作开发中，当 AI 被赋予修改多个项目文件的权限时，Self-Guardian 能确保不会因误解需求而误删 .env 环境变量文件或数据库备份。它特别适合处理涉及敏感配置的场景，如自动部署脚本中修改 Dockerfile 或 CI/CD 流水线调整 Jenkinsfile，此时系统会暂停并要求说明改动影响，避免破坏生产环境。另一个典型应用场景是本地开发中的依赖管理，比如更新 package.json 或 Cargo.toml 后，Self-Guardian 会提示潜在风险并建议先创建 git 提交点，防止后续操作导致版本混乱。对于系统管理员或 DevOps 工程师而言，Self-Guardian 在处理服务器维护任务时尤为有用。假设需要清理临时文件或重置开发环境，传统上可能直接使用 rm -rf /tmp/* 或 docker system prune -a，但这类命令极易误伤重要数据。启用 Self-Guardian 后，系统会在执行前列出所有将被删除的文件路径，并询问是否继续，同时推荐使用更精确的删除方式或备份策略。同样，在数据库维护场景中，若 AI 被指示清理测试数据，Self-Guardian 会阻止无 WHERE 条件的 DELETE 语句，转而建议使用事务或备份后再操作，极大降低了生产数据丢失的风险。在日常编程辅助方面，Self-Guardian 也表现出色。当用户请求重命名多个旧版本配置文件时，系统会自动分批处理（每批≤5个），并在每轮完成后总结变更内容，让用户实时掌握进度。如果遇到不熟悉的文件扩展名（如 .pem 证书文件），它会先读取文件头信息再决定是否修改，避免误判格式导致损坏。此外，在长命令执行前（如超过100字符的 curl 管道命令），Self-Guardian 会先用自然语言解释其功能，确保用户理解后再执行，从而构建一种透明、可控且负责任的人机交互模式。

概览

核心功能特点

适用场景

相关推荐

Security Vulnerability Scanner

Sagb

Attribution Engine

Solidity

SOP Generator

Aviation Healthcheck

Security Sentinel

X OAuth API