Safety Checks

先验证后信任 — 模型固定、回退与运行时安全验证

安装

概览

Safety Checks 是一个专为 AI 代理系统设计的运行时安全验证工具,其核心理念是‘先验证后信任’。该工具通过统一接口整合模型版本固定、回退链验证、缓存陈旧性检测和跨会话状态检查四项关键能力,形成一个完整的安全验证套件。所有操作均在本地完成,不涉及任何外部 API 调用或数据外传,确保用户隐私与系统安全。Safety Checks 能够在系统运行过程中主动检测潜在风险,如模型版本漂移、缓存失效、资源锁冲突等,从而防止因静默退化导致的生产事故。它特别适用于需要高可靠性保障的自动化工作流,通过在关键节点执行健康检查,提前发现并预警配置偏差或环境异常。

核心功能特点

  1. 模型版本固定:实时比对当前使用的 AI 模型版本与预期配置,防止因版本漂移引发的行为不一致问题
  2. 回退链验证:审计配置文件中的备用模型与存储路径定义,确保系统在降级时具备有效恢复路径
  3. 缓存陈旧性检测:根据 TTL 阈值识别过期缓存条目,支持自动清理以保障数据时效性与准确性
  4. 跨会话状态隔离检查:监控文件锁、临时文件及配置变更,避免多任务间状态污染和资源争用
  5. 本地仅操作:所有检查均为本地元数据读取与日志记录,不向任何外部服务发送数据,符合严格的数据驻留要求
  6. 集成 HEARTBEAT 机制:支持周期性自检,可在每次会话或每周定时触发关键安全检查

适用场景

Safety Checks 特别适合在复杂、长期运行的 AI 代理环境中部署,尤其是在那些对一致性和稳定性要求极高的场景下。例如,在一个持续数周甚至数月的自动化研发项目中,AI 代理可能频繁调用不同版本的模型进行代码生成或测试分析。若模型未经锁定而发生意外升级,可能导致输出质量波动或逻辑错误。此时,Safety Checks 可通过 `/sc model –strict` 命令强制校验当前模型版本是否与预设一致,一旦发现偏差立即告警,避免错误结果进入下游流程。另一个典型应用场景是企业级知识管理系统,其中多个代理并行处理文档解析、问答生成等任务,容易产生临时文件堆积或文件锁残留。Safety Checks 的会话状态检查功能可定期扫描 `.openclaw/safety-checks.lock` 和 `output/safety/temp-*` 文件,识别僵尸进程占用的资源,并通过 `–clear-state` 参数一键清理,维持系统整洁高效。此外,当系统遭遇网络波动或服务中断时,依赖回退机制的容错设计至关重要。Safety Checks 虽不测试实际连通性,但会验证配置文件中是否明确定义了备用模型和存储路径,确保预案就绪。这种预防性审计显著降低了运维盲区,使团队能在故障发生前做好充分准备。