Link Checker

抓取网页并检测断链、重定向和HTTP错误。适用于审计站点链接、发现404错误及上线前验证URL。

安装

概览

Link Checker 是一款专为开发者、运维人员和内容维护者设计的命令行工具,用于高效检测网页中的断链、重定向及各类 HTTP 错误。它通过调用 `curl` 对目标 URL 发起请求,记录每个链接的状态码,并直观展示其健康状态,从而帮助用户快速定位失效或异常链接。无论是单个页面还是批量地址,Link Checker 都能灵活应对,并将检查结果持久化存储于本地目录中,便于后续审计与追踪。该工具支持多种输入方式——包括直接检查单个 URL、扫描文档(如 Markdown 或 HTML 文件)内嵌的所有链接,以及一次性验证多个地址集合。所有检测结果均按时间顺序归档,形成可追溯的历史日志,方便用户分析长期趋势或生成统计报告。此外,Link Checker 还允许自定义超时时间、重试次数和 User-Agent 等参数,适应不同网络环境和反爬策略的需求。作为一款轻量级且功能完备的开源解决方案,它无需复杂配置即可集成到自动化流程中,成为网站上线前质量保障和日常维护的重要助手。

核心功能特点

  1. 支持单 URL 检查、文件扫描和多 URL 批量检测三种核心操作模式
  2. 自动识别并分类 HTTP 状态码:2xx(正常)、3xx(重定向)、4xx/5xx(客户端/服务端错误)、超时及连接失败
  3. 内置历史记录功能,保存全部检测结果以便回溯分析与趋势观察
  4. 提供实时统计概览,显示总检查数、各状态分布比例及成功率百分比
  5. 可导出 TXT、CSV 或 JSON 格式的完整报告或历史数据,便于团队协作与归档
  6. 允许自定义请求超时、重试次数和 User-Agent 头信息,增强灵活性

适用场景

Link Checker 特别适用于需要系统化验证链接有效性的各类场景。对于前端开发者和内容编辑而言,在发布新文章或更新项目文档前,使用 `scan` 命令解析 Markdown 或 HTML 文件,能迅速发现因迁移或删除导致的 404 错误,避免误导读者。运维工程师则可利用其批量检测能力,定期检查公司官网、API 文档或内部知识库中所有外链的稳定性,确保业务连续性。当网站遭遇大规模内容重构时,管理员可通过对比前后两次扫描结果,精准识别受影响链接并进行修复。此外,SEO 专家常借助此类工具评估外链质量,排除指向失效页面的低价值引用,从而优化搜索引擎排名。由于 Link Checker 将结果持久化存储并支持导出,它也常被用于生成合规性审计报告,满足企业内外部对数字资产完整性的监管要求。无论是个人项目还是企业级应用,只要涉及 URL 管理,Link Checker 都能显著提升工作效率与可靠性。