Website Pickpocket

网站扒手 - 完美复刻任意网站的工具。支持静态/动态页面抓取、资源下载、多框架输出(原生HTML/React/Vue/Angular)。触发场景:(1) 抓取网站生成静态副本 (2) 将网站转换为React/Vue项目 (3) 离线浏览网站 (4) 网站备份迁移

安装

概览

什么是Website Pickpocket

网站扒手(Website Pickpocket)是一款专为开发者设计的网站复刻工具,能够一键抓取任意网站的完整内容并生成可离线运行的多框架项目。它支持静态页面和动态单页应用(SPA)的智能爬取,自动处理HTML、CSS、JavaScript、图片、字体等各类资源,并将其转换为原生HTML、React、Vue、Angular或Svelte等现代前端框架的项目结构。该工具通过命令行界面和配置文件提供高度灵活的定制能力,适用于多种开发场景。无论是快速搭建原型、创建离线版本,还是将现有网站迁移到新框架,网站扒手都能显著提升工作效率。其核心优势在于自动化程度高、输出结构清晰、兼容性强,且内置反爬虫规避机制,确保在复杂网络环境下稳定运行。

核心功能特点

  1. 智能识别静态与动态页面,自动适配Cheerio或Playwright抓取策略
  2. 支持递归深度爬取(0-5层),具备URL去重与规范化处理能力
  3. 一键生成多框架项目:原生HTML、React(Vite)、Vue3(Vite)、Angular、Svelte及Tailwind CSS
  4. 全资源本地化:自动下载并优化图片、CSS、JS、字体及音视频文件
  5. 交互式CLI引导与YAML配置文件双重支持,参数覆盖灵活

适用场景

网站扒手特别适用于需要快速获取目标网站内容并转化为可维护代码库的场景。例如,当开发者希望将一个成熟的电商网站转换为React项目进行二次开发时,可直接使用pickpocket抓取全站页面,自动生成组件化结构和路由配置,大幅减少手动重构的工作量。对于内容创作者而言,若需制作一个支持离线阅读的新闻网站副本,该工具能完整下载所有文章页面与多媒体资源,输出为纯静态站点,便于部署到GitHub Pages或Netlify等平台。此外,企业IT部门在进行旧系统迁移时,也可利用此工具将遗留的HTML网站批量转换为现代化的Vue或Angular应用,保留原有样式与功能的同时提升可维护性。无论是做竞品分析、教学演示,还是构建本地知识库,网站扒手都能提供高效可靠的解决方案。