Clawbrowser

当智能体需通过 Microsoft Playwright CLI (`playwright-cli`) 驱动浏览器进行导航、表单交互、截图、录制、数据提取、会话管理或调试,且无需加载完整 MCP 浏览器时使用。旨在训练智能体掌握 CLI 命令、快照及会话配置习惯,确保 Playwright CLI 脚本化浏览的可靠性。

安装

概览

什么是Clawbrowser

Clawbrowser 是一款基于 Microsoft Playwright CLI 的轻量级浏览器自动化工具,专为需要通过命令行驱动浏览器执行导航、表单交互、数据提取等任务的智能体设计。它不依赖完整的 MCP 浏览器环境,而是直接利用 Playwright 的命令行接口实现高效、灵活的脚本化操作。Clawbrowser 的核心理念是帮助开发者或自动化代理快速上手并熟练掌握 Playwright CLI 的使用模式,确保在无需图形界面的情况下仍能可靠地完成复杂网页任务。该工具默认运行于无头模式(headless),但可通过配置轻松切换为可视模式以支持调试和人工干预。通过标准化的命令集和配置文件机制,Clawbrowser 实现了对浏览器会话、页面元素引用、录制回放等功能的高度集成,非常适合需要稳定、可重复且易于维护的自动化流程构建。

核心功能特点

  1. 基于 Playwright CLI 提供完整的命令行浏览器控制能力,支持导航、点击、输入、截图等基础操作
  2. 内置快照机制生成唯一元素引用(如 e1, e2),避免因 DOM 变化导致的定位失效问题
  3. 支持多会话隔离管理,可保存 Cookie、本地存储与标签页状态,适用于登录态保持和多任务并行
  4. 集成录制与追踪功能,可自动生成视频、PDF 输出及网络请求日志,便于事后复盘和问题排查
  5. 通过配置文件集中管理浏览器类型、视窗尺寸、超时设置等参数,提升脚本可维护性
  6. 提供丰富的开发辅助命令,包括控制台日志抓取、网络请求监控和 JavaScript 代码注入

适用场景

Clawbrowser 特别适用于那些需要在不依赖完整图形界面或复杂框架的前提下,由智能体或脚本自动完成网页操作的场景。例如,在持续集成/部署流水线中,自动化测试工程师可以使用 Clawbrowser 快速验证 Web 应用的关键路径是否正常工作,而无需启动整个浏览器 GUI。对于爬虫项目而言,该工具能够高效模拟用户行为,绕过部分反爬机制,并精准提取目标数据,同时保持会话持久性以处理多步骤登录流程。此外,在安全审计或漏洞扫描过程中,Clawbrowser 可用于重现攻击向量并记录每一步的操作证据,确保复现过程的可追溯性。由于其轻量化和 CLI 导向的设计,它也常被用于容器化环境中运行的无界面服务器上执行定时任务或后台作业。无论是训练 AI 模型理解网页结构,还是构建端到端的数据采集系统,Clawbrowser 都能提供稳定、可控且文档齐全的交互方式,显著降低自动化脚本的编写与维护成本。