tekin

一款基于 Rust 的快速无头浏览器自动化 CLI,支持 Node.js 回退,允许 AI 智能体通过结构化命令实现页面导航、点击、输入和快照。

安装

概览

什么是tekin

agent-browser 是一款基于 Rust 构建的高性能无头浏览器自动化 CLI 工具,专为开发者与 AI 智能体设计,提供简洁的命令行接口实现网页交互、页面分析和数据提取。它支持通过结构化命令完成页面导航、元素点击、表单填写、快照获取等常见操作,并兼容 Node.js 环境作为备用方案。该工具的核心优势在于其轻量化架构和强大的语义定位能力,允许用户通过引用(refs)或自然语言描述精准操控网页元素。无论是自动化测试、数据采集还是构建交互式演示流程,agent-browser 都能以极低的资源开销高效完成任务。此外,它还集成了视频录制、状态保存、网络拦截等高级功能,满足复杂场景下的调试与重现需求。作为一款开源项目,它由 Vercel Labs 团队主导开发,社区活跃,文档详尽,适合从初学者到专业工程师的各类用户。

核心功能特点

  1. 基于 Rust 打造,性能卓越且资源占用低
  2. 支持通过 @ref 或语义定位器精准操作网页元素
  3. 内置快照机制,自动为可交互元素生成稳定引用
  4. 提供完整的命令行接口,涵盖导航、点击、输入、截图等功能
  5. 支持多会话隔离、状态保存与恢复,便于管理复杂工作流
  6. 集成视频录制、网络请求拦截和 DevTools 调试能力

适用场景

agent-browser 特别适合需要快速构建自动化脚本或集成到 AI 代理系统中的场景。例如,在开发自动化测试套件时,开发者可以使用 `agent-browser open ` 打开目标页面,再通过 `snapshot -i` 获取当前可操作元素的引用,随后用 `fill` 和 `click` 模拟用户行为,最后结合 `wait –load networkidle` 确保页面加载完成,整个过程无需编写繁琐的 DOM 选择逻辑。对于数据抓取任务,该工具能稳定定位登录表单并完成认证,甚至将登录状态保存为 JSON 文件供后续会话复用,极大提升爬虫的持续运行能力。在企业级应用中,它还可用于生成产品演示视频:先探索界面流程,再调用 `record start` 录制操作过程,最终输出为 webm 格式供内部培训使用。由于其支持 `–headed` 模式显示真实浏览器窗口,也常被用于调试自动化逻辑,观察实际渲染效果与交互反馈,降低排查错误的难度。