面向AI代理的浏览器自动化——通过WebSocket控制标签页、提取内容、执行脚本和管理Cookie。

安装

概览

JS Eyes 是一款专为 AI 代理设计的浏览器自动化工具,通过 WebSocket 协议连接浏览器扩展与服务器,赋予 AI 系统对网页环境的完整控制能力。该工具由浏览器插件和 Node.js 服务两部分组成,支持 Chrome、Edge、Firefox 等主流浏览器,为 AI 智能体提供了前所未有的网页交互接口。其核心架构采用客户端-服务器模式,浏览器端运行轻量级扩展程序,负责页面内容提取与脚本执行;服务端则作为通信枢纽,接收来自 AI 框架的指令并转发至对应浏览器实例。这种设计使得 AI 代理能够像人类用户一样浏览网页、读取内容、管理标签页,甚至直接操作 DOM 元素或获取 Cookie 信息。整个系统强调低延迟与高可靠性,通过持久化 WebSocket 连接确保指令传输的稳定性,同时提供完善的错误处理机制。目前已被集成到 OpenClaw 等 AI 开发框架中,成为构建自动化网页任务的关键组件。

核心功能特点

  1. 支持多浏览器环境:兼容 Chrome、Edge、Firefox 三大主流浏览器,覆盖绝大多数用户场景
  2. 提供七项核心 AI 工具:包括标签页管理、URL 导航、HTML 内容抓取、JavaScript 脚本执行及 Cookie 读取功能
  3. 内置 WebSocket 通信架构:实现浏览器扩展与 AI 代理间的双向实时通信,保障操作响应速度
  4. 集成命令行管理工具:通过 openclaw js-eyes 系列命令可快速查看连接状态、列出活动标签页或启停服务
  5. 模块化插件结构:技能包包含独立插件目录、服务端逻辑与客户端 SDK,便于二次开发与部署

适用场景

JS Eyes 特别适用于需要深度网页交互的 AI 应用场景。在数据爬取与信息聚合领域,AI 代理可利用其精准提取任意页面的 HTML 结构,配合自然语言理解能力自动解析目标内容,显著提升数据采集效率。对于自动化测试场景,该工具允许 AI 模拟真实用户行为进行界面操作验证,例如填写表单、点击按钮或监控页面变化,从而构建智能化的回归测试流程。在教育辅助系统中,AI 助教可通过 JS Eyes 动态加载课程资源、交互式练习平台,并根据学生反馈实时调整教学内容呈现方式。此外,在金融分析、电商比价、舆情监测等高频次网页操作任务中,该工具能有效替代人工重复劳动,实现全天候无人值守的智能巡检。其灵活的脚本执行能力还支持定制化扩展,满足特定行业对网页操作的个性化需求。