Gemini Browser

通过 OpenClaw Browser Relay 自动化浏览器查询 Google Gemini 并获取 AI 回复。需要 OpenClaw...

安装

概览

什么是Gemini Browser

Gemini Browser 是一款专为自动化操作 Google Gemini AI 而设计的技能工具,通过 OpenClaw Browser Relay 实现与真实 Chrome 浏览器的深度集成。该工具利用 Chrome DevTools Protocol(CDP)直接控制已登录 Google 账号的浏览器会话,自动向 Gemini 发起查询请求并提取 AI 生成的回复内容。由于 Gemini 使用富文本编辑器而非标准输入框,Gemini Browser 提供了 JavaScript 注入机制来模拟用户输入行为,确保查询能够被正确提交和处理。整个操作流程高度依赖人工初始化步骤,包括手动激活浏览器扩展和确认会话状态,从而在提供强大自动化能力的同时保持对敏感会话的控制权。该工具特别适合需要批量调用 Gemini、集成 AI 问答流程或开发辅助决策系统的开发者和技术爱好者。

核心功能特点

  1. 基于 OpenClaw Browser Relay 实现 Chrome 浏览器自动化控制
  2. 支持通过 CDP 协议访问真实登录状态的 Google 会话
  3. 利用 JavaScript 注入方式向 Gemini 富文本编辑器输入查询内容
  4. 可自动检测响应完成状态并提取 AI 生成结果
  5. 提供两种响应获取方式:剪贴板复制(推荐)和 DOM 文本抓取
  6. 内置安全机制要求用户手动附加扩展,防止未经授权访问

适用场景

Gemini Browser 最适用于那些需要将 Google Gemini 的 AI 能力嵌入到自动化工作流中的场景。例如,研究人员可以定期使用它从 Gemini 获取特定领域的知识解答,用于文献综述或实验设计;教育从业者能将其整合进智能辅导系统,为学生提供即时学习反馈;企业开发者则可构建内部问答机器人,利用 Gemini 处理客户服务或技术支持类问题。此外,数据分析师常面临复杂问题拆解需求,该工具可帮助快速获得专业建议以优化分析模型。由于其依赖真实浏览器环境,也适合测试基于 Gemini API 的前端应用原型,或在无法直接使用官方 API 时作为替代方案。需要注意的是,所有涉及敏感信息的操作建议在隔离的 Chrome 配置文件中运行,以降低账户安全风险。