Airpoint

通过自然语言控制Mac:打开应用、点击按钮、读取屏幕、输入文本、管理窗口,并通过Airpoint自动化多步骤任务。

安装

概览

什么是Airpoint

Airpoint 是一款专为 macOS 设计的 AI 计算机操作工具,它通过自然语言指令让 AI 代理接管你的 Mac 屏幕,实现自动化交互。用户只需用一句话描述任务,例如“打开 Safari 并搜索‘OpenClaw’”,AI 便会自动识别界面元素、执行点击、输入、滚动等操作,并在完成后返回结果摘要和屏幕截图。整个过程由命令行工具 `airpoint` 驱动,支持同步等待或异步启动任务,最大执行时长可达五分钟。该工具结合了视觉定位与辅助功能树解析技术,既能精准定位 UI 控件,又能理解屏幕内容,从而完成复杂的多步骤工作流。所有操作均在本地设备上运行,确保隐私安全,且无需编写脚本即可实现高度定制化的自动化流程。

核心功能特点

  1. 通过自然语言指令控制 Mac 上的任意应用,如打开软件、点击按钮、输入文本和管理窗口
  2. 结合屏幕截图与辅助功能树进行智能感知,准确识别并操作界面元素
  3. 支持多步骤任务自动化,可自主规划行动路径并验证执行结果
  4. 提供实时屏幕反馈,每次操作后生成详细文字说明及最终状态截图
  5. 内置停止机制,可随时中断卡住或超时的任务以保证系统可控性
  6. 兼容主流 AI 模型(如 OpenAI GPT-5.1、Anthropic Claude 和 Google Gemini),并支持双模型协作提升识别精度

适用场景

Airpoint 特别适合需要频繁重复操作或希望简化日常数字任务的 macOS 用户。对于开发者而言,它可以自动打开终端、运行测试命令、查看日志输出,甚至协助调试环境配置;对于内容创作者,则能一键切换深色模式、整理桌面文件、批量处理图片命名等繁琐事务。远程办公场景中,用户可通过自然语言远程指挥本地设备完成邮件分类、日程安排或会议准备等工作。此外,它也适用于教学演示——教师可以用它展示如何在系统中设置新账户或安装开发工具,而无需手动操作。无论是提升个人效率还是构建个性化自动化助手,Airpoint 都提供了一种直观、灵活且无需编程门槛的解决方案,让用户真正以对话方式操控电脑。