什么是General Text Recognition OCR – 通用文字识别
极速数据通用文字识别(Jisu General Recognition / OCR)是一款基于云端 API 的 OpenClaw 技能,专为从各类图片中提取文字内容而设计。该工具利用先进的图像识别技术,能够高效解析网络图片、截图或照片中的文本信息,支持包括中文、英文在内的七种主流语言,覆盖日常办公、学习及多语种场景。用户只需通过简单的 JSON 参数配置,即可实现本地图片路径上传或 base64 编码内容的直接识别,极大简化了开发流程。其核心优势在于与极速数据官方服务深度集成,提供稳定可靠的识别能力,并具备良好的错误处理机制,确保在异常情况下仍能给出清晰的反馈。
核心功能特点
- 支持中英文及七种外语的文字识别
- 兼容本地图片路径与 base64 字符串输入方式
- 自动将图片转为 base64 并调用云端 API
- 统一封装返回结果,便于后续文本处理
- 内置常见错误码映射,提升调试效率
适用场景
该工具特别适合需要快速提取图片中结构化或非结构化文本内容的开发者与终端用户。例如,在教育领域,学生可将教材扫描件或课堂笔记拍照上传,系统自动还原为可编辑文本;在客服场景中,用户发送带有订单号或验证码的图片时,可通过此技能迅速获取关键信息并触发后续流程。此外,对于多语言环境的应用,如跨境电商平台或国际化文档管理系统,该技能能有效支持法语、德语等语言的识别需求,降低人工转录成本。由于单次请求限制图片大小约为 500K,因此也适用于移动端轻量化应用,无需复杂本地模型部署即可实现高精度文字提取。
