什么是feishu-doc-extended
飞书文档扩展工具(feishu-doc-extended)是一款专为飞书文档设计的增强型插件,旨在提升用户在处理文档内容时的效率与便利性。该工具通过集成图片下载和光学字符识别(OCR)两大核心功能,帮助用户快速提取文档中的图像资源并自动识别其中的文字信息。它基于 OpenClaw 平台开发,需配合其内置的 feishu 插件使用,适用于需要频繁处理图文混合内容的办公场景。用户无需手动截图或复制粘贴,即可一键获取飞书中嵌入的图片链接,并通过本地 OCR 技术实现高精度中文文本提取。整个操作流程高度自动化,显著减少了重复性工作负担,尤其适合知识管理、内容归档和信息检索等需求密集的环境。
核心功能特点
- 支持从飞书文档中批量获取图片的临时下载 URL,避免手动保存
- 集成 tesseract OCR 引擎,可对图片进行中文文字识别(需安装中文语言包)
- 通过 API 调用方式获取图片 token 和访问权限,保障数据安全性
- 兼容 OpenClaw 框架,可直接在 feishu 插件体系内运行
- 提供命令行级控制接口,便于脚本化集成与自动化处理
适用场景
该工具特别适合那些在日常工作中大量依赖飞书文档进行协作与内容管理的用户群体。例如,研究人员在整理会议纪要时,常会遇到文档中包含大量图表、手写笔记或截图的情况。以往必须逐张截图再用 OCR 软件识别,过程繁琐且易出错。而借助 feishu-doc-extended,只需两步操作:先调用 list_blocks 获取所有图片 token,再通过 get_image 获得可访问链接,最后结合 tesseract 完成 OCR 提取,整个过程可在数分钟内完成原本耗时半小时的任务。此外,对于运营人员而言,当需要从客户反馈文档中抓取关键信息(如合同条款、用户签名等),此工具也能大幅缩短人工筛查时间。企业知识库管理员同样受益——他们可以定期扫描内部文档中的图像资产,自动生成结构化文本索引,提升检索效率。需要注意的是,由于飞书返回的是临时 URL,建议在获取后尽快使用;同时 OCR 效果受图片分辨率影响较大,清晰度高、对比度强的图像识别准确率更高。
