ebook-to-md

Convert PDF/PNG/JPEG/MOBI/EPUB to Markdown. Uses Baidu OCR only. Use when 扫描PDF转Markdown、pdf ocr、图像识别、电子书转Markdown、ebook to markdown.

安装

概览

ebook-to-md 是一款专为开发者和技术爱好者设计的文档转换工具,能够将扫描版 PDF、图片(PNG/JPEG)以及电子书格式(MOBI/EPUB)高效转换为结构清晰的 Markdown 文件。该工具基于百度 OCR 技术实现高精度文字识别,特别适合处理无法直接提取文本的图像型 PDF 或手写笔记截图。通过自动化排版优化,它能智能识别标题层级、对话段落和章节结构,大幅提升内容后续编辑与发布的效率。

由于仅支持百度 OCR 作为后端识别引擎,用户需提前配置 API 密钥以启用服务。对于 MOBI 和 EPUB 等电子书格式,工具依赖 Calibre 进行预处理,将其转为标准 PDF 后再执行 OCR 流程。整个转换过程无需人工干预,输出结果可直接用于博客撰写、知识库搭建或学术论文整理,是数字阅读向结构化写作过渡的理想桥梁。

尽管功能聚焦于 OCR 驱动的内容提取,ebook-to-md 在保持轻量化的同时提供了灵活的参数控制,例如是否内联嵌入图片、自定义输出路径等。其简洁的命令行接口和 Python 模块调用方式,使其既适合批量脚本处理,也能集成进自动化工作流中,满足个人用户与企业级场景的不同需求。

核心功能特点

  1. 支持扫描版 PDF、PNG/JPEG 图片及 MOBI/EPUB 电子书格式输入
  2. 采用百度 OCR 实现高精度文字识别与内容提取
  3. 自动识别标题层级并生成 Markdown 分段结构
  4. 可选是否将图片以 base64 形式内联到 Markdown 文件中
  5. 依赖 Calibre 处理 MOBI/EPUB 格式(需预先安装)
  6. 提供命令行与 Python API 两种调用方式

适用场景

ebook-to-md 最适用于需要将纸质书籍、扫描文档或电子出版物快速转化为可编辑数字内容的场景。例如,研究人员可将古籍扫描件或期刊论文 PDF 转为 Markdown 后上传至 GitBook 或 Notion 构建个人知识库;自媒体创作者能轻松将教程手册、产品说明书的图片版转为结构化文本,便于二次加工发布;学生群体则可利用它把课堂讲义或考试资料中的图表文字提取出来,配合 Typora 等编辑器进行复习整理。

在企业内部,该工具可用于自动化归档客户合同、培训材料或会议纪要等非结构化文档,统一输出为 Markdown 格式以适配 Confluence 或 Obsidian 等协作平台。此外,对于需要长期维护技术文档的团队,将外部 PDF 指南转为 Markdown 后纳入版本控制系统(如 GitHub),有助于实现内容的可追溯性与多人协同编辑。

需要注意的是,由于当前仅支持百度 OCR,对中文识别效果较好,若涉及多语言混合内容或复杂排版(如数学公式、表格),建议结合其他专业工具使用。总体而言,ebook-to-md 在‘扫描文档数字化’与‘电子书内容再利用’两大方向上表现突出,是提升信息流转效率的实用利器。