Apps2025 年 4 月 7 日 12:00

OCRmyPDF: 为扫描 PDF 添加 OCR 文本层

OCRmyPDF 是一个开源的命令行工具和库，它可以为扫描的 PDF 文件添加 OCR 文本层，使文件内容可被搜索和复制粘贴。

OCRmyPDF 是一个开源的命令行工具和库，它可以为扫描的 PDF 文件添加 OCR 文本层，使文件内容可被搜索和复制粘贴。该工具利用 Tesseract OCR 引擎识别 PDF 中图像里的文本，并将其准确地放置在原始图像下方，使得用户可以轻松地搜索和选择文档中的内容。

OCRmyPDF 的工作原理是分析 PDF 的每一页，确定所需的色彩空间和分辨率，然后使用 Ghostscript 将每页栅格化，接着通过 Tesseract 进行 OCR 处理，并将生成的 OCR 层集成回原始 PDF。与直接使用 ImageMagick 或 Ghostscript 处理图像然后通过 Tesseract OCR 不同，OCRmyPDF 能够生成变化最小的 PDF 输出，同时保留原始图像的精确分辨率。