Pytesseract madmaze
madmaze pytesseract
¶
Python-tesseract 是一款基于 Google Tesseract-OCR 引擎的 Python 光学字符识别(OCR)工具,用于识别和提取图像中的文本。它支持 Pillow 和 Leptonica 库支持的多种图像格式(如 jpeg、png、gif 等),可处理 PIL 图像、NumPy 数组或文件路径。核心功能包括文本提取、字符边界框与置信度获取、文档方向与脚本检测,以及生成 PDF、HOCR、ALTO XML 等输出格式。支持多语言识别、批量处理、自定义 Tesseract 配置(如 OEM/PSM)、超时控制及 OpenCV 兼容。此外,项目提供命令行接口供独立调用。运行环境需 Python 3.6+、Pillow 库及 Tesseract 引擎。