cnocr
项目核心内容总结:
功能:cnocr 是一个支持多语言(中、英、日、韩、拉丁文、阿拉伯文等)的光学字符识别(OCR)工具,可识别图片中的文字、数字及列格式内容,支持多行文字识别。提供多种预训练模型(如 DenseNet、CRNN、PP-OCR 系列),涵盖免费版与付费专业版(如高精度模型)。
使用方法:
- 安装:通过 pip 安装 cnocr 库。
- 调用:加载预训练模型(如
ch_PP-OCRv5),输入图片进行文字识别。 - 集成:支持与 CnSTD 工具无缝衔接,实现检测与识别流程自动化。
主要特性:
- 支持多种语言及特殊场景(如纯数字、列排文字)。
- 提供多精度模型选择(免费模型与需购买的高精度模型)。
- 基于 PyTorch 架构,支持灵活扩展与自定义训练。
- 优化识别准确率,支持空格识别及复杂排版处理。