跳转至

PaddleOCR PaddlePaddle

PaddlePaddle PaddleOCR GitHub Repo stars

PaddleOCR 是一款行业领先的 OCR 和文档 AI 引擎,提供从文本提取到智能文档理解的端到端解决方案。核心功能包括:PaddleOCR-VL-1.5 视觉语言模型,支持 111 种语言,实现文本、表格、公式、图表及印章的精准识别与解析;PP-OCRv5 通用场景文本识别模型,支持 109 种语言;PP-StructureV3 复杂文档解析工具,支持将文档转换为保留布局的 Markdown 和 JSON;PP-ChatOCRv4 智能信息提取工具,结合大模型实现文档问答与关键信息抽取;PP-DocTranslation 文档翻译功能。项目支持 CPU、GPU、NPU 等多种硬件加速,提供 CLI、API 及 MCP 服务接口,适用于开发者构建智能文档应用。