PaddleOCR PaddlePaddle

PaddlePaddle PaddleOCR ¶

PaddleOCR 是一款行业领先的 OCR 和文档 AI 引擎，提供从文本提取到智能文档理解的端到端解决方案。核心功能包括：PaddleOCR-VL-1.5 视觉语言模型，支持 111 种语言，实现文本、表格、公式、图表及印章的精准识别与解析；PP-OCRv5 通用场景文本识别模型，支持 109 种语言；PP-StructureV3 复杂文档解析工具，支持将文档转换为保留布局的 Markdown 和 JSON；PP-ChatOCRv4 智能信息提取工具，结合大模型实现文档问答与关键信息抽取；PP-DocTranslation 文档翻译功能。项目支持 CPU、GPU、NPU 等多种硬件加速，提供 CLI、API 及 MCP 服务接口，适用于开发者构建智能文档应用。