docling DS4SD
DS4SD docling
¶
Docling 是一款简化文档处理与解析的开源工具,支持 PDF、DOCX、图片、音频等多种格式。它提供高级 PDF 理解能力(如布局、表格、公式识别),支持 OCR 和视觉语言模型,采用统一的文档表示格式,可导出为 Markdown、HTML、JSON 等。项目支持本地执行,提供 CLI 和 Python API,便于与 LangChain 等 AI 框架集成。
Docling 是一款简化文档处理与解析的开源工具,支持 PDF、DOCX、图片、音频等多种格式。它提供高级 PDF 理解能力(如布局、表格、公式识别),支持 OCR 和视觉语言模型,采用统一的文档表示格式,可导出为 Markdown、HTML、JSON 等。项目支持本地执行,提供 CLI 和 Python API,便于与 LangChain 等 AI 框架集成。