跳转至

pdf2htmlEX pdf2htmlEX

pdf2htmlEX pdf2htmlEX GitHub Repo stars

pdf2htmlEX 是一款利用现代 Web 技术将 PDF 文件渲染为 HTML 的工具。它保留原生 HTML 文本的精确字体与位置,支持链接与书签、灵活输出模式,并提供打印及 SVG 背景支持。工具修复了大量 Bug,整合最新 Cairo 代码,优化了遮挡文本识别与 DPI 设置,适用于学术论文、杂志等复杂排版及多语言文档转换,输出体积适中。