PageIndex

PageIndex 项目核心内容总结：

项目功能
PageIndex 是一个基于推理的 检索增强生成（RAG）系统，通过构建 树状索引结构，实现对复杂文档（如金融报告）的精准内容提取与问答。无需依赖传统向量数据库或分块处理，显著提升检索准确性。

主要特性

使用方法

运行脚本生成树结构：

python3 run_pageindex.py --pdf_path /path/to/document.pdf

支持 Markdown 文件（需正确层级格式）：

python3 run_pageindex.py --md_path /path/to/document.md

部署选项

案例成果
在金融问答基准测试（FinanceBench）中，基于 PageIndex 的 Mafin 2.5 系统 达到 98.7% 准确率，显著优于传统向量 RAG 方法。

资源
提供教程、案例研究、API 文档及社区支持（Twitter/LinkedIn/Discord）。