Pandas profiling pandas profiling
pandas-profiling pandas-profiling
¶
ydata-profiling 是一个用于快速探索性数据分析(EDA)的 Python 库,旨在通过单行代码提供一致且高效的数据分析体验。它支持对 Pandas DataFrame 或 Spark 数据进行深度分析,自动生成包含统计信息、可视化图表和数据质量警报的详细报告。核心功能包括数据类型自动推断、单变量与多变量统计分析、缺失值与重复值检测、时间序列与文本分析、文件图像分析以及数据集对比。报告支持导出为 HTML 或 JSON 格式,也可嵌入 Jupyter Notebook 展示,具备 Spark 扩展能力以处理大规模数据,并支持集成于多种开发环境和自动化工作流中。