Python箱形图

Python箱形图

箱线图是数据集中数据分布情况的一种度量。 它将数据集划分为三个四分位数。 该图表示数据集中的最小值,最大值,中位数,第一四分位数和第三四分位数。 通过为每个数据集绘制箱形图来比较跨数据集的数据分布也很有用。

绘制箱线图

Boxplot可以绘制调用Series.box.plot()DataFrame.box.plot()DataFrame.boxplot()以可视化每列中值的分布。

例如,这里是一个箱形图,表示对[0,1)上的统一随机变量的10次观察的五次试验。

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box(grid='True')

执行上面示例代码,得到以下结果 -