箱线图是数据集中数据分布情况的一种度量。 它将数据集划分为三个四分位数。 该图表示数据集中的最小值,最大值,中位数,第一四分位数和第三四分位数。 通过为每个数据集绘制箱形图来比较跨数据集的数据分布也很有用。
Boxplot可以绘制调用Series.box.plot()
和DataFrame.box.plot()
或DataFrame.boxplot()
以可视化每列中值的分布。
例如,这里是一个箱形图,表示对[0,1)上的统一随机变量的10
次观察的五次试验。
import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E']) df.plot.box(grid='True')
执行上面示例代码,得到以下结果 -