经过前面对 matplotlib 模块从底层架构、基本绘制步骤等学习,我们已经学习了折线图、柱状图的绘制方法。
在分析数据的时候,我们会根据数据的特点来选择对应图表来展示,需要表示质量这一概念,需要用直方图。
本期,我们将学习matplotlib 模块绘制直方图相关属性和方法,Let‘s go~
案例展示
本次案例我们来分析公司员工的身高分布情况
案例数据准备,使用numpy随机生成200个升高数据
import numpy as np x_value = np.random.randint(140,180,200) 复制代码
绘制直方图
import matplotlib.pyplot as plt plt.hist(x_value,bins=10) plt.title("data analyze") plt.xlabel("height") plt.ylabel("rate") plt.show() 复制代码
设置长条形颜色关键字:facecolor
设置边框的颜色关键字:edgecolor
颜色选择值
关键字:histtype
取值说明
属性值 | 说明 |
---|---|
'bar' | 柱状形数据并排,默认值 |
'barstacked' | 柱状形数据重叠并排 |
'step' | 柱状形颜色不填充 |
'stepfilled' | 填充的线性 |
我们对第一节直方图添加柱状形不填充,边框颜色为红色
plt.hist(x_value,bins=10,edgecolor="r",histtype="step") 复制代码
边框设置为红色,透明度为0.5
plt.hist(x_value,bins=10,edgecolor="r",histtype="bar",alpha=0.5) 复制代码
在直方图中,我们也可以加一个折线图,辅助我们查看数据变化情况
首先通过pyplot.subplot()创建Axes对象
通过Axes对象调用hist()方法绘制直方图,返回折线图所需要的下x,y数据
然后Axes对象调用plot()绘制折线图
我们对第一节代码进行改造一下
fig,ax = plt.subplots() n,bins_num,pat = ax.hist(x_value,bins=10,alpha=0.75) ax.plot(bins_num[:10],n,marker = 'o',color="yellowgreen",linestyle="--") 复制代码
我们有时候会对吧同样数据范围情况下,对比两组不同对象群体收集的数据差异
准备两组数据:
import numpy as np x_value = np.random.randint(140,180,200) x2_value = np.random.randint(140,180,200) 复制代码
直方图属性data:以列表的形式传入两组数据
设置直方图stacked:为True,允许数据覆盖
plt.hist([x_value,x2_value],bins=10,stacked=True) 复制代码
我们上述绘制的直方图都是等距的,我们可以指定一组数据传入bins属性
bins 关键字:指定直方图的柱状形个数
更改上述的代码后,看看效果吧
bin_num = [140,155,160,170,175,180] plt.hist([x_value,x2_value],bins=bin_num,alpha=0.75,stacked=True) 复制代码
我们在使用直方图查查看数据的频率时,有时候会查看多种类型数据出现的频率。
这时候我们可以以列表的形式传入多种数据给hist()方法的x数据
x_value = [np.random.randint(140,180,i) for i in [100,200,300]] plt.hist(x_value,bins=10,edgecolor="r",histtype="bar",alpha=0.5,label=["A公司","B公司","C公司"]) 复制代码
本期,我们对matplotlib模块中详细学习绘制各种直方图标相关属性和方法。在需要查看数据分布频率时,我们可以使用hist()方法绘制直方图,同时也可以添加折线来辅助查看
以上是本期内容,欢迎大佬们点赞评论,下期见~