R语言盒形图(箱形图)

R语言盒形图(箱形图)

盒形图是数据集中数据分布情况的衡量标准。它将数据集分为三个四分位数。盒形图表示数据集中的最小值,最大值,中值,第一四分位数和第四四分位数。 通过为每个数据集绘制箱形图,比较数据集中的数据分布也很有用。

R中的盒形图通过使用boxplot()函数来创建。

语法

在R中创建盒形图的基本语法是 -

boxplot(x, data, notch, varwidth, names, main)

以下是使用的参数的描述 -

  • x - 是向量或公式。
  • data - 是数据帧。
  • notch - 是一个逻辑值,设置为TRUE可以画出一个缺口。
  • varwidth - 是一个逻辑值。设置为true以绘制与样本大小成比例的框的宽度。
  • names - 是将在每个箱形图下打印的组标签。
  • main - 用于给图表标题。

示例

我们使用R环境中已经存在的数据集 - mtcars来创建一个基本的盒形图。下面来看看mtcars数据集中的mpgcyl列。

input <- mtcars[,c('mpg','cyl')]
print(head(input))

当我们执行上面的代码,它产生以下结果 -

                   mpg cyl
Mazda RX4         21.0   6
Mazda RX4 Wag     21.0   6
Datsun 710        22.8   4
Hornet 4 Drive    21.4   6
Hornet Sportabout 18.7   8
Valiant           18.1   6

创建盒形图

以下脚本将为mpg(每加仑英里)和cyl(气缸数)列之间的关系创建一个盒形图。

setwd("F:/worksp/R")
# Give the chart file a name.
png(file = "boxplot.png")

# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars, xlab = "气缸数",
   ylab = "每加仑里程", main = "里程数据")

# Save the file.
dev.off()

当我们执行上述代码时,会产生以下结果 -

盒形图与凹口

我们可以绘制带有凹槽的盒形图,以了解不同数据组的中位数如何相互匹配。以下脚本将为每个数据组创建一个带有凹槽的盒形图形。

setwd("F:/worksp/R")
# Give the chart file a name.
png(file = "boxplot_with_notch.png")

# Plot the chart.
boxplot(mpg ~ cyl, data = mtcars, 
   xlab = "气缸数",
   ylab = "每加仑里程", 
   main = "里程数据",
   notch = TRUE, 
   varwidth = TRUE, 
   col = c("green","yellow","purple"),
   names = c("高","中","低")
)
# Save the file.
dev.off()

当我们执行上述代码时,会产生以下结果 -