📜  使用 ggplot2 在 R 中绘制箱线图(1)

📅  最后修改于: 2023-12-03 14:49:39.978000             🧑  作者: Mango

使用 ggplot2 在 R 中绘制箱线图

什么是箱线图?

箱线图,也称箱形图或盒式图,是一种用于呈现数据分布情况的统计图表。它能够直观地展示数据的中位数、25分位数、75分位数、最小值和最大值,并通过箱子的长度和高达呈现数据的离散程度。

ggplot2 库简介

ggplot2 是基于图形语法的 R 语言数据可视化工具,它的核心理念是将数据分层实现可视化表现,极大简化了数据可视化的编写工作量,提供了大量数据分析的组件,同时支持以图层的方式、分层的方式等多种可视化方案。

ggplot2 中的 aes 函数

aes 函数用于映射数据到图形属性,例如轴、颜色、形状等等。使用 aes 函数可以将图形属性的属性值设置为变量名,这里的变量名即数据帧中的变量名。以下示例代码演示了在 aes 函数中使用变量名。

ggplot(data = dataset, aes(x = variable1, y = variable2))
绘制箱线图

以下代码片段演示了如何在 ggplot2 中绘制一幅基本的箱线图。

library(ggplot2)

# 加载示例数据
data("mpg", package = "ggplot2")

# 绘制箱线图
ggplot(mpg, aes(x = class, y = hwy)) + geom_boxplot()

在这个例子中,我们使用 ggplot 函数生成一个空图形,然后使用 aes 函数将 mpg 数据帧中的 class 和 hwy 变量映射到 x 和 y 轴。最后,我们使用 geom_boxplot 函数绘制箱线图。

箱线图的参数说明

在 ggplot2 库中,我们可以使用 geom_boxplot 函数的参数调整箱线图的绘制方式。下面是一些常用的参数和说明。

  • notch:是否绘制缺口箱线图
  • notchwidth:缺口的宽度
  • fatten:箱体宽度和间距的比例因子
  • outlier.color:光晕点的颜色
  • outlier.shape:光晕点的形状
  • outlier.size:光晕点的大小

以下是一个调整参数的例子代码。

ggplot(mpg, aes(x = class, y = hwy)) + 
  geom_boxplot(notch = TRUE, notchwidth = 0.5, fatten = 1,
               outlier.color = "red", outlier.shape = 16, outlier.size = 2)
结语

使用 ggplot2 可以轻松地绘制箱线图,它提供了丰富的参数和属性,使得我们能够灵活地调整绘制效果,实现更好的数据可视化效果。