📜  如何使用 ggplot2 在箱线图中显示平均值?(1)

📅  最后修改于: 2023-12-03 14:51:52.718000             🧑  作者: Mango

如何使用 ggplot2 在箱线图中显示平均值?

箱线图是一种可视化统计数据分布的图表类型,通常用于表示数据的中位数、四分位数、异常值和离群值等信息。但是,箱线图并没有直接显示数据的平均值。如果需要在箱线图中同时显示平均值,可以使用 ggplot2 包中的 geom_point 函数。

下面是一个使用 geom_point 函数在箱线图中显示平均值的示例代码:

library(ggplot2)

# 生成示例数据
set.seed(123)
data <- data.frame(
  group = rep(c("A", "B"), each = 100),
  value = c(rnorm(100), rnorm(100, mean = 1, sd = 0.5))
)

# 绘制箱线图并添加平均值
ggplot(data, aes(x = group, y = value)) +
  geom_boxplot() +
  stat_summary(fun = "mean", geom = "point", shape = 18, size = 3, color = "red")

这段代码首先加载 ggplot2 包,并生成了一个名为 data 的数据框,里面包含了两组数据(用 group 变量标记),每组数据包含100个随机生成的值。然后,调用 ggplot 函数创建一个名为 p 的 ggplot 对象。该对象的 aes 函数指定绘图的坐标系和变量映射关系,其中 x 轴对应 group 变量,y 轴对应 value 变量。接着调用 geom_boxplot 函数生成一个箱线图,并通过 stat_summary 函数使用 mean 参数计算每组数据的平均值,并使用 point 参数将平均值以红色的实心圆点的形式添加到箱线图中。

在此基础上,还可以根据需要调整其他绘图元素的风格,例如添加标题、坐标轴标签、修改颜色、线条样式等等。这些操作都可以通过 ggplot2 包提供的函数实现。