📜  如何在 R 中创建汇总表?(1)

📅  最后修改于: 2023-12-03 15:24:20.769000             🧑  作者: Mango

如何在 R 中创建汇总表?

在 R 中通过使用 dplyr 包和 tidyr 包中的函数能够轻松地创建汇总表。下面介绍如何使用这两个包中的函数创建汇总表。

准备工作

在开始创建汇总表之前,需要安装并加载 dplyr 包和 tidyr 包。

install.packages("dplyr")
install.packages("tidyr")

library(dplyr)
library(tidyr)
数据集

首先,创建一个示例数据集用于演示如何创建汇总表。 下面的数据集包含了不同城市和日期下的销售额。

df <- data.frame(
  city = c("New York", "New York", "Boston", "Boston", "Chicago", "Chicago"),
  date = c("2021-01-01", "2021-01-02", "2021-01-01", "2021-01-02", "2021-01-01", "2021-01-02"),
  sales = c(100, 200, 150, 300, 120, 180)
)
汇总表
1. 按城市汇总

使用 group_by() 函数按照城市对数据集进行分组统计。

df_summary_city <- df %>% 
  group_by(city) %>%    
  summarize(total_sales = sum(sales))

结果会按照不同城市的总销售额创建一张新表 df_summary_city,其中列名为 citytotal_sales

2. 按日期汇总

同样可以按照日期对数据集进行分组统计。

df_summary_date <- df %>% 
  group_by(date) %>%    
  summarize(total_sales = sum(sales))

结果会按照不同日期的总销售额创建一张新表 df_summary_date,其中列名为 datetotal_sales

3. 组合汇总表

dplyr 包中可以使用 merge() 函数对已经创建好的汇总表进行组合,以创建一个更全面的汇总表。

df_summary_all <- merge(df_summary_city, df_summary_date, all = TRUE)

结果会将 df_summary_citydf_summary_date 两个表按照城市和日期进行拼接,并包含 total_sales 列。

结论

通过使用 dplyr 包和 tidyr 包中的函数能够轻松地创建汇总表,在数据分析过程中能够为人们提供更好的数据洞察力。