📌  相关文章
📜  如何在R中的数据框中找到缺失值的百分比?(1)

📅  最后修改于: 2023-12-03 15:24:36.207000             🧑  作者: Mango

如何在R中的数据框中找到缺失值的百分比?

在数据分析中,缺失值是常见的问题之一。在R中,我们可以使用is.na()函数来检测缺失值。本文将介绍如何在R中的数据框中找到缺失值的百分比。

范例数据

我们将使用以下数据框来演示:

df <- data.frame(
  A = c(NA, 2, 3, 4, 5),
  B = c("a", "b", NA, "d", "e"),
  C = c(1.3, NA, 3.7, NA, 5.2)
)

该数据框包含3列和5行数据,包括缺失值。

找到缺失值的百分比

我们可以使用以下代码来找到数据框中每一列中的缺失值的百分比:

sapply(df, function(x) sum(is.na(x))/length(x))

输出:

      A       B       C 
 0.2000  0.2000  0.4000 

以上代码内部使用sapply()函数对每一列应用一个函数,该函数可以计算每一列中缺失值的百分比。此函数使用is.na()函数检查每个元素是否为缺失值,使用sum()函数计算缺失值的数量,并使用length()函数获取列中元素的总数。最终,我们将每个列的缺失值百分比输出。

结论

现在,您已经知道如何在R中的数据框中找到缺失值的百分比。我们建议在每个数据框上面使用此代码,以了解数据质量的情况并确定是否需要进行数据清洗。