📜  r 数据框摘要 (1)

📅  最后修改于: 2023-12-03 15:04:45.931000             🧑  作者: Mango

r 数据框摘要

简介

在R中,数据框是一种常用的数据结构,也是R中用于数据处理和分析的核心。因此,对于数据框的摘要统计和描述是R编程中必不可少的一部分。

常用函数
dim()

dim()函数可以返回数据框的行数和列数,例如:

dim(iris) # 返回 150 5,表示iris数据框有150行和5列
names()

names()函数可以返回数据框每一列的列名,例如:

names(iris) # 返回 "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width" "Species"
str()

str()函数可以返回数据框的基本结构信息,例如每一列的变量类型和前几行数据的样式,例如:

str(iris) # 返回数据框结构信息

输出结果为:

'data.frame':	150 obs. of  5 variables:
 $ Sepal.Length: num  5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
 $ Sepal.Width : num  3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
 $ Petal.Length: num  1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
 $ Petal.Width : num  0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
 $ Species     : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
summary()

summary()函数可以返回每一列的统计摘要信息,例如每一列的最大值、最小值、中位数、平均值等等,例如:

summary(iris) # 返回每一列的统计摘要信息

输出结果为:

  Sepal.Length    Sepal.Width     Petal.Length    Petal.Width          Species  
 Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100   setosa    :50  
 1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300   versicolor:50  
 Median :5.800   Median :3.000   Median :4.350   Median :1.300   virginica :50  
 Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199                  
 3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800                  
 Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500 
head()

head()函数可以返回数据框的前几行,例如:

head(iris) # 返回iris数据框的前6行数据

输出结果为:

  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa
3          4.7         3.2          1.3         0.2  setosa
4          4.6         3.1          1.5         0.2  setosa
5          5.0         3.6          1.4         0.2  setosa
6          5.4         3.9          1.7         0.4  setosa
tail()

tail()函数可以返回数据框的后几行,例如:

tail(iris) # 返回iris数据框的后6行数据

输出结果为:

    Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
145          6.7         3.3          5.7         2.5 virginica
146          6.7         3.0          5.2         2.3 virginica
147          6.3         2.5          5.0         1.9 virginica
148          6.5         3.0          5.2         2.0 virginica
149          6.2         3.4          5.4         2.3 virginica
150          5.9         3.0          5.1         1.8 virginica
结论

以上就是关于R中数据框摘要统计和描述的介绍,包括dim()names()str()summary()head()tail()等常用函数,这些函数可以帮助我们更好地理解数据框的结构和数据特征,从而更好地进行数据处理和分析。