📜  在 R 中的线性回归中指定参考因子水平

📅  最后修改于: 2022-05-13 01:55:06.687000             🧑  作者: Mango

在 R 中的线性回归中指定参考因子水平

在本文中,我们将讨论如何在 R 编程语言中的线性回归中指定参考因子级别。

在 R 语言的基本线性回归模型中,默认情况下,参考类别 1 用于因子变量。但有时我们需要在线性回归模型中手动设置参考因子水平。为此,我们使用 R 语言的 relevel()函数。 relevel()函数用于对因子向量的级别进行重新排序。对因子向量的级别进行重新排序,以便用户指定的级别在前,其他级别向下移动。

具有默认参考因子水平的线性回归模型

为了创建一个基本的线性回归模型,我们使用 R 语言的 lm()函数。 lm()函数用于将线性模型拟合到 R 语言中的数据框。它可用于对未知数据的预测进行线性回归。 lm()函数将数据框和拟合函数作为参数,并返回经过训练的线性回归模型。

例子:

这是具有默认参考因子水平的基本线性回归模型。

R
# create sample data frame
x <- sample(1:7, 500, replace = TRUE)
y <- round(x + rnorm(500), 3)
x <- as.factor(x)
sample_data <- data.frame(x, y)
 
# create linear model
linear_model <- lm( y~x, sample_data)
 
# print summary of linear model
summary(linear_model)


R
# create sample data frame
x <- sample(1:7, 500, replace = TRUE)
y <- round(x + rnorm(500), 3)
x <- as.factor(x)
sample_data <- data.frame(x, y)
 
# refactor reference level
sample_data$x <- relevel(sample_data$x, ref = 4)
 
# create linear model
linear_model <- lm( y~x, sample_data)
 
# print summary of linear model
summary(linear_model)


输出:

此处,默认情况下,因子参考水平为 x1。

具有手动参考因子水平的线性回归模型

要在 R 语言中指定手动参考因子水平,我们将使用 relevel()函数。 relevel()函数用于对因子向量进行重新排序,以便用户指定的级别在前,其他级别下移。 relevel()函数将因子向量和参考水平作为参数,并返回根据用户设置的参考水平重新排序的因子向量。

例子:

这是一个基本的线性回归模型,因子参考水平设置为 4。

R

# create sample data frame
x <- sample(1:7, 500, replace = TRUE)
y <- round(x + rnorm(500), 3)
x <- as.factor(x)
sample_data <- data.frame(x, y)
 
# refactor reference level
sample_data$x <- relevel(sample_data$x, ref = 4)
 
# create linear model
linear_model <- lm( y~x, sample_data)
 
# print summary of linear model
summary(linear_model)

输出: