📜  如何在 R 中计算回归线 (1)

📅  最后修改于: 2023-12-03 15:24:21.368000             🧑  作者: Mango

如何在 R 中计算回归线

回归分析是统计学中常用的一种方法,它可以用来探究一个或多个自变量与一个因变量之间的关系。在回归分析中,我们通常会涉及到计算回归线的问题。在 R 中,我们可以通过以下步骤计算回归线:

1. 准备数据

在计算回归线之前,我们需要准备一个数据集,其中含有一个因变量和一个或多个自变量。这里我们以 iris 数据集为例,代码如下:

data(iris)
x <- iris$Sepal.Length
y <- iris$Petal.Length
2. 拟合模型

接下来,我们需要拟合一个线性模型来计算回归线。在 R 中,我们可以使用 lm() 函数来拟合线性模型,代码如下:

fit <- lm(y ~ x)

这里,“y ~ x” 表示我们要拟合一个 y 关于 x 的线性模型。

3. 计算回归线

一旦拟合线性模型,我们就可以使用 coef() 函数来计算回归线的截距和斜率了。代码如下:

intercept <- coef(fit)[1]
slope <- coef(fit)[2]

这里 coef(fit)[1] 表示线性模型的截距,coef(fit)[2] 表示线性模型的斜率。

4. 绘制回归线

最后,我们可以使用 ggplot2 包来绘制回归线。代码如下:

library(ggplot2)
df <- data.frame(x, y)
ggplot(df, aes(x, y)) + 
  geom_point() + 
  geom_abline(intercept = intercept, slope = slope, color = "red")

这里,geom_point() 函数用于绘制散点图,geom_abline() 函数用于绘制回归线。

完整代码如下:

data(iris)
x <- iris$Sepal.Length
y <- iris$Petal.Length

fit <- lm(y ~ x)
intercept <- coef(fit)[1]
slope <- coef(fit)[2]

df <- data.frame(x, y)
ggplot(df, aes(x, y)) + 
  geom_point() + 
  geom_abline(intercept = intercept, slope = slope, color = "red")

运行代码后,就可以得到如下所示的散点图和回归线:

回归线图

至此,我们就完成了在 R 中计算回归线的全部过程。