📜  在 R 中的单点预测线性模型 (1)

📅  最后修改于: 2023-12-03 15:37:28.153000             🧑  作者: Mango

在 R 中的单点预测线性模型

线性模型(Linear Model)是一类经典的统计模型,在数据分析和建模中得到了广泛的应用和推广。其中,单点预测线性模型(Simple Linear Regression)是线性模型的一种特殊形式,它旨在捕捉两个变量之间的简单线性关系。

1 线性模型的基本概念

在 R 中构建简单的线性模型可以使用函数 lm(),其中:

  • 第一个参数是 ~ 运算符连接的响应变量和解释变量;
  • 第二个参数是数据框对象,包括这些响应变量和解释变量的所有观测值。

例如:

lm(Sales ~ Advertising, data = mydata)

这个例子中,Sales是响应变量,Advertising是解释变量。mydata是包含这两个变量的数据框。

创建一个线性模型之后,可以使用下列函数之一来提取和检验与模型有关的信息:

  • summary():提取有关线性模型参数的信息(如拟合系数和R-squared值)以及有关观测值的信息(如截距项和标准差)等;
  • coef():提取有关拟合系数的信息(摘要信息的一部分);
  • predict():根据给定的线性模型和新的解释变量值返回一个或多个预测响应变量值。

例如,要将 Advertising 值为100的观测值传递给模型以获得 Sales 的预测值,可以使用以下代码:

newdata <- data.frame(Advertising = 100)
predict(model, newdata = newdata)
2 示例:在 R 中构建单点预测线性模型

以下是在 R 中创建单点预测线性模型的示例。假设我们有一个数据集包含了广告费用和销售收入之间的观测值:

# 创建数据框
data <- data.frame(Advertising = c(23, 26, 30, 34, 43, 48, 52, 57, 58, 61),
                   Sales = c(651, 762, 856, 1063, 1190, 1298, 1421, 1440, 1518, 1576))

# 使用 lm() 函数创建单变量线性模型
model <- lm(Sales ~ Advertising, data = data)

# 使用 summary() 函数查看模型摘要
summary(model)

输出:

Call:
lm(formula = Sales ~ Advertising, data = data)

Residuals:
   Min     1Q Median     3Q    Max 
-110.5  -70.8  -19.5   60.6  164.3 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  393.425     61.569    6.39 1.57e-05 ***
Advertising   23.170      2.625    8.84 5.63e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 84.4 on 8 degrees of freedom
Multiple R-squared:  0.9629,	Adjusted R-squared:  0.9576 
F-statistic: 78.3 on 1 and 8 DF,  p-value: 5.629e-06

根据摘要,Sales = 23.170 × Advertising + 393.425。此外,模型的 P 值非常小(即P-value:5.629e-06),这意味着 Advertising 与 Sales 之间的线性关系是显著的。

假设我们现在想要计算 Advertising = 40 时的 Sales 值,可以使用以下代码:

newdata <- data.frame(Advertising = 40)
predict(model, newdata)

输出:

       1 
Real_name 1381.505 

所以,预计当广告费用为40时,销售额约为1381.505。

以上就是在 R 中创建单点预测线性模型的步骤和示例。根据需要,你可以使用完整的数据集或所选的样本来计算简单线性回归。