📜  统计-残差平方和(1)

📅  最后修改于: 2023-12-03 15:41:18.332000             🧑  作者: Mango

统计-残差平方和

统计学中,残差平方和(residual sum of squares,RSS)是一种衡量线性回归模型拟合程度的指标。它表示模型中预测值(y_hat)与实际值(y)之间的差距,计算方式为将每个观察点的残差(y_hat - y)平方后求和。残差平方和越小,说明模型拟合程度越好。

公式

残差平方和的计算公式如下:

$RSS = \sum_{i=1}^n (y_i - \hat{y}_i)^2$

其中,$y_i$ 表示第 i 个观察点的实际值,$\hat{y}_i$ 表示第 i 个观察点的预测值,n 表示总样本量。

代码示例

可以使用 Python 中的 NumPy 库来计算残差平方和。下面是一个示例代码片段:

import numpy as np

# 构造数据
x = np.array([1, 2, 3, 4, 5])
y = np.array([2, 4, 6, 8, 10])

# 拟合线性回归模型
coef = np.polyfit(x, y, 1)
y_hat = np.polyval(coef, x)

# 计算残差平方和
rss = np.sum((y - y_hat) ** 2)

print("残差平方和为:", rss)

代码中首先构造了一组数据,然后使用 np.polyfit 函数拟合了一条线性回归模型。使用 np.polyval 计算模型中每个观察点的预测值。最后计算残差平方和,输出结果。

总结

残差平方和是线性回归模型拟合程度的一个指标,可以用于评估模型的好坏。在实际应用中,需要根据具体情况选择并结合其他评价指标来综合评估模型性能。