实例背景:
线性回归是一种常用的统计模型,用于预测一个或多个自变量与因变量之间的关系。在本例中,我们将使用R语言构建一个简单的线性回归模型,来预测房屋价格。
目标:
- 使用线性回归模型进行数据建模
- 分析模型的拟合效果
步骤 1: 加载数据
我们将使用R内置的mtcars
数据集进行线性回归分析,预测汽车的马力(hp
)与每加仑油能行驶的里程数(mpg
)之间的关系。
# 加载数据集
data(mtcars)
步骤 2: 拟合线性回归模型
使用lm()
函数拟合线性回归模型:
# 构建线性回归模型
model <- lm(hp ~ mpg, data = mtcars)
# 查看模型的摘要信息
summary(model)
summary(model)
将返回模型的详细统计信息,包括回归系数、p值、R-squared等。
步骤 3: 模型诊断
在建模之后,我们需要对模型进行诊断,以评估模型的拟合效果。
- 绘制残差图:
# 绘制残差图
plot(model$residuals)
- 绘制拟合值与残差的关系图:
# 绘制拟合值与残差的关系图
plot(model$fitted.values, model$residuals)
步骤 4: 预测与评估
使用模型进行预测,并计算预测误差。
# 进行预测
predictions <- predict(model)
# 计算均方误差
mse <- mean((predictions - mtcars$hp)^2)
mse
总结
我们通过本例展示了如何在R中构建线性回归模型、诊断模型和评估模型的拟合效果。线性回归是统计建模和机器学习中非常重要的一部分,帮助我们理解变量之间的关系并进行预测。