R语言实战 OLS回归

第八章回归

OLS回归

这里演示的大部分内容中,都是利用OLS法通过一系列的预测变量来预测响应变量。

OLS回归的大概介绍:

OLS回归拟合模型的形式:

在这里插入图片描述
n是观测的数目
k是也测变量的数目

在这里插入图片描述
第i次观测对应的因变量的预测值(具体来讲,它是在已知预测变量值的条件下,对Y分布估计的均值)


第i次观测对应的第j个预测变量值

在这里插入图片描述
截距项(当所有的预测变量都为0时,Y的预测值)

在这里插入图片描述
预测变量j的回归系数(斜率表示X j 改变一个单位所引起的Y的改变量)

我们的目标是通过减少响应变量的真实值与预测值的差值来获得模型参数,具体而言就是让残差平方和最小。

为了能够恰当地解释OLS模型的系数,数据必须满足以下统计假设。
正态性: 对于固定的自变量值,因变量值成正态分布。
独立性: Y i 值之间相互独立。
线性: 因变量与自变量之间为线性相关。
同方差性: 因变量的方差不随自变量的水平不同而变化。也可称作不变方差,但是说同方差性感觉上更犀利。

用 lm() 拟合回归模型

myfit <- lm(formula, data)

formula:要拟合的模型形式Y ~ X1 + X2 + X3 + … +Xk
data:用于拟合模型的数据

简单线性回归:回归模型包含一个因变量和一个自变量
多项式回归:只有一个预测变量,但同时包含变量的幂(比如,X、X2 、X3 )
多元线性回归:当有不止一个预测变量时

你可能感兴趣的:(R语言实战)