第三章 转向高维数据2

3.4 两变量线性模型

识别衡量散点图向下或向上倾斜程度(斜率)
表示X与Y之间的线性关系:
在这里插入图片描述

a截距;b斜率;c误差
利用方法找到a,b是的误差最小,即:
在这里插入图片描述

例:判断销售量与价格的线性回归的拟合优度
总变化量:在这里插入图片描述

被解释变量:在这里插入图片描述

未被解释变量:在这里插入图片描述

总变化量=被解释变量+未被解释变量:在这里插入图片描述

决定系数:在这里插入图片描述
决定系数等于1,高度拟合;等于0,完全无关

3.5 简单方差分析

退化形式的模型来自相等均值的假设:在这里插入图片描述
完全形式的模型来自不同均值的假设:在这里插入图片描述
F检验基于退化模型和完全模型的平方和的比较,自由度为观察值数量减去参数的数量,因此F统计量为:
在这里插入图片描述
当F统计量大于分布95%的分位点数时,拒绝零假设。
注:简单线性回归模型F统计量等于t检验统计量的平方。

3.6多元线性模型

构建Y与多维变量X的线性关系,最小二乘法估计量:在这里插入图片描述

你可能感兴趣的:(应用多元统计分析)