简单理解统计学4-因变量、自变量与相关性

来自于Simple Learning Pro的系列

相关性

为了描述两个变量之间的相关关系,我们一般可以采用散点图用于描述。
这两个变量,我们把其中一个称为解释变量,也是自变量;一般放于X轴;另一个称为自变量,一般放于Y轴

描述相关性(r)时有两个要素:
相关性的方向:正相关 or 负相关
相关性的强弱:越接近于1/-1表示相关性越强

相关性

回归方程和R-squared

为了对两个变量之间的相关关系做更好的描述,我们可以引入回归方程;
Y=b0+b1*X;其中b0为截距,b1为相关系数

同时我们引入R-squared(上文中r的平方)来反映回归方程整体的拟合度,表达因变量与所有自变量之间的总体关系。R²等于回归平方和在总平方和中所占的比率,即回归方程所能解释的因变量变异性的百分比。

回归方程

残差

残差:观测值与拟合值的偏离,残差大小可以衡量预测的准确性;

在回归中也要注意异常值点

你可能感兴趣的:(简单理解统计学4-因变量、自变量与相关性)