误差与残差

###误差(Errors)
观测值与真实值的偏差。

这种真实值(true value)往往是不可观测的,比如用仪器去测量一个物体的长度,无论是采用简单的直尺,还是采用高精度的游标卡尺,亦或是螺旋测微器,都无法观测到直尺的真实长度。观测值只能无限靠近真实值,却无法等同于真实值,靠近真实值的远近,即是观测误差的大小。观测值靠真实值近,则称观测误差小,否则称观测误差大。再比如,统计全球人口数也是一次对全球真实人口数的观测,地球上每时每刻都有生命在降生,同时也有生命的消逝,人类永远无法观测到全球人口的真实值,而只能通过优化统计方法来降低统计的误差。
###残差(Residuals)
估计值与观测值的偏差。

这个观测值既可以是通过某种工具测量得到的,也可以是通过某种统计学方法获得的,而估计值一般是通过某种数据模型方法得到的。比如利用分层抽样的方法,从中国的1到5线城市中分别随机抽取1000个个人收入样本,收集了被调研者的收入及其基本信息。并在此基础构建了一个年龄、学历、性别、工作年限、城市发展水平的多因素模型,考察每个因素与收入之间的关系。模型建好了之后,输入观测样本的各种基本信息,便可得到模型为其计算出的收入估计值,这个估计值与观测值之间的偏差就叫做残差。
回归误差(Regression errors)/回归残差(Regression residuals)
在残差的概念解释中提到了模型,如果用来估计整体值的模型是回归模型,那么其得到的估计值与样本观测值之间的偏差就叫做回归误差或者回归残差。

###方差(Variance)

每个观测值与这组观测值的算数平均值之差的平方和。

###标准差(Standard deviation)

方差取平方根。

再看看我们以前的文章
Excel中数据分析工具库-相关系数篇
干货,手把手教会你做相关性分析
5年数据分析路,小结。
用户细分及画像分析
K-近邻算法及实践

欢迎关注,微信公众号“数据分析师之家
扫描二维码 关注我们
提供职业规划、简历指导、面试辅导服务哦
QQ交流群:254674155
误差与残差_第1张图片

数据分析之家联合JEE RAY品牌为粉丝派发福利

误差与残差_第2张图片
添加粉丝福利派发官,领取粉丝福利哦

你可能感兴趣的:(统计学,回归,人工智能)