稳健回归-鲁棒回归

稳健回归

稳健回归(robust regression)是统计学稳健估计中的一种方法,其主要思路是将对异常值十分敏感的经典最小二乘回归中的目标函数进行修改。经典最小二乘回归以使误差平方和达到最小为其目标函数。

稳健回归(robust regression)是将稳健估计方法用于回归模型,以拟合大部分数据存在的结构,同时可识别出潜在可能的离群点、强影响点或与模型假设相偏离的结构。当误差服从正态分布时,其估计几乎和最小二乘估计一样好,而最小二乘估计条件不满足时,其结果优于最小二乘估计。
应用稳健统计(Robust Statistics)的例子是, 在一些主观性的评价比赛打分中, 比如歌唱比赛,艺术体操比赛, 去掉一个最高分, 去掉一个最低分, 剩下的评分再取平均值为选手的得分, 这样就非常有效地防止了某些评委故意打出一个特别高的分或者特别低的分来影响选手的最终得分,这样的评分统计规则就是稳健的。

稳健统计:一个统计方法在实际应用中要有良好的表现,需要两个条件:

  • 一是该方法所依据的条件与实际问题中的条件相符;
  • 二是样本确是随机的,不包含过失误差,如记录错误等。但实际应用中这些条件很难严格满足,比方说,原来在提出该方法时是依据总体分布为正态分布的假定,但实际问题中总体的分布与正态略有偏离;或在大量的观测数据中存在受到过失误差影响的“异常数据”等。如果在这种情况下,所用统计方法的性能仅受到少许影响,就称它具有稳健性。

你可能感兴趣的:(回归,机器学习,人工智能)