分位数回归 | 分位数回归描述

普通线性回归(Ordinary linear regression,OLS)模型关注的是均值,研究的是在某些解释变量在取值固定的条件下响应变量的期望均值,模型估计方法是最小二乘法,使各个样本残差平方和最小。但是线性回归最基本的假设是残差满足正态分布、随机独立、方差齐同,现实中这些条件常常得不到满足。如果样本数据中存在异常值,线性回归模型估计值可能会存在较大偏差。有时候我们不仅希望研究响应变量的期望均值,而且希望能探索响应变量的全局分布(比如响应变量的某个分位数),这时候就需要分位数回归了。分位数回归应用条件相对更为宽松,可以描述响应变量的全局特征,可以挖掘到更为丰富的信息,另外分位数回归估计采用的是加权的最小绝对离差和(weighted lest absolute deviation,WLAD)法进行估计,通常不受离群点的影响,结果更为稳健。对应残差平方和的最小二乘法,最小离差绝对值和也被称为最小一乘法。分位数(百分位数)与分位数回归

一组数据由小到大排列后,q分位数为m则表示该组数据中有100q%的数据小于m。分位数回归就是把线性回归与分位数的概念相结合。抛开不容易理解的数学公式,通俗一些讲,所谓的q分位数回归,就是希望拟合线下面有含100q%的数据点,比如0.25分位数回归线之下包含了25%的数据点。因此系列分位数回归并不是像线性回归那样拟合一条曲线,而是可以拟合一簇曲线。不同分位数的回归系数不同则说明解释变量对不同水平的响应变量影响不同,我们可以借此获得解释变量对响应变量分位数的变化趋势的影响。

你可能感兴趣的:(分位数回归(QR),回归,数据挖掘,人工智能)