怎么求中位数和分位数 概率密度函数_张晓峒分位数回归讲义解析.doc

第15章 分位数回归模型

15.1 总体分位数位数

15.位数的估计

.3 分位数回归

.4 分位数回归模型的估计

.5 分位数回归模型的

15.6 分位数的计算分位数回归的

15.7 分位数回归的

以往回归模型是研究被解释变量的条件期望。人们解释变量被解释变量分布的。就是分位数回归,它最早由Koenker和Bassett(1978)提出,是估计一回归变量X与被解释变量Y的分位数之间线性关系的建模方法。正如普通最小二乘OLS回归估计量的计算是基于残差平方一样,分位数回归估计量的计算是基于一种非对称形式的绝对值残差,,中位数回归运用的是最小绝对值离差估计(LADleast absolute deviations estimator)。它和OLS主要区别在于数估计方法和渐近分布的估计在残差检验、数检验、模型设定、预测等方面基本相同。

分位数回归的优点是,能够更加全面的描述被解释变量条件分布的全貌,而不是仅仅分析被解释变量条件期望均值,可以分析解释变量如何影响被解释变量的中位数、分位数等。不同分位数下的数估计量不同,即解释变量对不同水平被解释变量的影响不同。另外,中位数回归与最小二乘法相比,对离群值表现的更加稳健且,分位数回归并不要求很强的假设条件,因此对于分布分位数回归数估计更加稳健。15.1 总体分位数位数

分位数位数对一个连续随机变量y,其总体τ分位数是τ)的义是:y小于等于τ)的概率是τ即

τ = P( y ≤ y(τ)) = F(y(τ))

其中PF(y(τ)) 表示y的累积分布函数(cdf)。比如0.25) = 3,意味着y ≤ 3的概率是0.5。且有

τ) = F-1(y(τ))

即F(y(τ))的反函数是y(τ)。当τ=0.5时τ) 是y的中位数τ= 0.75时τ) 是y的第3/4分位数,τ= 0.25时τ) 是y的第1/4分位数。正态分布,0.5) = 0,0.95) =1.645,0.975) =1.960。

另外,如果随机变量的分布是对称的,那么均值与中位数是相同的。当中位数小于均值,分布是右偏的反之分布是左偏的。

对于回归模型,被解释变量yt对X为条件的τ分位数用函数τ)t(X表示,其含义是:以X为条件的yt小于等于τ)t(X的概率是τ这里的概率是用yt对X的条件分布计算的。且有

τ)t(X = F-1(y(τ)t(X)

其中F(τ)t(X) 是yt给定X的累积概率分布函数(cdf)。则τ)t(X称作被解释变量yt对X的条件分位数函数。而F '(τ)t(X)= f (y(τ)t(X)则称作分位数概率密度函数。其中F'(τ)t(X)表示F(y(τ)t(X)对y(τ)t(X求导。

15.2 总体中位数的估计

y表示,其概率密度函数用f(y)表示,累计概率密度函数用F(y)表示,y的中位数用y(0.5)表示,则y与任一值(的离差绝对值的期望以( = y(0.5) 时为最小。

证明:

=

= (15.1)

根据莱布尼兹公式,若,则有。令,则有。运用于式(15.1),得

==

=

式(15.1)求极小的一阶条件是= 0,即=0,。这意味着(等于中位数y0.5)。

( = y(0.5)

与定理15.1等价的表述是以( = y(0.5)(中位数)时为最小。因此,中位数回归yt = X (( + ut,通过求最小,估计(的中位数回归,从而得到yt的中位数回归。

15.3 分位数回归

Koenker和Bassett(1978)表示yt的分位数回归yt 对任意值(的加权离差绝对值和只有在( =时取得最小值。其中

= (15.2)

(((0, 1)。据此,分位数回归yt = X (( + ut, 求第(分位数回归的方法是求下式(目标函数)最小,

(15.3)

其中表示第(分位数回归位数回归=

其中X,(都是k(1阶列向量。称作分位数回归

=称作中位数回归称作中位数回归数位数回归位数回归。

-

对一个样本,估计的分位数回归yt条件分布的理解就越充分。以一元回归为例,如果用LAD法估计的中位数回归回归yt的分布是非对称的。如果散点图上侧分位数回归直线之间与下侧分位数回归直线之间相比,相互比较接近,则说明被解释变量yt的分布是左偏倚的。反之是右偏倚的。对于不同分位数回归函数如果回归系数的差异很大,说明在不同分位数上解释变量对被解释变量

你可能感兴趣的:(怎么求中位数和分位数,概率密度函数)