互助问答第10期:异质性与异方差的区别

本期解答人:中关村大街

异质性和异方差都带一个“异”字,英文前缀也相同——异质性是Heterogeneity,异方差是 Heteroskedasticity,但其含义有很大不同。一些朋友易将两者混淆,笔者尝试用比较直观(因此可能不够严谨)的方法进行区分。

一个变量X对另一个变量Y的影响可能因人而异。例如,多上一年学让张三的收入增加了1000元,让李四的收入增加了1200元,那么教育年限对收入的影响就存在异质性。与异质性相对的是同质性。如果多上一年学使所有人的收入都增加1000元,那么教育年限对收入的影响就是同质的。

在变量X的不同水平上,变量Y取值的波动大小可能不同。例如,在所有小学毕业(上过六年学)的人里面,有的做了老板,年入百万,有的成为工薪阶层,年入几万——在六年教育水平上,收入取值的波动很大。在所有大学毕业(上过十六年学)的人里面,大家都能找到不错的工作,收入多的年赚百万,收入低的也有几十万——在十六年的教育水平上,收入取值的波动较小。在这个例子中,收入(Y)的波动大小会随着教育水平(X)的变化而变化,因此Y相对于X有异方差。与异方差相对的是同方差,也即变量Y的取值波动不随自变量X的变化而变化。例如,小学毕业的人的收入水平大都比较低,大学毕业的人的收入水平大都比较高,但是小学毕业的所有人的收入波动大小与大学毕业的所有人的收入波动大小可能差不多。

异(同)质性与异(同)方差之间有怎样的关系呢?如果Y相对于X是同方差,那么X对Y的影响可能是同质的,也可能是异质的。简便起见,我们看一个极端的例子。假如所有上过六年学的人的年收入都是1万元,所有上过七年学的人的年收入都是1.2万元,所有上过八年学的人的年收入都是1.4万元。那么,收入(Y)相对于教育年限(X)是同方差的——不管教育水平是多少,收入在同一教育水平内的波动大小都是0。那么教育年限对收入的影响呢?六年教育水平的人多上一年学,年收入从1万元变成1.2万元,涨了两千元;七年教育水平的人多上一年学,年收入从1.2万元变成1.4万元,也涨了两千元。换句话说,不管是谁,多上一年学带来的收入增长都是两千元——教育年限对收入水平的影响是同质的。但如果稍微改一下例子,令所有上过八年学的人的年收入都是1.6万元,那么收入相对于教育年限仍是同方差的(方差是0),但教育年限对收入的影响则存在异质性了。六年教育水平的人多上一年学,年收入仍然增加两千元;但七年教育水平的人多上一年学,年收入增加四千元(从1.2万元到1.6万元)。换句话说,教育年限对收入的影响在上过六年学和上过七年学的这两类群体中是不同的,存在异质性。

如果Y相对于X有异方差,那么一般来说,X对Y的影响是异质的。再来看一个简化的例子。假如所有上过六年学的人的年收入都是1万元;在上过七年学的人里面,一部分人(比如女性)的收入是1.1万元,另一部分人(比如男性)的收入是1.2万元。那么收入相对于教育年限是异方差的——在六年教育水平上,收入波动是0;但在七年教育水平上,收入存在波动。如果上过六年学的人再上一年学,收入可能涨一千元(对于女性,从1万元到1.1万元),也可能涨两千元(对于男性,从1万元到1.2万元)。因此,教育年限对收入的影响可能因人而异(在上述例子中是因性别而异),存在异质性。

你可能感兴趣的:(互助问答第10期:异质性与异方差的区别)