multinomial logit model 多项 Logit 模型

(Discrete Choices) 

丹尼尔·麦克法登(Daniel L McFadden)

在“类别选择”(Discrete Choices) 问题上,丹尼尔·麦克法登(Daniel L McFadden)发展出一套完整的理论和实证方法。在一九七零年代以前, 经济理论和计量经济学的分析都局限于数值连续的经济变数 (像消费、所得、价格等) ,类别选择的问题虽然是无所不在,传统上却没有一个严谨的分析架构,麦克法登填补了这个空隙,他对类别选择问题的研究在很短的时间内就发展成为一个新兴领域。

麦克法登对类别选择问题的分析可简单介绍如下: 在类别选择问题中,不论要选的类别是什么,每一个类别对做选择的经济个体来说都有或多或少的效用(没有效用的类别当然不会被考虑) ,一个类别的脱颖而出必然是因为该类别能产生出最高的效用。麦克法登将每一个类别的效用分解为两部份,第一个部分受“类别本身的特质”以及“做选择之经济个体的特质”所影响(了解这些特质是如何影响各个类别的效用便是实证分析的主要目的) ,而第二个部分则是一个随机变数,用以总结所有其他无法观察到的影响。也就是因为效用包含了这么一个随机变数,所以每一个类别的效用本身也都是随机的,影响所及各个类别之效用的大小不是固定不变, 而是随机变动的,换句语说经济个体不会固定的选择某一类别,我们最多只能说某个经济个体选择某某类别的机率是多少,这套想法麦克法登称之为“随机效用模型” (Random Utility Model 或简称 RUM) 。通过分类麦克法登大大扩展了效用理论的适用范围。

麦克法登接着对随机效用做出一些巧妙的分配假设,使得选择各类别的机率 (乃至于整个概似函数) 都可以很简单的公式表示出来,我们因此可用标准的统计方法 (最大概似估计法) 将“类别特质”以及“经济个体特质”对类别选择的影响估计出来,麦克法登将这种计量模型取名为“条件 Logit 模型” (Conditional Logit Model) ,由于这种模型的理论坚实而计算简单,几乎没有一本计量经济学的教科书不特设专章介绍这种模型以及类似的“多项 Logit 模型”Multinomial Logit Model) 。

多项 Logit模型虽然好用,但和所有其他的计量模型一样都有某些限制,多项 Logit 模型最大的限制在于各个类别必须是对等的,因此在可供选择的类别中,不可有主要类别和次要类别混杂在一起的情形。例如在研究旅游交通工具的选择时,可将交通工具的类别粗分为航空、火车、公用汽车、自用汽车四大类,但若将航空类别再依三家航空公司细分出三类而得到总共六个类别,则多项 Logit 模型就不适用,因为航空、火车、公用汽车、自用汽车均属同一等级的主要类别,而航空公司的区别则很明显的是较次要的类别,不应该混杂在一起。在这个例子中,主要类别和次要类别很容易分辨,但在其他的研究中可能就不是那么容易,若不慎将不同层级的类别混在一起,则由多项 Logit 模型所得到的实证结果就会有误差。为解决这个问题,麦克法登除了设计出多个检定方法以检查这个问题是否存在外,还发展出一个较为一般化的“阶层多项 Logit 模型” (Nested Multinoimal Logit Model) ,不仅可同时处理主要类别和次要类别,尚保持多项 Logit 模型的优点:理论完整而计算简单。

麦克法登曾更进一步的发展出可同时处理类别和连续型经济变数的混合模型,并将之应用到家庭对电器类别以及用电量 (连续型变数) 需求的实证研究上。一般来说,当响应变量(response variable/dependent variable)是二分类变量,且相应个体的协变量(covariate variable/independent variable)多于1个时,对应的logistic 回归称为 多元logit 模型;当响应变量是多分类变量时,对应的logistic模型成为 多项logit 模型。而且多元logit模型指因变量是多元的,不只是0,1这么简单。多项logit模型是自变量有多项。

教材第十七章 多项反应模型

http://vip.6to23.com/statdtedm/common/multinomial.htm

国外教材

http://www.gseis.ucla.edu/courses/ed231c/notes2/clogit.html

【转载自】http://blog.sina.com.cn/s/blog_4a839b9a0100hnji.html

你可能感兴趣的:(multinomial logit model 多项 Logit 模型)