您好,欢迎访问三七文档
离散选择模型、受限因变量模型和编程张晓峒(2015-8)南开大学数量经济研究所所长、博士生导师中国数量经济学会副理事长天津市数量经济学会理事长zhangnk710@126.com第1讲离散选择模型张晓峒(2015-8)南开大学数量经济研究所所长、博士生导师中国数量经济学会副理事长天津市数量经济学会理事长zhangnk710@126.com第1讲离散选择模型如果回归模型的解释变量中含有定性变量,则可以用虚拟变量处理之。在实际经济问题中,被解释变量也可能是定性变量。如通过一系列解释变量的观测值研究人们对某项动议的态度,某件事情的成功和失败等。所以常用0、1,或者1、2、3等表示。这种二元选择模型或多元选择模型,统称离散(分类)选择模型。这里主要介绍线性概率模型,Probit(概率单位)模型、Logit模型和Gompit模型。此外还包括有序因变量模型(ordereddependentvariablemodel)、无序因变量模型和计数模型(countmodel)。无序因变量模型(不讲)计数模型(不讲),计数模型是被解释变量只能取零和正整数的模型。计划经济体制下是不需要离散选择模型的。中国逐步从计划经济向社会主义市场经济体制转换,离散选择模型的用途将变得越来越广泛。file:7logit1file:logitzhoufile:7order_model-1第1讲离散选择模型1.线性概率模型2.Probit、logit和gompit模型3.用Probit、logit和gompit模型求偏导数4.用Probit、logit和gompit模型预测5.有序离散选择模型定义6.有序离散选择模型估计7.有序离散选择模型中求偏导数8.有序离散选择模型建模与预测-0.20.00.20.40.60.81.01.2280300320340360380400420YX10.1线性概率模型线性概率模型的形式如下,yi=+xi+ui(1)其中ui为随机误差项,xi为定量解释变量。yi为二元选择变量。如利息税、机动车的费改税(燃油税)问题等。设若是第二种选择若是第一种选择,0,1iy对yi=+xi+ui取期望,E(yi)=+xi(2)下面研究yi的分布。因为yi只能取两个值,0和1,所以yi服从两点分布。把yi的分布记为,iiiipyPpyP1)0()1(则E(yi)=1(pi)+0(1-pi)=pi(3)由(2)和(3)式有pi=+xi(yi的样本值是0或1,而预测值是概率。)(4)以pi=-0.2+0.05xi为例,说明xi每增加一个单位,则采用第一种选择的概率增加0.05。第1讲离散选择模型现在分析线性概率模型误差的分布。由(1)式有,ui=yi--xi=0,1,1iiiiyxyx(5)E(ui)=(1--xi)pi+(--xi)(1-pi)=pi--xi由(4)式pi=+xi,有E(ui)=pi--xi=0因为yi只能取0,1两个值,所以,Var(ui)=E(ui2)–(E(ui))2=[(1--xi)2pi+(--xi)2(1-pi)]–0(利用(5)式和上式)=(1--xi)2(+xi)+(+xi)2(1--xi),(依据(4)式)=(1--xi)(+xi)=(1-pi)pi=pi-pi2,(抛物线,依据(4)式)上两式说明,误差项的期望为零,方差具有异方差。当pi接近0或1时,ui具有较小的方差,当pi接近0.5时,ui具有最大方差(如图)。所以线性概率模型(1)回归系数的OLS估计量具有无偏性和一致性,但不具有有效性。0.20.40.60.81x0.050.10.150.20.25yVar(ui2)=pi-pi2当pi=0.5时最大-0.20.00.20.40.60.81.01.21.4051015202530XY假设用模型(4),pi=-0.2+0.05xi,进行预测,当预测值落在[0,1]区间之内(即xi取值在[4,24]之内)时,则没有什么问题;但当预测值落在[0,1]区间之外时,则会暴露出该模型的严重缺点。因为概率的取值范围是[0,1],所以此时必须强令预测值(概率值)相应等于0或1(见图1)。线性概率模型常写成如下形式,-0.20.00.20.40.60.81.01.2051015202530XY0,010,1,1iiiiixxxxp(5)此模型由JamesTobin1958年提出,因此称作Tobit模型(JamesTobin1981年获诺贝尔经济学奖)。-0.20.00.20.40.60.81.01.21.4051015202530XY0.00.20.40.60.81.0-6-5-4-3-2-10123456CNORMCLOGISTICCGUMBEL正态分布、logistic分布、极值分布(Gumbel)累计概率分布函数然而这样做是有问题的。假设预测某个事件发生的概率等于1,但是实际中该事件可能根本不会发生。反之,预测某个事件发生的概率等于0,但是实际中该事件却可能发生了。虽然估计过程是无偏的,但是由估计过程得出的预测结果却是有偏的。由于线性概率模型的上述缺点,希望能找到一种变换方法,(1)使解释变量xi所对应的所有预测值(概率值)都落在(0,1)之间。(2)同时对于所有的xi,当xi增加时,希望yi也单调增加或单调减少。显然累积概率分布函数F(xi)能满足这样的要求。采用标准正态分布的累积分布函数的模型称作Probit模型。此外,常用的还有logit模型和gompit模型。10.2Probit、Logit和Gompit模型定义一个隐变量(latentvariable)yi*与若干解释变量Xi呈线性回归关系,yi*=Xi+ut,utIID(0,2)(6)其中Xi是由若干解释变量组成的列向量。如果yi存在2种选择,则被解释变量yi与隐变量yi*存在如下关系:0*,10*,0iiiyyy其中不等式中的0称作阈值(threshold)或门限值(注意:阈值也可以不等于零。)。yk=0,1,表示被解释变量分类。P(yi=1∣Xi,)=P(yi*0)=P(Xi+ui0)=P(ui-Xi)=1-F(-Xi)P(yi=0∣Xi,)=P(yi*0)=P(Xi+ui0)=P(ui-Xi)=F(-Xi)给出样本(yi,Xi),i=1,…,N。其中,yi是离散变量观测值,只取0,1两种结果。Xi是解释变量列向量。N表示样本容量。并假定对于不同的i,(yi,Xi)相互独立。yi的结果是一次Bernoulli试验。服从两点分布。yi的概率密度函数是1,0,)1()(1iyiyiiiyppyfiiXyi对数的概率密度函数是Lnf(yi)=yiLnpi+(1-yi)Ln(1-pi)若概率由pi=P(yi=1Xi)=F(Xi)定义,对于不同的i,pi相互独立,则似然函数是N1i)1()](1[)()(iiyiyiFFLXX(7)对数似然函数是LnL()=N1i)](1[)1()(iiiiFLnyLnFyXX(8)其中,F(Xi)表示ui的累积概率分布函数。常用的分布类型包括标准正态分布的累积分布函数(probit模型),logistic分布的累积分布函数(logit模型)和极值(Gumbel)分布的累积分布函数(gompit模型)。.0.1.2.3.4-6-5-4-3-2-10123456DNORM1DLOGISTIC1X0.00.20.40.60.81.0-6-5-4-3-2-10123456CNORM1CLOGISTIC1X(7curve-line)(1)probit模型如果ui服从标准正态分布,则P(yi=1∣Xi,)=P(yi*0)=1-F(-Xi)=F(Xi)=(Xi)=βXidtet2221其中Xi的取值范围是(-,)。F(Xi)=(Xi)是标准正态分布的累积分布函数。则称上式为probit模型。累积概率分布函数曲线在pi=0.5附近的斜率最大。对应yi在横轴上的值,相应概率值永远大于0、小于1。第1讲离散选择模型(2)logit模型如果ui服从logistic分布,则P(yi=1∣Xi,)=P(yi*0)=1-F(-Xi)=1-)(11βXie=)(11βXie其中yi*=Xi+ut。隐变量yi*的取值范围是(-,)。F(Xi)是logistic累积分布函数。Xi通过logistic函数被转换为概率。P(yi=1∣Xi,)表示对于给定的Xi,相应个体选择1的概率。则称上式为logit模型。●该模型是McFadden于1973年首次提出。●对logistic函数作如下变换,1)1()(βXiepi对上式除以Pi,并减1得,iippe1)(βXi。取倒数后,再取对数,)1log(iippβXi由上式知回归方程的因变量是对数的某个具体选择的机会比。logit模型的一个重要优点是把在[0,1]区间上预测概率的问题转化为在实数轴上预测一个事件发生的机会比问题。logit累积概率分布函数的斜率在pi=0.5时最大,在累积分布两个尾端的斜率逐渐减小。说明相对于pi=0.5附近的解释变量xi的变化对概率的变化影响较大,而相对于pi接近0和1附近的xi值的变化对概率的变化影响较小。.0.1.2.3.4-6-5-4-3-2-10123456DNORM1DLOGISTIC1X0.00.20.40.60.81.0-6-5-4-3-2-10123456CNORM1CLOGISTIC1X.0.1.2.3.4-6-5-4-3-2-10123456DNORM1DLOGISTIC1X0.00.20.40.60.81.0-6-5-4-3-2-10123456CNORM1CLOGISTIC1X●除了yi=0,yi在[-,]之间取值所对应的Probit和logit曲线的值并不相同,为什么二元选择离散模型可以用此两条曲线描述?●logit曲线计算上比较方便,所以Logit模型比Probit模型更常用。极值(Gumbel)分布,中位数=0.3665,均值=0.5772,标准差=1.2826(3)Gompit模型如果ui服从极值(Gumbel)分布,则P(yi=1∣Xi,)=P(yi*0)=1-F(-Xi)=)(exp])(exp-[1-1βXβXiiee其中F(-Xi)是极值分布函数。隐(潜)变量yi*的取值范围是(-,),Xi通过极值(Gumbel)累积分布函数被转换为概率。图3正态、logistic、极值分布密度函数图4正态、logistic、极值分布累计函数.0.1.2.3.4-6-5-4-3-2-10123456DNORMDLOGISTICDGUMBEL0.00.20.40.60.81.0-6-5-4-3-2-10123456CNORMCLOGISTICCGUMBEL对于二元选择变量,E(yi)=1P+0(1-P)=P。又有,Pi=F(Xi)。所以E(yiXi,)=F(Xi)若f(yiXi)=piyi(1-pi)1-yi,yi=0,1,是正确设定的,则12,~~LnLENaMLβ用)(LnL对继续求偏导数,并求其负数的期望,得到MLβ~的渐近方差。-1N1i2)~'())~'(1)(~'(1)~(~iiiiiΜLFFFarVXXXXX第1讲离散选择模型LnL()=N1i)](1[)1()(iiiiFLnyLnFyXX(8)用上式对求导,并令其为零,得极大似然方程0
本文标题:1-离散因变量模型
链接地址:https://www.777doc.com/doc-4827438 .html