您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 浅谈排序多元离散选择模型(非参数统计,西南财大)
离散选择模型1浅谈离散选择模型第一节引言在实际经济问题的分析中,除可以利用连续变量表示居民消费或企业投资规模,还会遇到一些表示研究对象的数量或状态的离散变量。例如,不仅可以用离散变量0,1,2,3,4,…说明企业每年的专利申请数,而且也可以用离散变量0和1说明企业每年是否申请专利的事项。在专利申请数的问题中,离散变量0,1,2,3和4等数字具有具体的经济含义,不能随意更改;而在是否申请专利的两个备择对象的选择问题中,数字0和1只是用于区别两种不同的选择,是表示一种状态,将它们更换成数字3和4也未尝不可。于是,在将离散变量理解成仅表示选择状态的基础上,可以进一步地利用离散变量讨论类似家庭是否购房或某人是否有工作等问题。即结合离散变量的具体含义,可以通过以前介绍的虚拟变量描述和分析家庭是否购买住房或某人是否有工作等具体经济问题。在讨论某人是否有工作的问题中,可以将某人有工作的状态用数字l表示,而将没有工作的状态用数字0表示。同样地,在讨论家庭是否购房的问题中,可将家庭购买住房的决策用数字1表示,而将家庭不购买住房的决策用数字0表示。如果某个家庭是否购买住房或某人是否有工作的状态仅是作为用于说明某种具体经济问题的自变量,则应用以前介绍的虚拟变量的知识就足够了。如果现在考虑某个家庭在一定的条件下是否购买住房或某人在一定的条件下是否有工作等问题时,则表示状态的虚拟变量就不再是自变量,而是作为一个被说明对象的因变量出现在经济模型中。因此,需要对以前讨论虚拟变量的分析方法进行扩展,以便使其能够适应分析类似家庭是否购房或某人是否有工作等虚拟因变量的问题。因为在家庭是否购房或某人是否有工作等选择问题中,虚拟因变量的具体取值仅是为了区别不同的状态,所以将通过虚拟因变量讨论备择对象选择的回归模型称为选择模型。作为最简单的选择模型,可以考虑只具有两个备择对象的两项选择模型。实际上,两项选择模型具有广泛的应用性,它不仅可以用于讨论家庭购房等问题,还可以用于讨论家庭购房是否申请银行贷款、家庭成员是否利用公共交通设施等两者择一的问题。在最简单的因变量仅取两个不同数的两项反应模型或两项选择模型中,由于回归模型讨论的对象是两者择一的问题,利用取值0或1的虚拟变量表示经济主体的具体选择行为并不影响选择问题的实质性讨论。现在约定在具有备择对象的0和1两项选择模型中,下标t表示各不同的经济主体,取值0或l的因变量ty表示经济主体的具体选择结果,而影响经离散选择模型2济主体进行选择的自变量tx,与自变量tx相关的回归模型参数),,(1kβ。于是,存在误差项tu时,具体描述各经济主体选择结果的因变量ty的两个响应水平的回归模型就可写成ttuyβxt根据描述两个响应水平的回归模型可推知,根据统计数据得到的回归结果并不一定能够保证回归模型的因变量拟合值始终接近0或l。如果通过回归模型式得到的因变量拟合值完全偏离0或l两个数值,则描述两项选择的回归模型的实际用途就受到很大的限制。为避免出现回归模型的因变量预测值偏离0或1的情形,需要限制因变量的取值范围并对回归模型式进行必要的修正。由于两项选择模型的重点在于说明经济主体的对备择对象的选择行为,适当更改两项选择模型的描述方法也不会影响两项选择问题的实质。为此,在两项选择模型中,可以考虑不是将经济主体的确定性选择结果作为分析对象,而是将经济主体具体选择不同备择对象的可能性作为分析对象。换言之,将讨论确定性取值为0或l的两项选择模型转换成讨论经济主体具体选择0或1的不同备择对象的概率两项选择模型。在具有各择对象的0和1两项选择模型中,对应影响经济主体决策的自变量tx,如果经济主体选择响应1(1)的概率为)/(ttxyp1,则经济主体选择响应2(0)的概率为1-)/(ttxyp1,则1)/(ttxyE)/(ttxyp1+0)/(ttxyp0=)/(ttxyp1因为两个响应水平的回归模型对应的条件期望值)/(ttxyE就恰好等于选择对象1的概率)/(ttxyp1。于是模型的核心问题就变成如何确定条件表达式的问题。第二节二元离散选择模型一、线性概率模型作为简单回归模型的扩展,当然可以用βxt来描述)/(ttyEx,则(一)线性概率函数设Y是而值响应的观测值,X是解释变量,则)/(txtyE=tx+tu,其中~tu服从两点分布称)/(ttxyE=tx+tu为线性概率模型。离散选择模型3(二)概率模型的特点线性概率模型有一个最大得缺陷,不能保证拟合值始终在[0,1]范围之内。这就需要对线性概率模型进行必要得修正,在线性函数之外寻找满足概率函数取值要求的回归模型。随机扰动项非正态;可能存在异方差二、极大似然估计(一)效用函数为了使得二元选择问题的研究可能,必须首先建立一个效应函数。在讨论家庭是否购房的问题中,可将家庭购买住房的决策用数字1表示,而将家庭不购买住房的决策用数字0表示。用1iU表示第i个人选择买房的效用,0iU表示第i个人选择不买房的效用。其效用均为随机变量,于是有)2()1(000111iiiiiiUUβXβXii将(1)-(2),得)()(0101*01iiiiUUββXi记为***iiuYβXi这就是二元选择模型。当效用差大于零,则应该选“1”,即购房;当效用差小于零,则应该选“0”,即不购房。故**(1)(0)()iiipYpYPuiXβ-(二)最大似然估计因为**(1)(0)()iiipYpYPuiXβ-**(0)(0)()iiipYpYPuiXβ-我们假设有以Y轴为对称的概率密度函数F(.),则**(1)(0)()1()()iiipYpYPuFFiiiXβXβXβ--+**(0)(0)()()1()iiipYpYPuFFiiiXβXβXβ--+于是模型的似然函数为1201(,,,)1()()iinYYPYYYFFttXβXβ++离散选择模型4111()()iinYYiiiLFFXβXβ两边同时取自然对数,则1lnln1()(1)()niiiLYFYFttXβXβ对数似然函数最大化的一阶条件是0XβiniiiiiiiFfYFfYL1)1()1(ln其中if表示某种概率密度函数。三、Logit模型根据以上得分析,我们的问题已经转化为作为if有什么形状,即F(.)具有什么样的函数形式。为了对线性概率模型的修正,可以考虑在模型中引入转换函数而保证应变量的取值范围始终位于[0,1]。如果我们取F(.)为逻辑函数(LOGIT))exp(1)exp()(βXβXβXttt,则)/(ttxyp1=)exp(1)exp()(βXβXβXttt称上式为逻辑回归。注:因为二值响应模型的因变量取值为0和1,而预测值是概率,所以利用通常的指标衡量模型的说明能力会存在一些不利。如何衡量模型对现实问题的描述能力是一个重要的问题。原则上,可以用可决系数和最大似然比衡量模型的说明能力。注:iipp1机会比率,成败比。特点:有异方差情形三、PROBIT模型更为一般的情形,如果选择F(.)是标准正态分布,则产生PROBIT模型。)/(ttxyp1dttF)21exp(21)(2βxiiβX离散选择模型5(一)重复观测值不可得情况下0XβiniiiiiiiFfYFfYL1)1()1(lniYiiYiiiiFfFfLXXβi10)1(lniiiXβXβXniiiiqFqfq1)()((=0(二)重复观测值可得情况下第三节排序多元离散选择模型排序多元离散选择模型问题普遍存在于经济生活中。设iiiuYβX*u服从正态分布,且有零均值,方差为2i开始*Y是不可观测的,人们观测到的是),(),(3),[2),(11*1*21*1*YJYYYy如果如果如果如果2111*)1(iiiiiiuPYPYPβXβX2122212*1)2(iiiiiiiiuPYPYPβXβXβX2223323*2)3(iiiiiiiiuPYPYPβXβXβX2121*1)(iikiikkiikkikiuPYPkYPβXβXβX211*11)(iijiijkjiuPYPjYPβXβX离散选择模型6设样本容量为n。且kn是样本中Y=k的个数,则其似然函数为:121niiLβX×22122niiiiβXβX×32223niiiiβXβX××kniikiik212βXβX×Jniij211βX两边取自然对数,得
本文标题:浅谈排序多元离散选择模型(非参数统计,西南财大)
链接地址:https://www.777doc.com/doc-2315705 .html