您好,欢迎访问三七文档
1第十章多元选择模型(Multiple-choicemodels)2本章内容一、无序多元选择模型二、有序因变量模型(Ordereddata)三、计数模型(Countdata)3一、基本概念对于多元选择模型,可以根据因变量的性质分为有序选择模型和无序选择模型两种类型。(一)无序模型:因变量Y表示观察对象的类型归属。例1:交通问题(走路、骑自行车、乘公共汽车、打出租车、开私家车)例2:就业问题:农民工就业行业选择;农村劳动力转移(小城镇、县级市、地级市、省级城市、大城、…)例3:农户借贷(国有银行、信用社、民间借贷)例4:超市购物选择例5:农户土地流转(转包、出租、互换、转让、股份合作)4(二)有序模型:观察到的因变量Y表示出按数值大小(ordered)或重要性(ranked)排序的分类结果:例1:个人达到的教育水平分文盲、小学、初中、高中、大学、研究生等例2:考试成绩分优秀、良好、及格和不及格等;学生奖学金等级;例3:评价意见调查分非常不满意、不满意、一般、满意、非常满意等例4:住房选择:租房、小户型、大户型、别墅例5:银行信誉等级5二、无序多元选择模型无序的Probit计算复杂,故考虑有三种选择的Logit模型即每个方程都假定,任两个选择的机会比对数是特征X的线性函数。由于所有概率之和等于1,因而机会比相互依赖,上述限制使需要估计的参数由6个减少到4个。221211331311332322logloglogPXPPXPPXP6对于无序选择模型,其行为选择假定出于优化一个随机效用函数。考虑第i个消费者面临着k种选择,假定选择j的效用为:如果消费者选择了j,那么我们假定消费者由这一选择获得的效用高于其他选择。考虑效用比较的概率函数就误差分布形式做出假定后得到可以估计的选择行为模型。ijijijUzePrijikUUkj所有的7无序多元选择模型产生系数限制的原因:这意味着以下限制条件:即只需要估计系统中的两个方程便可以得到所有参数。XXXPPPPPPPPPP21312131212131311213211323logloglogloglog2131322131328无序多元选择模型如果样本属于重复试验,那么可以计算出与每个组相联系的概率rij/ni,然后计算出机会比的对数,与X做回归。式中rij表示组i中选择j的次数占该组观察对象总数ni的比例如果没有足够多的重复,则需要利用最大似然法进行估计。9举例用多元Logit模型分析农户合作医疗方式选择数据:6个省的2505个农户的问卷调查,有951户做出了选择。分析只利用此子样本。合作医疗方式分为三类福利型:每人年交5-10元,减免挂号、诊断、注射、处理费;福利风险型:每人年交20-100元,报销大病和小病的部分医疗费用;风险型:每人年交20-50元,报销大病的部分医疗费用。10因变量Log(P1/P3)Log(P2/P3)系数标准差系数标准差河北-1.3070.23-0.9130.26江苏-0.8590.26-2.5690.51广东-0.3230.290.4530.32四川0.2360.31-0.7160.42甘肃-1.6170.29-0.6890.29最低收入组-0.4740.280.1740.33低收入组0.2350.280.5310.34中收入组-0.3150.280.2600.33高收入组-0.3030.270.1360.31常数项0.9370.24-0.1930.2911计算出的选择三种方式的可能性%0%20%40%60%80%100%河北吉林江苏广东四川甘肃风险型福利风险型福利型12二、有序因变量模型同二元选择模型一样,我们可以考虑隐变量y*的值取决于一组自变量X,即:观察到的Y由Y*决定,即如果连续性随机变量Y*超过某个临界值,则对应Y的一个确定性选择。两者的关系是:需要注意的是,反映类型差异的数字是任意的,但必须保证当有序因变量模型也有probit、logit、extremevalue三种形式可供选择,用极大似然法(ML)进行参数估计。事先也不确定,需要与β一起作为参数进行估计。*3*22*11*210iMiiiiYMYYYY如果如果如果如果jijiYYYY时有**iiiuXY*有序因变量模型假设残差项u服从标准正态分布或logit分布,则可得排序选择模型的概率形式。每个Y的概率为:式中F为残差项的累积分布函数。)(1)Pr()Pr(),,Pr()()()Pr()Pr(),,1Pr()()Pr()Pr(),,0Pr(122121111iMMMiiiiiiiiiiiiiiXFuXYXMYXFXFuXYXYXFuXYXY在有序因变量模型中,因变量的值仅仅反映排序,因而对其数值及间隔并无特殊要求。例:序列(1,2,3,4)等同于序列(1,10,30,100)因变量必须是整数,可以利用EVIEWS的函数功能做转换(@Round,@Floor,@Ceil)14有序因变量模型参数估计:分类临界值和参数β估计方法:极大似然法极大似然函数:式中函数I(.)是一个指标函数,当括号中的逻辑关系为真时等于1,反之等于0。为了保证概率为正值,所有的必须满足012…M。10,|,,NMiiiijLLogPrYjXIYj15有序Probit模型的概率XX1X2X300.10.20.30.4Y=0Y=1Y=2Y=3Y=4)(ufu16选择一种估计方法(Probit,Logit,Extremevalue)确定估计模型所使用的样本区间按OK后EVIEWS利用迭代求解法得出估计结果,包括各自变量的参数及相应的统计值,各临界点和其统计值,其他统计检验指标等。若模型收敛,那么报告的内容具有意义。需要注意的问题有:由于EVIEWS有估计参数数量限制,因而因变量的取值不能太多(使用大样本时需要特别注意)。若某一类别中的观察值过少,此时会造成识别困难。在可能的情况下,应考虑将其合并到其他类别。估计该方程时的步骤为:选择Quick→Estimateequation在随后出现的对话窗口中,先选择模型设定窗口,给出Y和X(不需要截距项:17有序因变量模型不能用于预测因变量数值的大小,但可以用于预测属于每个类别的可能性;选择Procs/MakemodelEVIEWS打开一个文件,其中包括由每个类别的概率函数组成的方程组。打OK后,EVIEWS计算出每个观察值落入任一类别的可能性,并将其储存在与因变量同名但附加上类别识别码和模拟方案(Scenario)码的变量下。18举例:有序因变量模型估计某政策出台后对居民收入有影响,由此对市民的政策支持情况进行调查。通过调查取得了市民收入(X)、支持与否(Y)的数据,其中如果选民支持则Yi取0,中立取1,不支持取2。获得了24组数据,进行排序选择模型估计分析。1.模型的估计2*2*11*210iiiiYYYY待估计的三元选择模型:待估计的潜回归模型:uXY*待估计参数:21收入X态度Y收入X态度Y收入X态度Y55004.81332385017.4387721250210.9393760005.25089895018.3139221350211,8145265005.688473105019.1890721450212.6896770006.126048110019.6266471500213.1272575006.5636231150110.064221550213.5648280007.0011981200110.501801600214.0024090007.8763471300111.376951650214.43997100008.7514971400112.252101700214.87754YˆYˆYˆ注意:(1)估计式中列出或者不列出无常数项是等价的。(2)EViews要求因变量Y是整数,否则将会出现错误信息,并且估计将会停止。然而,由于我们能够在表达式中使用@round、@floor或@ceil函数自动将一个非整数序列转化成整数序列,因此这并不是一个很严格的限制。与二元选择模型类似,执行命令:Proc/makeequation/,在EquationSpecification对话框中选择估计方法ORDERED,然后选择Normal,Logit,ExtremeValue三种误差分布中的一种,单击OK按钮即可。21排序模型的输入对话框222、估计结果估计收敛后,EViews将会在方程窗口显示估计结果。表头包含通常的标题信息,包括假定的误差分布、估计样本、迭代和收敛信息、Y的排序选择值的个数和计算系数协方差矩阵的方法。在标题信息之下是系数估计和渐近的标准误差、相应的z-统计量及概率值。然后,还给出了临界值LIMIT_1:C(2),LIMIT_2:C(3)的估计及相应的统计量。23244、预测因为排序选择模型的因变量代表种类或等级数据,所以不能从估计排序模型中直接预测。选择Procs/MakeModel,打开一个包含方程系统的没有标题的模型窗口,单击模型窗口方程栏的Solve按钮。例中因变量y*的拟合线性指标,拟和值落在第一类中的拟合概率被命名为Y_0_0的序列,落在第二类中的拟合概率命名为Y_1_0的序列中,落在第三类中的拟合概率命名为Y_2_0的序列中,等等。注意对每一个观察值,落在每个种类中的拟合概率相加值为1。Y_0_0,Y_1_0,Y_2_0分别是支持、中立、不支持的概率,Y,INC是实际样本。Procs“MakeMODEL”按“solve”59779.11093075.8008751.021*uXY可得潜回归模型为:注意:因为对政府支持等级与叙述成反方向变化,即序数越大,支持度越低;序数越小,支持度越高。支持态度的分布:59779.11259779.11093075.81093075.80***iiiiYYYYY的取值Y的取值的概率012)008751.0093075.8(XF)008751.0093075.8()008751.059779.11(XFXF)008751.059779.11(1XF或:态度Y的分布列:303.常用的两个过程①MakeOrderedLimitVector产生一个临界值向量c,此向量被命名为LIMITS01,如果该名称已被使用,则命名为LIMITS02,以此类推。②MakeOrderedLimitCovarianceMatrix产生临界值向量c的估计值的协方差矩阵。命名为VLIMITS01,如果该名称已被使用,则命名为VLIMITS02,以此类推。314.产生残差序列选择Proc/MakeResidualSeries产生广义残差序列,输入一个名字或用默认的名字,然后单击OK按钮。一个排序模型的广义残差由下式给出:其中:c0=-,cM+1=。,)ˆ()ˆ()ˆ()ˆ(11βxβxβxβxigigigiggicFcFcfcfe32三、计数模型在计数模型中,因变量为某事件发生的次数。例1:学生在校期间取得优秀成绩的课程数例2:年内农户家庭外出就业的劳动力数例3:家庭生育的小孩数计数模型虽然可以使用最小二乘法估计,但由于因变量存在下限0,并且其取值为离散的,因而能够考虑这些特点的估计方法有助于改善估计结果。实践中Poisson回归
本文标题:多元选择模型
链接地址:https://www.777doc.com/doc-4346731 .html