您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 综合/其它 > 第2节 二元离散选择模型
第2节离散被解释变量计量经济学模型—二元选择模型ModelswithDiscreteDependentVariables—BinaryChoiceModel一、社会经济生活中的二元选择问题二、二元离散选择模型三、二元Probit离散选择模型及其参数估计四、二元Logit离散选择模型及其参数估计五、二元离散选择模型的检验说明•离散被解释变量数据计量经济学模型(ModelswithDiscreteDependentVariables)和离散选择模型(DCM,DiscreteChoiceModel)的区别。•二元选择模型(BinaryChoiceModel)和多元选择模型(MultipleChoiceModel)。•本节只介绍二元选择模型。•离散选择模型起源于Fechner于1860年进行的动物条件二元反射研究。•1962年,Warner首次将它应用于经济研究领域,用以研究公共交通工具和私人交通工具的选择问题。•70、80年代,离散选择模型被普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策等经济决策领域的研究。•模型的估计方法主要发展于80年代初期。一、社会经济生活中的二元选择问题•研究选择结果与影响因素之间的关系。–选择结果:0、1–影响选择结果的因素包括两部分:决策者的属性和备选方案的属性。•两种方案的选择–由决策者的属性和备选方案的属性共同决定。–例如,选择利用公共交通工具还是私人交通工具,取决于两类因素。一类是公共交通工具和私人交通工具所具有的属性,诸如速度、耗费时间、成本等;一类是决策个体所具有的属性,诸如职业、年龄、收入水平、健康状况等。–从大量的统计中,可以发现选择结果与影响因素之间具有一定的因果关系。•单个方案的取舍–一般由决策者的属性决定。–例如,对某种商品的购买决策问题。决定购买与否,取决于两类因素。一类是该商品本身所具有的属性,诸如性能、价格等;一类是消费者个体所具有的属性,诸如收入水平、对该商品的偏好程度等。–对于所有的决策者,商品本身所具有的属性是相同的,在模型中一般不予体现。二、二元离散选择模型1、原始模型•对于二元选择问题,可以建立如下计量经济学模型。其中Y为观测值为1和0的决策被解释变量;X为解释变量,包括选择对象所具有的属性和选择主体所具有的属性。YXyiXii0)(iEiX)(iyEiiiipyPyPyE)0(0)1(1)(EyPyii()()1Xi)0(1)1(iiiiyPpyPp左右端矛盾•由于存在这两方面的问题,主要是模型左右端矛盾问题,导致:–原始模型不能作为实际研究二元选择问题的模型。–需要将原始模型变换为效用模型。一般教科书称为潜变量模型(LatentVariableModel)。–这是离散选择模型的关键。iiiyy1101XXXXiiii当,其概率为当,其概率为具有异方差性2、效用模型作为研究对象的二元选择模型Uiii11X1Uiii000XUUiiiii1010X10()()yii**Xi第i个个体选择1的效用第i个个体选择0的效用PyPyPiii()()()**10Xi•注意:–在效应模型中,被解释变量是不可观测的潜变量,人们能够得到的观测值仍然是选择结果,即1和0。–很显然,如果不可观测的U1U0,即对应于观测值为1,因为该个体选择公共交通工具的效用大于选择私人交通工具的效用,他当然要选择公共交通工具;–相反,如果不可观测的U1≤U0,即对应于观测值为0,因为该个体选择公共交通工具的效用小于选择私人交通工具的效用,他当然要选择私人交通工具。–OLS不能用于效用模型的估计。3、最大似然估计•欲使得效用模型可以采用ML估计,就必须为随机误差项选择一种特定的概率分布。•两种最常用的分布是标准正态分布和逻辑(logistic)分布,于是形成了两种最常用的二元选择模型—Probit模型和Logit模型。•最大似然函数及其估计过程如下:FtFt()()1PyPyPPFFiiii()()()()()()***1011XXXXiiiiPyyyFFnyyii(,,,)(())()12011XXiiLFFin(())(())XXiyi1yii11标准正态分布或逻辑分布的对称性似然函数ln(ln()()ln(()))LyFyFiiinXXii111ln()()LyfFyfFiiiiiiin111X0i•在样本数据的支持下,如果知道概率分布函数和概率密度函数,求解该方程组,可以得到模型参数估计量。1阶极值条件三、二元Probit离散选择模型及其参数估计1、标准正态分布的概率分布函数Ftxdxt()()exp()22122fxx()()exp()221222、重复观测值不可以得到情况下二元Probit离散选择模型的参数估计ln()()LfFfFqfqFqiiyiiiyiiiiiiniinii10111XXXXXX0iiiqyii21•关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。•应用计量经济学软件。•这里所谓“重复观测值不可以得到”,是指对每个决策者只有一个观测值。如果有多个观测值,也将其看成为多个不同的决策者。3、例题:贷款决策模型•分析与建模:–某商业银行从历史贷款客户中随机抽取78个样本,根据设计的指标体系分别计算它们的“商业信用支持度”(XY)和“市场竞争地位等级”(SC),对它们贷款的结果(JG)采用二元离散变量,1表示贷款成功,0表示贷款失败。目的是研究JG与XY、SC之间的关系,并为正确贷款决策提供支持。•样本观测值JGXYSCJGFJGXYSCJGFJGXYSCJGF0125.0-20.000001500-20.0000054.00-10.00000599.0-20.0000096.0000.0000142.0021.00000100.0-20.00001-8.00001.0000042.0000.02090160.0-20.00000375.0-20.0000118.0021.0000046.00-20.0000042.00-16.5E-13080.0016.4E-12080.00-20.000015.00021.00001-5.00001.00000133.0-20.00000172.0-20.00000326.020.00000350.0-10.00001-8.00001.00000261.010.0000123.0000.9979089.00-20.00001-2.000-10.9999060.00-20.00000128.0-20.0000014.00-23.9E-07070.00-10.000016.00001.0000122.0000.99911-8.00001.00000150.0-10.00000113.010.00000400.0-20.0000154.0021.0000142.0010.9987072.0000.0000028.00-20.0000157.0020.99990120.0-10.0000125.0000.99060146.000.0000140.0010.9998123.0000.9979115.0001.0000135.0010.9999114.0001.0000026.00-24.4E-16126.0011.0000049.00-10.0000089.00-20.0000115.00-10.4472014.00-10.549815.00011.0000069.00-10.0000061.0002.1E-121-9.000-11.00000107.010.0000140.0021.000014.00011.0000129.0011.0000030.00-20.0000054.00-20.000012.00011.00000112.0-10.0000132.0011.0000137.0010.9999078.00-20.0000054.0001.4E-07053.00-10.000010.00001.00000131.0-20.00000194.000.00000131.0-20.0000115.0001.0000•选择Probit模型•估计结果•输出的估计结果该方程表示:当XY和SC已知时,代入方程,可以计算贷款成功的概率JGF。例如,将表中第19个样本观测值XY=15、SC=-1代入方程右边,计算括号内的值为0.1326552;查标准正态分布表,对应于0.1326552的累积正态分布为0.5517;于是,JG的预测值JGF=1-0.5517=0.4483,即对应于该客户,贷款成功的概率为0.4483。•正确解读该结果十分重要•讨论:–能否说“当市场竞争地位等级提高1,给该企业贷款成功的概率提高5.062”?•不能。为什么?–能否说“对于不同的企业,当市场竞争地位等级都提高1,给这些企业贷款成功的概率所提高的幅度是相同的”?•不能。为什么?•模拟预测•预测:如果有一个新客户,根据客户资料,计算的“商业信用支持度”(XY)和“市场竞争地位等级”(SC),代入模型,就可以得到贷款成功的概率,以此决定是否给予贷款。4、重复观测值可以得到情况下二元Probit离散选择模型的参数估计•思路–对每个决策者有多个重复(例如10次左右)观测值。–对第i个决策者重复观测ni次,选择yi=1的次数比例为pi,那么可以将pi作为真实概率Pi的一个估计量。–建立“概率单位模型”,采用广义最小二乘法估计。–实际中并不常用。•对第i个决策者重复观测n次,选择yi=1的次数比例为pi,那么可以将pi作为真实概率Pi的一个估计量。pPeFeiiii()XiEeVareppniiiii()()()01vFpFPeiiii11()()FPeFPefFPiiiii111()()(())vFPuiii1()EuVaruPPnfFPiiiiii()()()((()))0112定义“观测到的”概率单位V的观测值通过求解标准正态分布的概率分布函数的反函数得到vuiiXVXUiFPi1()Xi()XXXV111iiFP)(iXptdtivi()exp()22122实际观测得到的四、二元Logit离散选择模型及其参数估计1、逻辑分布的概率分布函数Ftet()11fteett()()12Fteettt()()1fteetttt()()()(())1122、重复观测值不可以得到情况下二元logit离散选择模型的参数估计•关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。•应用计量经济学软件。ln()()(())LyfFyfFyiiiiiiiniin1111XXX0iii3、重复观测值可以得到情况下二元logit离散选择模型的参数估计•思路–对每个决策者有多个重复(例如10次左右)观测值。–对第i个决策者重复观测ni次,选择yi=1的次数比例为pi,那么可以将pi作为真实概率Pi的一个估计量。–建立“对数成败比例模型”,采用广义最小二乘法估计。–实际中并不常用。•用样本重复观测得到的pi构成“成败比例”,取对数并进行台劳展开,有ln()ln()()ppPPePPiiiiiii111Ftet()11FtFtet()()1iXePPii1ln()ln()ppeuuiiiiii1XXvuiiXVXUi()XXXV1
本文标题:第2节 二元离散选择模型
链接地址:https://www.777doc.com/doc-3265359 .html