您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 综合/其它 > 此即为经典变量测量误差
1计量经济学导论刘愿多元回归分析:模型设定与数据问题y=b0+b1x1+b2x2+...bkxk+u2计量经济学导论刘愿函数形式线性函数能够模拟非线性关系。对数模型对x取平方项交互项问题是,我们如何知道所设模型是否正确。3计量经济学导论刘愿函数形式(续)经济理论参数解释考察x对y的影响(百分比或绝对值)4计量经济学导论刘愿函数形式(续)联合排除性检验可以考察高阶项或交互项是否属于这个模型。(F检验或LM检验)实际用了对数模型,增加额外的一项(平方项),可以检验哪种模型更好。模型检验方法是Ramsey回归误设检验(RESET).5计量经济学导论刘愿Ramsey’sRESETRESET的原理类似于怀特检验。不是直接加入x的函数,而是加入拟合值函数ŷ.因此,估计y=b0+b1x1+…+bkxk+d1ŷ2+d2ŷ3+u,检验:H0:d1=0,d2=0运用F~F2,n-k-3或LM~χ22检验是否漏掉了重要的非线性关系。6计量经济学导论刘愿0123230123012,820010123ˆˆ88,34.67,0.012:0,0pricelotsizesqrftbdrmsupricelotsizesqrftbdrmspricepriceuFnkprHlpricellotsizelsqrftbdrmsulpbbbbbbbbddddbbbb在5%的显著性水平下拒绝虚拟假设模型存在函数,形式误设。230123012,82001ˆˆ88,32.56,0.084:0,0ricellotsizelsqrftbdrmslpricelpriceuFnkprHbbbbdddd在5%的显著性水平下无法拒绝虚拟模型不存在函数形假设,式误设。7计量经济学导论刘愿01122011220112231420120341986loglogloglog:0,0;:0,0;yxxuyxxuyxxxxuHHbbbbbb米曾和理查德检验()(1)(2)(3)8计量经济学导论刘愿02122011221010112201122101Davidson-Mackinnonˆˆˆˆˆloglogˆ:0ˆˆˆˆˆloglog:0yxxyxxyuHyxxyxxyuHbbbbbbbbbbbb检验9计量经济学导论刘愿非嵌套备选检验(续)当一个模型使用y作为因变量,另一个模型使用ln(y)作为因变量,检验将变得困难。先将ln(y)的估计值转换获得ŷ,其他逻辑思路如前。在任何情况下,DM检验可以同时拒绝两个模型,也可能同时无法拒绝两个模型,而并不一定得到偏好某个模型的结论。10计量经济学导论刘愿代理变量当一个重要变量因无法获得数据而出现误设时,情形如何?可以使用代理变量避免遗漏变量偏误。代理变量必须与遗漏变量(无法观测变量)相关,如:x3*=d0+d3x3+v3,其中,*代表无法观测。假设我们仅仅是将x3替代为x3*。11计量经济学导论刘愿代理变量(续)为获得b1和b2的一致估计值,需要满足如下条件:E(x3*|x1,x2,x3)=E(x3*|x3)=d0+d3x3u与x1,x2、x3*、x3无关;v3与x1,x2和x3无关。因此,实际上是进行如下回归:y=(b0+b3d0)+b1x1+b2x2+b3d3x3+(u+b3v3)即重新定义截距项、误差项和x3的系数。12计量经济学导论刘愿代理变量(续)如果不满足以上条件,将导致有偏估计。例如:x3*=d0+d1x1+d2x2+d3x3+v3实际上是进行如下回归:y=(b0+b3d0)+(b1+b3d1)x1+(b2+b3d2)x2+b3d3x3+(u+b3v3)偏误取决于b3和dj的符号。当然,这一偏误仍小于遗漏变量偏误。11312232ˆˆlim,limppbbbdbbbd13计量经济学导论刘愿*303330112233*12333123**31233303303011223333301122331,,,2,,|,,|9.119.12xxvyxxxuuxxxxvxxxxxxxExxxyxxxuvyxxxeddbbbbddbbdbbbdbbb遗漏变量问题的植入解误差与都不相关;误差与都不相关;E将代入得到(9.11)(9.12)14计量经济学导论刘愿因变量:log(wage)自变量(1)(2)(3)educ0.0650.0540.018(0.006)(0.007)(0.041)exper0.0140.0140.014(0.003)(0.003)(0.003)tenure0.0120.0110.011(0.002)(0.002)(0.002)married0.1990.20.201(0.039)(0.039)(0.039)south-0.091-0.08-0.08(0.026)(0.026)(0.026)urban0.1840.1820.184(0.027)(0.027)(0.027)black-1.188-0.143-0.147(0.038)(0.039)(0.04)IQ0.0036-0.0009(0.001)(0.0052)educ*IQ0.00034(0.00038)截距5.3955.1765.648(0.113)(0.128)(0.546)观测次数935935935R平方0.2530.2630.26315计量经济学导论刘愿滞后因变量当存在无法观测的因素,而又无法找到合适的代理变量时,该如何处理?一个可行的方法是在模型中(右侧)包含一个滞后的因变量来描述遗漏变量。其中,这一遗漏变量对过去和现在的y均有作用。显然,必须要考虑过去与现在的y与遗漏变量的相关性。16计量经济学导论刘愿312123101.0;2.crimeexpendˆunem3.expcrimecrimcrimeuneemendubbbbbbb2犯罪具有惯性,预期历史上犯罪率高的城市对犯罪的预防也会花更多的钱。因此,观测不到而又影响的因素,可能会与(和)相关,有偏。引入,实际上是检验:如果两个城市以前有相同的犯罪率,现在又有相同的失业率,那么就度量了多增加执法支出1美元对犯罪率的影响。17计量经济学导论刘愿因变量:log(crmrte87)自变量12umem87-0.0290.0009(0.032)(0.02)log(lawexpc87)0.203-0.14(0.173)(0.109)log(crimrte82)1.194(0.132)截距3.340.076(1.25)(0.821)观测次数4646R-平方0.0570.6818计量经济学导论刘愿测量误差虽然我们可获得所需变量,但其测量存在误差。例如:调查问卷涉及过去一年你工作时间,或在孩子还小时你看护孩子的时间,或你的收入状况。y的测量误差与x的测量误差影响不同。19计量经济学导论刘愿y的测量误差y*=b0+b1x1+…+bkxk+u定义测量误差为e0=y–y*实际是估计y=b0+b1x1+…+bkxk+u+e0何时OLS估计可获得无偏的结果?如果e0与xj,u无关,估计结果是无偏的。如果E(e0)≠0,b0是有偏的。当估计结果是无偏时,与不存在测量误差时比较,方差会更大。22200Varuuve20计量经济学导论刘愿*01234*0*01*0010loglogloglogOLSOLSiiisavincsizeeducageuesavsavscrapgrantuscrapscrapescrapgrantuebbbbbbbbb有测量误差的储蓄方程废弃率中的测量误差如果因变量的测量误差与一个或多个解释变量系统相关,有偏误。如果测量误差只是一个与解释变量无关的随机报告误差,完全适用。21计量经济学导论刘愿x的测量误差考察简单回归模型y=b0+b1x1*+u定义测量误差为e1=x1–x1*假定E(e1)=0,E(y|x1*,x1)=E(y|x1*):u与x1、x1*都不相关,实际是估计y=b0+b1x1+(u–b1e1)测量误差对OLS估计值的影响取决于e1和x1的相关性。假设Cov(x1,e1)=0,OLS估计仍然是无偏的,但方差增大。y=b0+x1*+u→y=b0+b1x1+(u-b1e1)u和e1的均值为零,且与x1无关,u-b1e1均值也为零并与x1无关。方差:122111ueVaruebb22计量经济学导论刘愿x的测量误差(续)假设Cov(x1*,e1)=0,此即为经典变量测量误差(CEV),e1与x1必然相关:Cov(x1,e1)=E(x1e1)=E(x1*e1)+E(e12)=0+e2x1与e1相关,OLS估计有偏且不一致:22*2*122*2122*2111111111,ˆplimexxexeexexVareuxCovbbbbbbbVar(x1*)/Var(x1)23计量经济学导论刘愿11*11*111*22111111111111121CEVCov,0,0,,eexexxeCovxeExeExeEeCovxueCovxebbb假定成立:24计量经济学导论刘愿x的测量误差(续)误差项为Var(x1*)/Var(x1)。既然Var(x1*)/Var(x1)1,估计值具有向零偏误,称为衰减偏误。多元回归情况下,CEV假设下的衰减偏误为:212211*1*1ˆplimerrbb*1**10121:kkrxxxr其中为以下回归的误差项25计量经济学导论刘愿例子:存在测量误差的GPA方程11*0123*101231*11*111*221111111211111111minminminminCEVCov,0,0,,OeecolGPAfachsGPASATufacfacecolGPAfachsGPASATuexexxeCovxeExeExeEeCovxueCovxebbbbbbbbbbbb假定成立:的011LS0H00bb估计量产生向的偏误。其后果之一是:对:的检验中发现的可能性下降。26计量经济学导论刘愿数据缺失当某个观测的某个变量数据缺失时,这个观测就无法进入模型。如果数据缺失是随机的,即使漏掉了这些缺失数据的观测,模型结果不受影响。当数据缺失是系统性的,参数估计值的性质会受到影响。例如,高收入的个体往往拒绝提供关于收入的数据。27计量经济学导论刘愿非随机样本如果样本的选择是基于自变量x,则估计值是无偏的。如果样本的选择是基于因变量y,模型存在样本选择偏误。28计量经济学导论刘愿012335E|,,,savingincomeagesizeusavingincomeagesizeincomeagesizebbbb:基于自变量的样本选择假设数据集是基于对岁以上人群的调查,我们所得到的所有成年人的一个非随机样本。我们仍能利用这个非随机样本得到上述总体模型中参数的无偏和一只估计量。对于由或所刻画的总体中的任何一个子集都是一样的。如果自变量在这个总体外生中样本选择有充分的变化,那么基于这个自变量的选择除导致低效的估计外,就算不上什么严重问题。29计量经济学导论刘愿123exp7.5|,exp,7.5wealtheducerageuEwealtheduceragebbbb0:基于因变量的样本选择=假设只有
本文标题:此即为经典变量测量误差
链接地址:https://www.777doc.com/doc-3591214 .html