您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > §44随机解释变量问题.
§4.4随机解释变量问题一、随机解释变量问题及后果二、随机解释变量问题产生的原因三、工具变量法(解决方法)四、解释变量的内生性检验五、案例确定性的解释变量对于多元线性回归模型:tk221t++…++=uXXYktt如果解释变量X2,…Xk都是确定性变量,则最小二乘估计量是无偏的:-1ˆ()E[()]Eβ=X'XX'Y)]()[(1uXβX'X'XE])E[(1X'uX'Xβ])([X'uX'Xβ1E)(E)(1uX'X'Xβ如果存在随机性解释变量,上面最后一个等式还能成立吗?一、随机性解释变量对于多元线性回归模型:tk221t++…++=uXXYktt如果解释变量X2,…Xk存在随机性变量,则可能存在以下三种情况:(1)随机解释变量与扰动项相互独立。(2)随机解释变量与扰动项不相互独立,但不相关。(3)随机解释变量与扰动项项相关。OLS估计量是无偏的:(1)随机性解释变量与扰动项相互独立-1ˆ()E[()]Eβ=X'XX'Y)]()[(1uXβX'X'XE])E[(1X'uX'Xβ])([X'uX'Xβ1E)(]E)([1uX'X'XEβE[f(X)u]=E[f(X)]E(u)E(Xu)=E(X)E(u)因此,E[(X’X)-1X’u]=E[(X’X)-1X’]E(u)=0(2)随机性解释变量与扰动项不独立,也不相关E(Xu)=E(Xu)-E(u)=E[(X-)u]=Cov(X,u)≠0E(u)=0,E(X)=但是,E[(X’X)-1X’u]=E[(X’X)-1]E(X’u)=0上面等式成立吗,为什么?因此,OLS估计量是有偏的:-1ˆ()E[()]Eβ=X'XX'Y])E[(1X'uX'Xβ此时,OLS估计量是一致的,即随着样本容量N,OLS估计量收敛于真实值。ˆˆlimNP11221limlim1limttNttNttNPxuxuNPxPxN11(,)()tttCovXuVarX11ˆlimNP以一元回归模型为例:111222()ˆttttttttttxyxxuxuxxx21limtttNxuxP11(,)()tttCovXuVarXˆlimNP因此,最小二乘估计量为有偏且不一致的估计量。(3)随机性解释变量与扰动项相关Cov(X,u)0二、解释变量与扰动项相关的原因解释变量缺失研究工人工资收入(wage)时,比较重要的解释变量是工作经验(exper)、教育水平(edu)和个人能力(abi)等,但由于abi不可观测,通常被归入扰动项:Log(Wagei)=0+1experi+2experi2+3edui+4abii+vi=0+1experi+2experi2+3edui+ui能力同时对教育水平也有着重要影响,因此,解释变量edu与扰动项u=4abi+v是相关的,测量误差y=0+1x+u对于一元回归模型:真值x是未知的,通常只能用其观测值z替代,假设两者之间存在测量误差v:z=x+v实际中使用观测值z建模时,模型变换为:y=0+1x+u=0+1z+(u-1v)y=0+1z+=(u-1v)解释变量z=x+v与扰动项=(u-1v)是相关的。联立方程模型……….当解释变量与扰动项相关时,可以利用工具变量来得到一致估计量。工具变量:在估计过程中作为工具的变量,以替代模型中与随机误差项相关的随机解释变量。三、两阶段最小二乘法(2SLS)——解释变量与扰动项相关的解决办法选取的工具变量需满足的条件:(1)与所替代的随机解释变量高度相关;(2)与随机误差项不相关。对于与扰动项不相关的解释变量,工具变量就是其本身。工具变量的个数(l)应该大于或等于模型中解释变量的个数(k),即lk。也就是说,对于与扰动项相关的解释变量,至少要为每个变量寻找一个工具变量。Step1:将每个解释变量,即1,X2,X3,Xk分别对l个工具变量进行回归,Z=(1Z2Z3Zl),得到拟合值:1,2SLS的步骤tk221t++…++=uXXYktt对于多元回归模型:假设工具变量为Z=(1Z2Z3Zl),对于那些与u不相关的解释变量,例如常数项,工具变量Zi和解释变量Xi是相同的。+…++=ˆ221lltjZZXˆ2X,,ˆkXStep2:将解释变量y对这些拟合值进行回归,得到的结果就是2SLSt221+ˆ+…+ˆ+=uXXYktkttYXXXSLS'1'2ˆ)ˆˆ(例子利用428个正在工作的已婚妇女的样本数据估计工资方程:Log(Wagei)=0+1experi+2experi2+3edui+ui直接进行OLS回归,得到:Log(Wagei)=-0.522+0.04experi-0.0008experi2+0.11edui+ei(-2.63)(3.15)(-0.206)(7.60)R2=0.156F=26.286DW=1.96这个结果有意义吗??因为edu与u相关,OLS估计量是有偏的和不一致的,因此虽然样本容量很大,但估计结果依然是不可靠的。选择工具变量:对于常数项、exper和exper2,与扰动项不相关,选择其自身作为工具变量。对于edu,选择mothedu、fathedu和husedu,即其母亲、父亲和丈夫的教育水平作为工具变量。工具变量为constant、exper、exper2、mothedu、fathedu和husedu,个数l=6k=4。母亲、父亲和丈夫的教育水平应该与其自身的教育水平高度相关,但与其能力无关,因而与扰动项u不相关,满足工具变量的条件。Log(Wagei)=-0.187+0.043experi-0.00086experi2+0.08edui+ei(0.285)(0.013)(0.0004)(0.022)括号内为标准差。最优工作经验为0.043/(2*0.00086)=25年ie+udˆ0.08e+…erpˆ0.00086ex-erpˆ0.043ex+-0.187=)Log(wagei2iii四、内生性检验(Hausmantest)对于多元回归模型:tk221t++…++=uXXYktt假设工具变量为Z=(1Z2Z3Zl)。YXXXSLS'1'2ˆ)ˆˆ(2SLS估计量为:YXXXLS'1'O)(OLS估计量为:H0:01lim)(’uXnpiH1:01lim)(’uXnpi假定关注Xj的内生性,其他变量都是外生的。如果Xj也是外生的,则两种估计量都是一致的;但如果Xj是内生的,则OLS估计量不一致,而2SLS估计量是一致的。因而,零假设下两个估计量之差应该收敛于零,令:OLSSLSd2Hausman证明:)1,0(N~).(.adesd)1(~)(Var22add实际应用中,通常使用另一种等价形式进行内生性检验:第1步:将Xj对l个工具变量进行回归,Z=(1Z2Z3Zl),得到拟合值:+…++=ˆ221lltjZZX第2步:引入第1步的回归残差加入原始模型作为解释变量,估计如下模型:其中,第3步:对进行显著性检验:如果显著,拒绝原假设,Xj是内生的;如果不显著,接受原假设,Xj是外生的;t221+ˆ+…++=evXXYtktktt+…++-ˆˆ221lltjtZZXv注意:1.如果模型可能存在异方差,可以使用White异方差一致估计(或称为稳健估计)2.如果要对多个变量的内生性进行检验,可以分别对每一个待检验变量做第1步的回归,得到拟合值。将这些拟合值全部引入第2步的回归模型中,检验其系数的联合显著性。五、案例——中国居民人均消费函数例4.4.1在例2.5.1的中国居民人均消费函数的估计中,采用OLS估计了下面的模型:GDPPCONSP10由于:居民人均消费支出(CONSP)与人均国内生产总值(GDPP)相互影响,因此,容易判断GDPP与同期相关(往往是正相关),OLS估计量有偏并且是非一致的(低估截距项而高估计斜率项)。OLS估计结果:(13.51)(53.47)R2=0.9927F=2859.23DW=0.5503SSR=23240.7如果用GDPPt-1为工具变量,可得如下工具变量法估计结果:(14.84)(56.04)R2=0.9937F=3140.58DW=0.6691SSR=18366.5
本文标题:§44随机解释变量问题.
链接地址:https://www.777doc.com/doc-2832166 .html