您好,欢迎访问三七文档
第二章简单回归模型•简单回归模型的定义•普通最小二乘法的推导•OLS的操作技巧•度量单位的函数形式•OLS估计量的期望值和方差•过原点回归计量12.1简单回归模型的定义•回归模型的基本形式:•简单回归模型的基本形式:称为一元线性总体回归模型。()yfxuuxy10简单回归模型的定义•简单回归模型定义的几个讨论–公式变量与参数的解释–用x解释y时面临的三个问题–该公式的不足–该公式的假设计量3简单回归模型的定义——公式变量与参数的解释•Y:被称为因变量(dependentvariable)、被解释变量、被预测变量、回归子•X:被称为自变量(independentvariable)、解释变量、预测变量、回归元、协变量•u:为随机扰动项或随机误差项,表示除x以外其他因素对y的影响。•β0和β1为两个待定参数。从几何意义上讲,为直线的截距;为直线的斜率(又称斜率系数)。计量4简单回归模型的定义——用x解释y时面临的三个问题计量5•x能否来解释y的变化?x和y存在着怎样的相关关系?•既然两个变量间没有一个确切的依存关系,应该如何考虑x以外的其他因素对y的影响?•如何确定是在其他条件不变的情况下描述x和y的关系形式?简单回归模型的定义——该公式的不足计量6简单回归模型的定义——该公式的假设spring2012计量7(|)()0iEuxEu1要使得固定,需要施加一个约束:表明:•u中不包含系统性的影响因素,既没有变量遗漏问题,解释变量也不存在系统的测量误差,模型函数形式设定正确。•u均值独立于解释变量随机变量x和u不相关的三个层次:•“独立”:意味着对于x、y和的任意可测函数和,有•“均值独立”:意味着•“线性无关”:意味着()gu()fxcov[(),()]0gufx=cov[,()]0ufx=cov(,)0ux=spring2012计量9简单回归模型的定义——该公式的假设计量10..x1x2E(y|x)=0+1xyf(y)计量1111每月家庭可支配收入X2000250030003500400045005000550060006500131215301631184320372277246929243515352113401619172619742210238828893338372139541400171317862006232525263090365038654108每1548175018352265241926813156380240264345月1688181418852367252228873300408741654812家173819851943248526653050332142984380庭180020412037251527993189365443124580消19022186207826892887335338424413费220021792713291335344074支231222982898303837104165出2316292331673834Y238730533310249831873510268932861591191520922586275430393396385340364148()iEYX假如已知由100个家庭构成的总体的数据(单位:元)12消费支出的条件期望与收入关系的图形)(iXYE2.2普通最小二乘法的推导计量13最小二乘法是法国数学家勒让德(A.M.Legendre,1752-1833)于1805正式提出的,但他的研究没有涉及到误差分析问题。这一缺陷由德国数学家高斯(C.F.Gauss1777-1855)于1809年发布的正态误差理论补足,加上高斯宣称自1799年以来他一直使用在这种方法,许多人将最小二乘法的发明权归之于高斯。总体回归线和总体回归函数计量14E(y|x)=0+1xxy对于实际的经济问题,通常无法掌握所有总体单位的数值,总体回归函数实际上是理论上存在,又称理论回归方程样本回归方程•通过对样本观测获得的信息去估计总体回归函数•如果变量x和y之间存在线性相关关系,对于任意抽取的若干个观测(样本)点(),有称为样本回归模型•由两部分组成:系统分量和随机分量系统分量,iixy01ˆˆiiiyxeˆiy01ˆˆix样本回归函数与总体回归函数的区别•总体回归函数虽然未知,但它是确定的(PRF唯一);•样本回归线随抽样波动而变化,每次抽样都能获得一个样本,就可以拟合一条样本回归线,(SRF不唯一);•样本回归线只是样本条件均值的轨迹,还不是总体回归线,它至多只是未知的总体回归线的近似表现样本回归函数与总体回归函数的关系•SRF1••*•*SRF2•*••**••••*yxPRF样本回归函数的函数形式应与设定的总体回归函数的函数形式一致如果能够通过某种方式获得和的数值,显然:●和是对总体回归函数参数和的估计●是对总体条件期望的估计●在概念上类似总体回归模型中的,可视为对的估计。18对比:总体回归函数样本回归函数1ˆ0ˆˆiyieiuiu10()iEyx1ˆ0ˆ01()iiEyxx01iiiyxu01ˆˆˆiiyx01ˆˆiiiyxe对样本回归的理解普通最小二乘法(OLS)(OrdinaryLeastSquares)•经典计量经济学最常采用的参数估计方法•它是建立在一个简单的估计准则——最小二乘准则之上的•可以看出•最小二乘准则是使全部观测值的残差平方和为最小,即01ˆˆˆiiiiieyyyxminQ2ie201ˆˆ()iiyx==•由微积分求极值的原理知,要使达到最小,必要条件是对和的一阶偏导数等于零:Q0ˆ1ˆQ010011ˆˆ2()0ˆˆˆ2()0ˆiiiiiQyxQyxx0101ˆˆ()0ˆˆ()0iiiiiyxyxx即、应满足下列方程组:0ˆ1ˆ这两个方程分别相当于0,0,iiieex•经整理后得正规方程组•解得:01201ˆˆˆˆiiiiiiynxxyxx122201()()ˆ()()ˆˆiiiiiiiiinxyxyxxyynxxxxyx0ˆ1ˆ•由此估计出的和称为参数的最小二乘估计量(OLSE)•除了OLS以外,参数估计的方法还有最大似然估计(ML)方法、矩估计方法(MM)等基于条件期望为0的普通最小二乘法的推导•由E(u)=0得E(y–0–1x)=0对于给定的数据样本,有可得0ˆˆ1101niiixynxyxy1010ˆˆˆˆ•由cov(x,u)=E(xu)=0得E[x(y–0–1x)]=0对于给定的数据样本,有计量23niiiniiniiiniiiniiiixxyyxxxxxyyxxxyyx1211111111ˆˆ0ˆˆ0ˆˆ1101niiiixyxn计量24下0在假设前提ˆ121211niiniiniiixxxxyyxxxy10ˆˆ易得:2.3OLS的操作技巧计量25•拟合值与残差•OLSE的代数性质•拟合优度拟合值和残差•拟合值:定义y在x=的拟合值为•残差:观察值与其拟合值的差。•为正,则回归线低估了;为负则回归线高估了;无数据点是必须在回归线上。ixixy10iˆˆˆiiixyu10ˆˆˆiyiyiyOLS统计量的代数性质•OLS残差和及其样本均值均为零–代数表示–由OLS的一阶条件得出计量270ˆ1niiu0ˆˆ1101niiixynOLSE的代数性质•回归元和OLS残差的样本协方差为零–代数表示–由OLS的一阶条件得出计量280ˆ1niiiux0ˆˆ1101niiiixyxnOLSE的代数性质•OLS回归线过样本几何中心–代数表示•拟合值的样本均值与的均值相等•拟合值与残差之间的样本协方差为0计量29xy10ˆˆ),(yxiyiiyyˆ0)ˆ,ˆcov(iiuy拟合优度•定义–总平方和SST•–解释平方和SSE•–残差平方和SSR•计量30ˆ2yyi2yyiˆ2iu拟合优度•SST=SSE+SSR的证明计量31,所以得证0ˆˆ又因为SSEˆˆ2SSRˆˆˆ2ˆˆˆˆˆ22222yyuyyuyyyyuuyyuyyyyyyiiiiiiiiiiiiii拟合优度•拟合优度(又称判定系数)–我们定义R2=SSE/SST=1–SSR/SST为拟合优度,又称判定系数,总是介于0到1之间–一个接近于1的判定系数表明OLS给出了一个良好的拟合,一个于0的判定系数表明OLS给出了一个糟糕的拟合计量322.4度量单位和函数形式•改变度量单位对OLS统计量的影响•在简单回归中加入非线性因素•“线性”回归的含义计量33改变度量单位对OLS统计量的影响•、的计量单位、的经济含义是什么?•X单位改变,y不变,影响,不影响y单位改变,不管X是否变化,影响、•如果定义roedec=roe/100,那么样本回归线将会从(estimatedsalary)=963.191+18.501roe改变到(estimatedsalary)=963.191+1850.1roedec计量3401010110在简单回归中加入非线性因素•非线性因素的必要性:线性关系并不适合所有的经济学运用•通过对因变量和自变量进行恰当的定义,我们可以在简单回归分析中非常容易地处理许多y和x之间的非线性关系–例子:工资—教育模型,计量35自然对数形式计量36计量37•变量非线性模型中的斜率:线性模型边际贡献线性---对数模型半弹性对数---线性模型半弹性对数---对数模型弹性•经济学中的例子(x代表投资,y代表GDP)uxyuxyuxyuxyln3.131.0ln115.067.0lnln12029887.0368OLS估计量的期望值和方差•OLS的无偏性•OLS估计量的方差计量38OLS的无偏性•我们首先在一组简单假定的基础上构建OLS的无偏性。假定SLR.1线性于参数在总体模型中,因变量y与自变量x的误差项u的关系如下:其中,和分别表示总体的截距和斜率参数。计量3901yxu01OLS的无偏性假定SLR.2随机抽样我们具有一个服从从整体模型方程的随机样本{:i=1,2…n},其样本容量为n.(更强假定:x非随机或固定,y独立同分布)计量4001yxu),(iiyxOLS的无偏性假定SLR.3解释变量的样本有变异x的样本结果即{,i=1,…,n}不是完全相同的数值。计量41ix0)()var(2nxxxOLS的无偏性假定SLR.4零条件均值(或称严格外生假定、均值独立假定)给定解释变量的任何值,误差的期望值都是零。换言之,E(u|x)=0恒成立。暗含以下两个假定:1.随机项的条件均值等于无条件均值,随机项u均值独立于所有解释变量。2.表明模型函数形式设定正确,即不存在函数形式设定偏误,内有变量遗漏问题,解释变量也不存在系统的测量误差。计量42OLS的无偏性•定理2.1在SLR.1-SLR.4下,对的任何值,我们都有,换言之公式的推导:引理:计量4310和0011(),()EE0011,对而言是无偏的对而言是无偏的1(1)(-)0niixx1111(2)(-)()(-)()(-)nnnniiiiiiiiiiixxyyxxyxnxyxxy1111(3)()()()()(-)nnnnxiiiiiiiiiiiSST
本文标题:计量经济学第二章.
链接地址:https://www.777doc.com/doc-2046055 .html