您好,欢迎访问三七文档
第三章单方程计量经济学的统计检验与区间估计§3.1拟合优度检验§3.2方程总体线性显著性检验§3.3变量显著性检验§3.4参数估计量的置信区间§3.5预测值的置信区间a)统计检验的意义;b)拟合优度检验的意义和步骤;c)方程显著性检验的意义和步骤;d)变量显著性检验的意义和步骤;e)计算参数估计值的置信区间;f)计算预测估计值的置信区间。本章学习目的§3.1拟合优度检验(R检验)3.1.1、总离差平方和的分解3.1.2、判定系数3.1.3、修正的判定系数拟合优度检验,顾名思义,是检验模型对样本观测值的拟合程度3.1.1、总离差平方和的分解以一元线性回归方程为例将y的第i个观测值与样本均值的离差称为总离差,记为总离差可以分解作两部分,即:01ˆˆˆiiyxyyyiiyˆˆˆ+iiiiiiyyyyyyyey为观测值与回归值之差,称为残差,它是回归方程不可解释的部分为回归值与平均值之差,它是回归方程可解释的部分yxixiyieiyˆˆyiyySRFˆiiieyyˆˆiyyy总体平方和、残差平方和和回归平方和TSS为总体平方和(TotalSumofSquares),反映样本观测值总体离差的大小;ESS为回归平方和(ExplainedSumofSquares),反映由模型中解释变量所解释的那部分离差的大小;RSS为残差平方和(ResidualSumofSquares),反映样本观测值与估计值偏离的大小,也是模型中解释变量未解释的那部分离差的大小。TSS=RSS+ESS222)ˆ()ˆ()(iiiiYYRSSYYESSYYTSS3.1.2、判定系数总离差平方和分解公式表明,在总离差中,被样本回归模型解释的部分越多,则模型的拟合误差相对来说就越小。对于一组确定的样本数据,总离差平方和是一个确定的数值,因此,在总离差平方和中,如果回归平方和所占比例越大则残差平方和所占比例越小,表明回归直线与样本点拟合得越好。把回归平方和与总离差平方和之比作为衡量模型对样本拟合优度的指标,称为判定系数或可决系数,用表示,即:若,说明全部样本观察值均在估计的回归直线上,观察值与回归值完全拟合即,然而这种情况在现实中很少发生;2R21-ESSRSSRTSSTSS201R21Riyˆiyˆiiyy若,说明完全不拟合,即被解释变量,线性回归模型完全不能解释的变动;20Rˆiiyyiy越接近1,说明回归直线与样本观测值拟合程度越好。2R3.1.3、修正的判定系数在样本容量n一定的情况下,增加解释变量必定引起自由度减少。调整方法是将残差平方和与总离差平方和分别除以各自的自由度,排除变量个数对拟合优度的影响,从而达到以下两个目的:①使得拟合优度检验指标能够反映已被解释的离差与总离差的关系。②使得拟合优度检验指标能够反映自由度的个数。采用表示修正的判定系数:其中(n-k-1)为残差平方和的自由度,(n-1)为总离差平方和的自由度。显然,如果增加的解释变量没有解释能力,则对残差平方和的减小没有多大帮助,但增加待估参数的个数,从而使有大幅度下降修正的判定系数与未经修正的判定系数存在如下关系:2R2111RSSnkRTSSn2R221111nRRnk特殊的,当多元线性模型中只有一个解释变量时也称一元线性模型,在计算判定系数时可以不必考虑解释变量个数对拟合优度的影响,直接使用未经修正的判定系数即可。在第二章例题2.2中,杨立乾同学为自己的水果店建立了计量经济学模型用来模拟水果店销售额的变动情况,为了评估所建模型与他所收集的样本数据是否拟合?拟合的程度的高低?杨同学决定对模型进行一次拟合优度检验,根据课堂所学知识进行计算,杨立乾得到的拟合优度为0.893,可以说模型拟合的结果是令人满意的,但还没有达到完全拟合的程度,仍存在部分样本点不能被模型解释的情况,说明该模型还存在改进空间。具体计算过程如下。例3.1对水果店经营模型的拟合优度检验5.25.185.115.485.47.261XX75.0ˆ25.15.106108ˆYXBYYeeRSS284510822ynYYTSS由例2.2可得拟合优度的计算21.5110.946428ESSRSSRTSSTSS893.0281515.135111111-1TSSRSS-12TSSnRSSknR§3.2方程总体线性显著性检验(F检验)关于假设检验假设检验是统计推断的一个主要内容,它的基本任务是根据样本所提供的信息,对未知总体分布的某些方面的假设作出合理的判断。假设检验的程序是,先根据实际问题的要求提出一个论断,称为统计假设;然后根据样本的有关信息,对假设的真伪进行判断,作出拒绝或接受假设的决策。假设检验的基本思想是概率性质的反证法。概率性质的反证法的根据是小概率事件原理,该原理认为“小概率事件在一次试验中几乎是不可能发生的”。进一步根据数理统计学中的定义,如果构造一个统计量由于服从正太分布,根据数理统计学中的定义,的一组样本的平方和服从分布。所以有:即回归平方和、残差平方和分别服从自由度为k和(n-k-1)的F分布。FESSkRSSnk()1则该统计量服从自由度为(k,n-k-1)的F分布。iY22222ˆˆ1iiiESSYYkRSSYYnk2对ESS、RSS,应用数理统计知识可以证明它们是服从各自自由度的分布,即1~R~22knSSkESS因此,统计量1ESSkFRSSnk服从第1个自由度为,第2个自由度为的F分布。于是,可以利用统计量F对回归方程的总体显著性进行检验,这就是应用普遍的F检验。现有多元线性回归方程模型:iikkiiixxxY22110ni,,2,1方程的显著性检验(F检验)步骤如下:①提出假设:0H120k②根据样本观测值及回归值计算统计量F,给定显著性水平,查F分布表,得到临界值。(,1)Fknk③如果,则拒绝,判定回归方程总体线性关系在概率水平下显著成立;如果,则接受,判定该回归方程在概率下无显著意义。FF0HFF0H(1)(1)拟合优度检验和方程显著性检验是从不同原理出发的两类检验,前者是从已经得到估计的模型出发,检验它对样本观测值的拟合程度,后者是从样本观测值出发检验模型总体线性关系的显著性。关于拟合优度检验与方程显著性检验关系的讨论)1/()1/(12nTSSknRSSRFESSkRSSnk()1RnnkkF2111可见,F与R2同向变化:当R2=0时,F=0;当R2=时,F为无穷大;R2越大,F值也越大。因此,F检验是所估计回归总显著性的一个度量,也是对R2的显著性检验例3.2对水果店经营模型的F检验在例题3.1中,杨立乾同学对水果店的计量经济学模型进行了拟合优度检验,检验结果为0.893,拟合程度较好,但是还存在改进空间。于是,杨同学决定继续对模型进行方程总体线性的显著性检验(F检验),检测在95%的置信水平下模型中选取的两个解释变量“当日客户流量”及“水果品种数量”联合起来对被解释变量“当日销售额”有无显著影响。解:提出假设:计算统计量在的显著水平下,查F分布表得显然0:210H7.171255.125.12811knRSSkRSSTSSknRSSkESSF05.000.192,21,05.005.0FknkFF05.0FF§3.3变量显著性检验(t检验)对于多元线性回归方程,如果模型通过了F检验,则表明模型中所有解释变量对被解释变量的“总体影响”是显著的,但这并不意味着模型中的每一个解释变量对被解释变量都有着重要影响,或者说并不是每一个解释变量的单独影响都是显著的。如果某个解释变量对被解释变量的影响并不显著,则可以将它从方程中剔除,重新建立更为简单的方程。因此,我们需要对线性回归方程中的解释变量进行显著性检验。变量显著性检验即对回归系数的显著性进行检验,如果变量是显著的,那么回归系数应该显著地不为0。于是,在变量显著性检验中设计的原假设为:H0:i=0而备择假设为:H1:i0其中的下角标i,在一元回归模型中取值1:在二元回归模型中取值1、2。以代表矩阵的主对角线上的第元素,则有然后根据前面的学习推导出参数的估计量方差:12ˆ()VarXX2,ˆ,1,2,,jjjVarcjk因为为无偏估计量,,因此服从如下正态分布jˆjjEˆjˆ2,ˆ~,jjjjNc即2,ˆ~0,1jjjjNc可以证明,当以代替后,可构造统计量21eenk2t,ˆ~11jjjjttnkeecnk可令ˆ,1jjjeecSnk该统计量服从自由度为(n-k-1)的t分布,通过构造t统计量来检验假设的方法称为t检验。它是变量显著性检验中应用最多的一种方法。0j变量显著性检验的步骤如下:①提出假设::0H0j②计算统计量,给定显著性水平查自由度为的分布表,得到临界值。jStjjˆˆ1kn2t1kn③若,则拒绝原假设,判定在显著性水平下不为零,也就是解释变量对被解释变量的影响是显著的;反之,若,接受原假设解释变量对被解释变量的影响是不显著的。12kntt0Hj1jx12kntt0Hjx例3.3对水果店经营模型的t检验在例题3.2中,杨立乾同学对水果店的计量经济学模型进行了在概率水平95%下的F检验,检验结果为,回归方程的线性关系不是显著成立的。为了检测出到底是哪一个解释变量选取的不恰当,杨同学继续对模型进行变量的显著性检验(t检验),检测一下在80%的概率水平下模型中选取的两个解释变量“当日客户流量”及“水果品种数量”分别对被解释变量“当日销售额”有无显著影响。05.0FF对于,提出假设:分别对和进行显著性检验1X2X1X0:10H计算统计量887.2175.05.2ˆ1ˆ1St在的显著水平下20.0886.12122.02tknt得到22tt2X0:20H对于,提出假设计算统计量10.15.275.05.1-ˆ2ˆ2St886.1211.02tknt得到22tt§3.4参数估计量的区间估计问题的提出线性回归模型的参数估计量是随机变量,利用一次抽样的样本观测值,估计得到的只是参数的一个点估计值。如果用参数估计量的一个点估计值近似代表参数值,那么,二者的接近程度如何?以多大的概率达到该接近程度?这就要构造参数的一个区间,以点估计值为中心的一个区间(称为置信区间),该区间以一定的概率(称为置信水平)包含该参数。已知若给定置信水平,根据t分布表得到临界值,那么t落在的概率是。ˆˆ~1jjjttnkS12t22,tt12222ˆˆˆ221ˆ1ˆˆ1jjjjjjjjPtttPttSPtStS根据上述推导过程可知,在置信水平下,的置信区间是:ˆˆ22ˆˆ,jjjjtStS1j例3.4计算水果店经济模型各个参数的置信区间在例题2.2中,杨立乾同学为水果店建立的计量经济学模型为,其中的参数,和是利用最小二乘法的原理估算出来的。现在,杨同学想知道这三个估算出来的参数分别与各自的真实值相差多少。(置信水平为90%)215.15.24ˆXXY012给定置信水平为90%,可知,又有已知的样本容量n=5,k=2,查t分布表可得
本文标题:计量经济学基础+机械工业201507+刘家国+第3章+单方程计量经济学的统计检验与区间估计
链接地址:https://www.777doc.com/doc-2046022 .html