您好,欢迎访问三七文档
2ˆ1.同方差、异方差㈠同方差:回归模型中的随机误差项的方差相同①由于假定了X值(解释变量)是给定的或非随机的,Y的变异仅来源于u(扰动误差项).因此,给定的Xi,Yi的方差与Ui的方差相同.简言之,Yi与Ui的条件方差相同,即σ2.②假定扰动误差项Ui的方差为常数,或同方差,即var(Ui)=σ2.该假定表明,与给定X相对应的每个Y的条件分布具有同方差,即每个Y值以相同的方差分布在其均值周围.㈡异方差:①定义:模型误差项随观察值的不同而变化.var(Ui)=σi2≠常数;②研究发现,异方差问题多存在于截面数据而非时间序列数据.在截面数据中,处理的是某个时点上的样本,例如个体消费者或家庭/企业/行业/州县市.且这些样本规模不同,如小/中/大公司,低/中/高收入,即可能存在规模效应;③如果CLRM其他假定保持不变,放松同方差假定,异方差则有如下后果:⑴OLS估计量仍是线性的/无偏的/不再具有最小方差性,即不再有效的,无论样本大小,OLS估计量都不再是最优线性无偏估计量.⑵OLS估计量的方差通常是有偏的.OLS高估了估计量的真实偏差,产生正的偏差;低估则负偏差.⑶偏差的产生是由于即不再是真实σ2的无偏估计量.⑷建立在t分布和F分布之上的的置信区间和假设检验是不可靠的.沿用传统的假设检验方法可能得出错误结论.④检验异方差方法:⑴图形法:残差平方图,通常检验回归模型是否符合经典线性假设的第一步⑵帕克检验⑶格莱泽检验:⑵⑶将图形正规化,其通过假设解释变量同误差项之间的关系来检验模型中是否存在异方差问题⑷怀特的一般异方差检验:用普通最小二乘法估计回归方程,做辅助回归,求辅助回归方程的R2值,χ2值超过临界值或P值很低,则拒绝零假设:不存在异方差.⑤异方差的补救措施:⑴当σi2已知时,加权最小二乘法⑵当σi2未知时,情形1误差方差与Xi成比例用平方根变换,情形2误差方差与Xi2成比例用OLS法估计方程⑶重新设定模型.2.完全多重共线性(近似)㈠完全多重共线性:是指两个或两个以上解释变量之间存在多个精确的线性关系.①当解释变量之间完全线性相关或完全多重共线性时,不可能得到所有参数的唯一估计值,因而也就不能根据样本进行任何统计推断(即假设检验)。②在完全多重共线性情况下,不可能对多元回归模型中的单个回归系数进行估计和假设检验.可以得到原始系数线性组合的一个估计值,但无法获得每个系数的估计值.㈡近似/(不完全)多重共线性:是指两个或两个以上解释变量之间常常表现出不完全线性相关,但近似线性相关,即共线性程度很高但不是完全共线性.(回归系数标准误差趋大,T值趋小);在只有两个解释变量的情况下,相关系数可用于共线性程度的度量.但当解释变量多于两个时,相关系数则不适合用于度量共线性程度.㈢多重共线性的理论后果:①在古典线性回归模型(CLRM)的假定下,即使存在变量之间的多重共线性,OLS估计量仍然是最优线性无偏估计量,即使多元回归方程的一个或多个偏回归系数是统计不显著的;②多重共线性通常是一个样本特有的现象.㈣多重共线性的实际后果:①OLS估计量的方差和标准误较大;②置信区间变宽;③t值不显著;④R2值较高,但t值并不都是统计显著的;⑤OLS估计量及其标准误对数据的微小变化非常敏感,即它们很不稳定⑥回归系数符号有误;⑦难以评估各个解释变量对回归平方和(ESS)或者R2的贡献.㈤多重共线性的诊断:①是一个样本现象,是一个程度问题而不是存在与否问题;由于多重共线性针对的是解释变量是非随机的情形,因而它是一个样本特征,而不是总体特征.②判断:R2较高但t值统计显著的不多/解释变量两两高度相关,若有两个变量之间的相关系数很高,比如超过0.8,则可能存在较严重的共线性,但这一标准并不十分可靠/检查偏相关系数/从属回归或者辅助回归/方差膨胀因子(多重共线性本身并不必然导致较高的标准误).㈥补救措施:从模型中删掉一个变量/获取额外的数据或新的样本(随着样本容量的增加,三变量回归模型的系数方差会减小)/重新考虑模型/参数的先验信息/变量变换.2/..iedf3.t统计量以及t检验、F统计量以及F检验、DW统计量以及DW检验㈠t统计量以及t检验:①t统计量:用来对计量经济学模型中关于参数的单个假设进行检验的一种统计量.一般的t统计量写成t=(估计值-假设值)/标准误,它服从自由度为(n-2)的t分布.②t检验:给予t分布的统计假设检验过程.需注意:对于双变量模型自由度为(n-2)/在经验分析中常用的显著水平α有1%、5%、10%.为了避免选择显著水平的随意性,通常求出p值,如果计算的p值充分小,则拒绝零假设/可用单边或双边检验.③变量的显著性检验:主要针对变量的参数真值是否为零来进行显著性检验的,以判断X是否对Y具有显著的线性性影响.即H0:1=0④检验步骤:⑴对总体参数提出假设:H0:1=*,H1:1*(*通常等于0)⑵以原假设H0构造t统计量,并由样本计算其值:⑶给定显著性水平,查t分布表,得临界值⑷比较判断:双边检验t/2(n-2),当|t|t/2(n-2),则拒绝H0;当|t|t/2(n-2),则不拒绝H0.单边检验t(n-2),右侧检验tt(n-2)或左侧检验tt(n-2),则拒绝H0.⑤在双边检验中,t=5.4354所对应的P值约为0.0006.说明如果在该P值水平上拒绝零假设,则犯错的概率仅为万分之六.㈡F统计量以及F检验:①F统计量:在满足CLRM基本假定,零假设下:H0:B2=B3=0(所有的斜率系数都为0,注意无B1),可证变量右式,服从分子自由度为(k-1),分母自由度(n-k)的F分布.②F检验:给定显著性水平α,可得到临界值Fα(k-1,n-k),求出统计量F的数值,通过F﹥Fα(k-1,n-k)或p给定的α,拒绝原假设H0,,或F﹤Fα(k-1,n-k),接受原假设H0.③F检验的理论原理:若右式中分子比分母大,即如果Y由回归解释的部分(即由X2和X3解释的部分)比未被回归解释的部分大,则F值将大于1.因此,随着解释变量对应变量Y变异的解释比例逐渐增大,F值也将逐渐增大.因此,F值越大,则拒绝零假设的理由越充分:两个(或多个)解释变量对应变量Y无影响.④F与R2之间的重要关系:n为观察值的个数,k为包括截距在内的解释变量的个数.F与R2同方向变动.当R2=0(即Y与解释变量X不相关)时,F=0.R2值越大,F值也越大.当R2取其极限值1时,F值趋于无穷大.对于总体回归方程的显著性的F检验可以采用R2的形式,方差分析表等价地表示为下表:㈢DW统计量以及DW检验:①德宾-沃森统计量:残差递差的平方和与残差平方和的比值.在计算d统计量分子时,其样本容量为(n-1),因在求残差递差时失去了一个观察值.d统计量的一个最大优点是简单易行,它以OLS残差为基础.0≤d≤4②d统计量的假设:⑴回归模型包括截距项,无法判断过原点回归模型的自相关问题;⑵变量X是非随机变量,即在重复抽样中变量X取值是固定的;⑶扰动项Ui的生成机制为Ut=ρut-1+vt,-1≤ρ≤1.ρ度量了对前期值的依赖程度,称为自相关系数;⑷解释变量中不包含应变量的滞后值.③如果d值接近于0,则表示存在正的自相关;如果接近于4,则表示存在负的自相关;d值越接近于2,则表示越倾向于无自相关.(ρ=-1、0、1→d=4、2、0.)④DW检验步骤:⑴进行OLS回归并获得残差ei;⑵计算d值;⑶根据样本容量及解释变量的个数,从D-W表中查到临界的dL和dU;⑷根据规则进行判定.1*1ˆˆ-=tS估计量假设值估计量的标准误2222()nbBttseb)2(~ˆˆˆ1ˆ112211ntSxti~23XX/../(1)/../()ESSdfESSkFRSSdfRSSnk由和解释的变异未解释的变异22/(1)(1)/()RkFRnk2112222112()ˆ212(1)nnttttttnntttteeeedee4.内生变量、外生变量、前定变量、滞后变量、虚拟变量㈠内生变量:是由模型体现的经济体系本身所决定的,在模型中是随机变量的变量,内生变量受模型中其它变量的影响,也可能影响其它内生变量,即内生变量既可以是被解释变量,也可以是解释变量.内生变量受模型内随机误差项的影响,是随机变量.㈡外生变量:一些变量是在模型体现的经济体系之外给定的,在模型中是非随机的.由模型系统以外的因素决定其取值的变量,独立于该变量所在方程前期、当期、未来各期随机误差项的变量.外生变量只影响系统内的其它变量,而不受其它变量的影响,因此在方程中只能做解释变量,不能做被解释变量.由定义可看出,外生变量不受模型中随机误差项的影响.㈢前定变量:是指独立于变量所在方程当期和未来各期随机误差项的变量.由定义可知,外生变量属于前定变量,另外还有一类变量也属于前定变量,即滞后的内生变量,因为滞后的内生变量仅与方程前期的随机误差项相关而与方程当期、未来各期的随机误差项无关.前定变量也只能在现期的方程中做解释变量,并且不受随机误差项的影响.㈣滞后变量:是指过去时期的、对当前被解释变量产生影响的变量.滞后变量分为滞后解释变量与滞后被解释变量.把滞后变量引入回归模型,这种回归模型称为滞后变量模型.①滞后的原因:心理上(惯性)/技术上(新旧更替时旧的降价)/制度上.②滞后变量模型一般形式为下式,s/p分别为滞后解释变量和滞后被解释变量的滞后期长度。011221122ttttststtqtqtYXXXXYYYu③被解释变量受解释变量的影响分布在解释变量不同时期的滞后值上,即模型形如下式:具有这种滞后分布结构的模型称为分布滞后模型,其中s为滞后长度.根据滞后长度s取为有限和无限,模型分别称为有限分布滞后模型和无限分布滞后模型;④如果滞后变量模型的解释变量仅包括自变量X的当期值和被解释变量的若干期滞后值,即模型形如下式,则称这类模型为自回归模型,其中q称为自回归模型的阶数.㈤虚拟变量①定义:把定性因素“定量化”的一个方法是建立人工变量,并赋值0和1,0表示变量不具备某种性质,1表示变量具备某种性质,这类取值为0和1的变量成为虚拟变量,也称定性变量,用字母D表示.②设置规则:⑴“0”和“1”选取原则.虚拟变量取“0”值通常代表比较的基础类型,称为基准类、基础类、参照类、比较类;而虚拟变量取“1”值通常代表被比较的类型.⑵属性(状态、水平)因素与设置虚拟变量数量的关系.定性因素的属性既可能为两种状态,也可能为多种状态.例如,性别(男、女两种)、季节(4种状态),地理位置(东、中、西部),行业归属,所有制,收入的分组等。⑶虚拟变量在回归分析中的角色以及作用等方面的问题.若定性因素具有m个(m=2)相互排斥属性(或几个水平),当回归模型有截距项时,只能引入m-1个虚拟变量;当回归模型无截距项时,则可引入m个虚拟变量;否则,就会陷入“虚拟变量陷阱”,即完全共线性或多重共线性.xy10ˆˆ5.OLS(普通最小二乘法)的原则及其代数性质㈠线性回归的OLS:①OLS:通过样本数据按照残差平方和最小的原则来估计总体回归模型中的参数的方法②因可正可负,所以可以取最小,即min③理想的估计方法应使与的差即剩余越小越好④OLS估计量的数值性质:⑴用OLS法得出的样本回归线经过样本均值点,即:⑵残差的均值()总为0;⑶对残差与解释变量的积求和,其值为零;即这两个变量不相关.这条性质也可用来检查最小二乘法计算结果;⑷对残差与(估计的Yi)的积求和,其值为0;即为0.㈡线性回归OLS估计量的方差与标准误:⑴期望:⑵方差:;⑶标准误:;①一旦知道了σ2,就可以根据上式计算各统计量的方差等,但一般情况下σ2是一个需要估计的参数.常常根据右式估计σ2:为残差平方和RSS;(n-2)为自由度,,为回归标准误(SER),常用来度量估计回归线的拟合优度.值越小,Y的实际值越接近
本文标题:计量经济学重点整理
链接地址:https://www.777doc.com/doc-2091768 .html