您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 计量经济学重点笔记第三讲
浙江工商大学金融学院姚耀军讲义系列1第三讲假设检验一、经典线性模型假定对于模型01iiiyx,利用OLS有:112()ˆ()iiixxxx其证明可参见第二讲附录。在高斯-马尔科夫假定下,OLS估计量的抽样分布完全取决于误差项的分布。在高斯-马尔科夫假定中,我们要求误差项是序列无关与同方差的。现在,我们施加更强的假定,即误差项服从正态分布,即2(0,)iN。应该注意到,当误差项服从正态分布时,序列无关与独立性是等价的。因此,我们可以把上述分布假设写为:..2(0,)iidiN,即误差项服从独立同正态分布。为什么要施加更强的假定呢?这是为了进行小样本下的假设检验。2(0,)iN与高斯-马尔科夫假定一起,被称为经典线性模型假定。在经典线性模型假定下,可以证明,OLS估计量是方差最小的无偏估计量(注意此时不需要把比较范围限制在线性估计量之中,因此该结论比高斯-马尔科夫定理更强。施加更多的假设而得到更强结论,这非常自然!)。笔记:浙江工商大学金融学院姚耀军讲义系列21、假设误差项服从正态分布的合理性在于,误差项是由很多因素构成的,当这些因素是独立同分布时,依照中心极限定理,那么这些因素之和应该近似服从正态分布。当然,这并不意味着用正态分布来近似误差项的分布总是恰当的,例如,各因素或许并不同分布。另外,如果y是价格这样的变量,那么假设误差项服从正态分布是不合理的,因为价格不可能是负数,不过我们可以进行变量变换,例如对价格取自然对数或者考察价格的变化率,那么经过变量变换之后,或许再假设误差项服从正态分布就变得合理了。2、如果能够对误差项是否服从正态分布进行检验,那最好不过了。一种常用的检验方法是Jarqe-Bera检验,这可以参见相关的教科书。问题是,尽管我们能观察到解释变量、被解释变量的取值,然而,由于对参数的真实取值无法确定,因此误差是观测不到的,我们或许不得不利用残差来代替误差以进行相关的检验。当然,一个前提是残差确实是对误差的良好近似,这进而要求,我们对参数的估计是合理的。3、根据公式:111221()()1ˆ()()iiiiiiNxxNxxxxxx考虑x非随机这种简单情况,显然,当样本容量很大时,只要误差项是独立同分布的(并不需要要假定误差项服从正态分布),那么根据中心极限定理,1ˆ应该近似服从正态分布。当然,为浙江工商大学金融学院姚耀军讲义系列3了保证误差项的独立性,抽样的随机性十分关键。二、利用标准正态分布作假设检验假定01iiiyx是真实模型,当然我们并不知道各参数的真实值是多少。如果某一经济经济理论预言1,而现在你手中正掌握一样本,一个问题是,你所掌握的样本支持这个预言吗?笔记:由于抽样误差的存在,1ˆ恰好等于的概率很小。然而,即使1ˆ,我们也不能说理论被证实,因为计量经济学方法本质上是属于归纳法,并且由于其结论是基于某一样本而得到的,因此它还是属于不完全归纳,故,计量经济学不能证实经济学理论。当然,计量经济学也不能推翻经济学理论。经济学理论是逻辑推导,其正确与否需要从逻辑入手。总而言之,我们能够说的是“样本是否支持某个理论的预言”或者“样本与某个理论的预言是否一致”。在经典线性模型假定下,1121ˆˆ(,)N或者浙江工商大学金融学院姚耀军讲义系列4111ˆˆ()/()(0,1)sdN①,其中122ˆ2()ixx,112ˆˆ()sd。练习:确定0ˆ的分布。现在,假设经济理论的预言是正确的,那么针对特定的样本你将得到标准正态分布图横坐标上的一个点:11ˆˆ()/()sd②。现在来考察标准正态分布。在该分布上,存在对称的两点:0.025z与0.025z,其中:0.0250.025Pr()Pr()0.025ZzZz如果把概率为5%的事件称为小概率事件,那么,当11ˆˆ()/()sd的取值大于0.025z或者小于0.025z时,我们认为小概率事件发生了!小概率事件一般是不容易发生的,现在居然发生了,因此,我们应该怀疑上述经济理论所作出的预言。①定义111ˆˆz()/()sd,则z就是所谓的z统计量。估计量是用来估计真实参数的,而统计量是用来做统计推断(或者假设检验)的;统计量是随机的,其分布也被称为抽样分布,针对特定样本,我们得到统计量值,它是非随机的。②在这里,该式是非随机的,而特别应该注意的是,分子中的1ˆ是估计值,而分母中的1ˆ是估计量。估计值的标准差是零!。浙江工商大学金融学院姚耀军讲义系列5笔记:举一个生活中的例子。我预先认为某一个同学十分优秀。优秀学生某一次考试考砸了非常正常,然而连续十次考试考砸了就应该是小概率事件了。如果我预先所认为的那一个优秀同学确实连续十次考试都考砸了,我是不是应该对我的先验判断产生怀疑?当然,如果我就此认为那一个同学并不优秀,我也会犯错误,此即“第一类错误”,即“弃真”的错误。但犯这个错误的概率是很小的。如果优秀学生连续十次考试考砸了其概率是5%,那么我犯“第一类错误”的概率就是5%。问题是,为什么我们取正态分布两端的区间作为小概率区间呢?为什么我们不在正态分布密度曲线中随意取一小段作为小概率区间?从直觉上看,当1这个假设为真时,即使估计值1ˆ与完全相等不太可能,但估计值1ˆ应该接近于。然而我们也要注意到,对1的估计还存在精确性问题,这通过1ˆ统计量的标准差体现出来。也就是说,在原假设为真时,即使估计值1ˆ与有一定的差异,然而如果1ˆ()sd较大,那么在1ˆ与间存在一定的也许是正常的。不过总的来看,当原假设为真时,z浙江工商大学金融学院姚耀军讲义系列6统计量值是应该接近于0的,这要么是因为11ˆˆ()/()zsd中的分子确实接近于0,要么是因为尽管1ˆ与有一定的差异,但主要是由1ˆ()sd较大所引起的。当z统计量值与0具有较大差异时,那么1这个假设的真实性是值得怀疑的!假设检验的正式步骤是:(1)建立原假设与备择假设:0111::HH笔记:原假设与备择假设互斥;假设体系应该是完备的,即原假设与备择假设两者之一必为真,但两者不能同时为真。(2)确定小概率标准a。经常我们把1%、5%或者10%作为小概率标准。对a更加正式的称呼是“显著水平”。(3)考察统计量值11ˆˆ()/()sd是否落在拒绝域:/2/2(,][,)aazz之内。如果落在上述区间之内,那么在a显著水平上,我们拒绝原假设,接受备择假设;反之,我们不拒绝原浙江工商大学金融学院姚耀军讲义系列7假设,拒绝备择假设。笔记:1、为什么当统计量值落在拒绝域/2/2(,][,)aazz之外时我们说“不拒绝原假设”而不是说“接受原假设”?其解释是:我们可以作出很多的原假设,例如11或者12而我们所计算出来的一些统计量值恰好都落在/2/2(,][,)aazz之外,难道我们既接受11也接受12?显然更恰当的表达方式是,即不拒绝11也不拒绝12。2、“接受原假设”没有留有余地,而“不拒绝原假设”表明我们的结论是留有余地的,即,在另外的原假设下也可能不拒绝12。“接受备择假设”留有余地吗?应该注意到,备择假设是11:H,因此,即使说“接受备择假设”,这也是留有余地的。3、设定1%、5%或者10%为显著水平显得有点随意,为何不设2%、6%、7%等为显著水平呢?是否可以依据一个更一般的标准来进行假设检验?答案是肯定的,我们可以依据一个更一般的标准来进行假设检验!既然我们已经计算出统计量值11ˆˆ()/()zsd,如果z为正,那么根据正态分布表,我们就能够确定Pr()ZzZz的值(如果z值为负,那么我们能够确定Pr()ZzZz的值),我们通常把这个概率值称为伴随概率,简写为P或者Prob.这个概率值很有用处!例浙江工商大学金融学院姚耀军讲义系列8如,假定P值是0.062,那么,显然,以任何小于6.2%的概率为小概率标准,我们并不拒绝原假设;以任何大于6.2%的概率为小概率标准,我们拒绝原假设。4、一个总结:在进行双尾检验时,当P小于给定的显著水平时,那么在给定的显著水平下应该拒绝原假设;反之,则不拒绝原假设。上述检验都属于双尾检验,即/2/2(,][,)aazz是拒绝域。如果假设体系是:0111::HH那么在显著水平a下,拒绝域应该是[,)az,我们进行的是单侧(尾)检验。为了理解上述单侧检验,我们回答如下几个问题:问题一:为什么拒绝域是[,)az?答案:当原假设为真时,那么11ˆˆ()/()Zsd应该在0左右不远处;当备择假设为真时,1ˆ在真实参数1左右不远处。因此,只要真实参数远大于,则11ˆˆ()/()Zsd远大于0是非常可能的,而在这种情况下Z远小于0则不太可能的。因此,我们把拒绝浙江工商大学金融学院姚耀军讲义系列9域设定为[,)az。当Z值落在该区间内时,我们拒绝原假设,接受被择假设。问题二:为什么/2[,)az不是拒绝域?答案:当Z值落在该区间内时如果我们拒绝了原假设,则我们更应该拒绝被择假设。因为当备择假设为真时,Z值落在该区间内的概率更小。基于假设体系的完备性,故我们不把/2[,)az设定为拒绝域。问题三:设置这样的假设体系有何依据?答案:这依赖于先验的理论与判断。例如,假定1是某正常商品的消费收入弹性,那么1不可能为负,则我们可以通过建立如下的假设体系:0111:0:0HH并基于样本来判断10是否为真。问题四:单侧检验与双侧检验相比有何特点?答案:从假设体系的形式来看,单侧检验与双侧检验明显不同。但最关键的不同在于,给定显著水平a(犯“第一类错误”的概率),上述单侧检验的拒绝域[,)az与双侧检验右端拒绝域/2[,)az相比更宽,因此更容易拒绝原假设,从而犯“第二类错误”(取误)的概率更低。笔记:浙江工商大学金融学院姚耀军讲义系列101、一个检验如果犯“第二类错误”(取误)的概率更低,则称该检验具有更高的检验势。在检验中提高检验的势一般来说是相当重要的。如果检验势较低则很容易“取误”,而科学精神要求我们不要轻易相信某一个确定性的判断!2、从本质上看,单侧检验之所以比双侧检验具有更高的检验势,其原因在于,在建立单侧检验时我们预先接受了有关理论的指导,从而掌握了更多的信息,故在检验时我们能够做到更精细,不会轻易“上当”(取误)。3、事物往往都具有两面性。尽管单侧检验比双侧检验具有更高的检验势,但要注意,它依赖于先验理论指导的正确性。如果先验理论指导是错误的,那么我们的“挑剔”很可能是“过度”的,即我们“弃真”的概率非常大。尽管名义上的“弃真”概率是a,但实际上的“弃真”概率超过了a,这被称为显著水平扭曲。4、如果显著水平不扭曲,则给定显著水平,一个检验的检验势越高越好。不幸的是,在显著水平不扭曲的情况下,一个检验的“弃真”概率与“取误”概率其走向通常相反:如果设定较低的显著水平以降低“弃真”的概率,则拒绝域变窄,故“取误”概率增加,反之则相反。问题是我们如何取舍?本质上这涉及到比较“弃真”与“取误”所造成后果的严重性。假设现在要检验一种新药是否有效果,如果有效果则推广使用。现在的原假设是没有效果,备择假设是有效果。考虑到假药的危害,则“弃真”浙江工商大学金融学院姚耀军讲义系列11所带来的后果非常严重,而“取误”所造成后果相对不严重。因此我们应该保守一点,设定更低的显著水平,以降低“弃真”的概率。思考题:在假设体系:0111::HH下,计量软件包计算出为正的统计量值z,而且P值为0.120(注:计量软件包默认的P值是双尾的概率,当z为正时,它计算的是Pr()ZzZz)。问:在假设体系0111::HH下,以10%为显著水平,我们是否拒绝原假
本文标题:计量经济学重点笔记第三讲
链接地址:https://www.777doc.com/doc-3689110 .html