您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 工程监理 > 本科经济计量学第5章(第3版)
第5章统计推断:估计与假设检验第5章25.1统计推断的含义5.2估计和假设检验:统计推断的两个孪生分支5.3参数估计5.4点估计量的性质5.5统计推断:假设检验5.6总结第5章35.1统计推断的含义统计推断研究的是总体与来自总体的样本之间的关系。统计推断就是通过样本去认识总体,通过样本的信息去推知关于总体分布或有关总体特征的信息。例:表5-1给出了2004年2月2日纽约股票交易市场(NYSE)上28家上市公司的价格收益比(P/E)数据。假定这是一个来自NYSE上约3000家上市公司(总体)的随机样本。我们可以计算这28支股票平均的P/E值。能否说这28支股票的P/E值就是NYSE所有上市公司的平均的P/E值呢??已知样本均值能否得到总体均值?例第5章4表5-1纽约股票交易市场上28家上市公司的价格收益比(P/E)公司P/E公司P/EAA27.96INTC36.02AXP22.9IBM22.94T8.3JPM12.1BA49.78JNJ22.43CAT24.68MCD22.13CAT14.55MRK16.48KO28.22MSFT33.75DD28.21MMM26.05EK34.71MO12.21XOM12.99PG24.49GE21.89SBC14.87GM9.86UTX14.87HD20.26WMT27.84HON23.36DIS37.1均值=23.25,方差=90.13,标准差=9.49第5章55.2估计和假设检验:统计推断的两个孪生分支在实际中最常见也是最重要的两类统计推断问题是:参数估计与假设检验。参数估计是统计推断的第一步,通常我们通过样本来估计总体某一参数,这一估计量的取值称为参数估计值。假设检验是指我们可以对某一参数的假定值进行先验判断或预期,然后利用小概率原理对其进行检验,得到接受或拒绝原假设的结论。第5章65.3参数估计根据样本信息对总体中的未知参数做出估计的过程称为参数估计问题。估计问题有两类:点估计(pointestimation)和区间估计(intervalestimation)。假定有来自某一总体X,容量为n的随机样本,可将样本均值作为总体均值(期望)的估计量;样本方差作为总体方差的估计量。这就是点估计。第5章7区间估计是指要估计出一个区间,使得这个区间包含真实参数的概率达到事先给定的置信水平(置信系数confidencecoefficient)。概念:置信系数confidencecoefficient,置信度,置信水平,1-αα称为显著水平levelofsignificance,犯第一类错误的概率第5章8例:如前例)1(~)1,0(~),(~2ntnSuXtNnuXZnuNXXXX;;因为总体方差未知,所以利用t分布,查t分布表可知解:计算得到:样本均值=23.25样本标准差S=9.49总体均值的点估计为:下面估计置信区间。由前章我们知道求总体均值的点估计与置信水平为95%的置信区间。93.269.5710.95)052.2052.2(XXunSuXP得到=P1825.23ˆXux第5章919.5726.93P/E比值图5-2总体平均的P/E的置信区间假设检验-2.05202.0522.5%2.5%图5-1t分布(自由度为27)第5章10一般地,假定总体X是一服从某一概率分布的随机变量,要对其参数进行估计,可以按照下面步骤进行:(1)从总体中抽取容量为n的随机样本(2)寻找与待估参数有关的统计量(3)查表得到该统计量的置信上限和置信下限(4)通过待估参数与统计量的关系换算得到待估参数的置信上限与置信下限。(5)代入相应的样本值即可得具体的置信区间。第5章115.4点估计量的性质1.线性(linearity)2.无偏性(unbiasedness)3.最小方差性(minimum-variance)4.有效性(efficiency)5.最优线性无偏估计量(BLUE)6.一致性(consistency)在实践中,样本均值是度量总体时使用最广泛的统计量,因为样本均值满足以上统计性质。第5章12线性若估计量是样本观察值的线性函数,则称该估计量为线性估计量。显然,样本均值是一个线性估计量。无偏性如果平均而言,估计量与参数的真实值相一致,就称该估计量是无偏估计量。(如图5-3)即当估计量的期望值等于参数值时,估计量为无偏估计量。即)(121nXXXnXuuE)ˆ(第5章13例5-1:若总体服从正态分布,从中得到一个样本容量为n的简单随机样本。则样本均值是总体真实均值的无偏估计量;如果从正态总体中重复抽取n个样本,并计算每个样本的样本均值,则平均而言,样本均值等于真实的总体均值。但需要谨慎的是,我们不能仅通过一个样本就认为计算的样本均值就一定与真实的均值相一致。5第5章14有效性如果有几个估计量都是无偏估计量,我们可以考察这些估计量的方差,方差最小的估计量称为有效估计量。5-5第5章15最优线性无偏估计量线性、无偏,且在所有线性无偏估计量中它的方差最小。(bestlinearunbiasedestimator,BLUE)一致性如果随着样本容量的逐渐增大,估计量的期望接近参数的真实值,该估计量称为渐进无偏估计量。如果随着样本容量的逐渐增大,供给量接近于参数的真实值,该供给量称为一致估计量。xnnuuE)ˆ(lim1)|ˆ(|limxnnuuP第5章16例:假定从该正态总体中抽取一个容量为n的随机样本,考虑ux的两个估计量:前者是无偏估计量,后者是有偏估计量,但随着样本容量n的增大,有:所以,后者是一个渐进无偏统计量,也是一个一致估计量。见图5-6。),(~2xuNXiiXnXXnX111*xuXE)(*xuX*P第5章175-6第5章185.5统计推断:假设检验假设检验:假设检验是指我们可以对某一参数的假定值进行先验判断或预期,然后利用小概率原理对其进行检验,得到接受或拒绝原假设的结论。小概率原理:我们认为小概率事件由于发生的可能性很小,在一次试验中它几乎是不会发生的。如果发生了,说明我们的假设有问题,所以我们将拒绝原来的假设。第5章1901010100::::uuHuuHuuHuuHXXXX备择假设零假设单边备择单边备择双边备择零假设:备择假设:例如前面P/E例5.18:5.18:10XXuHuH零假设(原假设)与备择假设:例:010001000100::::::uuHuuHuuHuuHuuHuuHxxxxxx备择假设零假设备择假设零假设备择假设零假设第5章20假设检验的方法1.置信区间法置信区间提供了在某一置信度(例如95%)下真实参数值的取值范围。如果零假设中的值未落入该区间,也就是说小概率事件发生了,我们认为小概率事件由于发生的可能性很小,在一次试验中它几乎是不会发生的。如果发生了,说明我们的假设有问题,所以我们将拒绝该零假设。概念:接受域(置信区间)、拒绝域、临界值参见图5-1第5章21第一类错误和第二类错误:一个偏离由小概率原理我们可以看出,我们的这种判断是有可能犯错误的。我们把可能犯的错误分为两类:第一类错误和第二类错误。第一类错误:零假设是正确的,却做出拒绝零假设的判断,此为弃真错误。第二类错误:零假设是错误的,却做出接受零假设的判断,此为取伪错误。第5章22犯第一类错误的概率=犯弃真错误的概率犯第二类错误的概率=犯取伪错误的概率假设检验不可能完全避免这两类错误,我们只能想办法使犯错误的概率尽量减小。1-置信水平,也称显著性水平第5章23例5-3:坛子里的花生的重量服从正态分布,但均值和标准差均是未知的,均值和标准差的度量单位为盎司。随机选取20个坛子发现其样本均值和样本标准差分别为6.5盎司和2盎司。检验零假设:真实均值为7.5盎司;备择假设:真实均值不是7.5盎司。给定显著性水平1%。解:令X表示坛子中花生的重量,因此其中两个参数未知。),(~2XuNX第5章24因为真实方差是未知的,所以有:从附录A中表A-2的t分布表可知,自由度为19时,计算得到:因为零假设值落入该区间内,所以在1%的显著水平下,我们接受零假设。5.7:5.7:10xxuHuH19~20/tSuXtX99.0)861.2t861.2(P78.7u22.5x第5章25例:在例5-3中,若显著水平为5%,即决定冒更大的风险犯第一类错误。那么,情况如何?解:根据t分布表,当显著水平为5%,自由度为19时,t的临界值为-2.093和2.093,此时有:得到:零假设值未落入该区间内,所以在5%的显著水平下,可以得到拒绝零假设的结论。这并不奇怪,也与前面的结果不矛盾,此时,我们愿意冒较大的风险去犯第一类错误,即弃真错误。95.0)093.2t093.2(P44.7u56.5x第5章26第5章272.显著性检验显著性检验:在给定显著性水平下,为考察样本值的显著性而进行的假设检验。检验是统计显著的:能够拒绝零假设,即观察到的样本值落入拒绝域。检验是统计不显著的:不能够拒绝零假设,即观察到的样本值落入接受域。第5章28若备择假设是双边的,从而拒绝域也是双边的,称其为双边检验。如单边检验(one-tailtest)与双边检验(two-tailtest)若备择假设是单边的,从而拒绝域也是单边的,称其为单边检验。如0100::uuHuuHxx0100::uuHuuHxx此时拒绝域在右尾,拒绝域是单边的。见表5-2和图5-7。此时拒绝域在双尾,拒绝域是双边的。第5章29注:表示在零假设下的某一取值。表中最后一列给出了临界值,t统计量的第一个下标代表了显著性水平,第二下标代表自由度。0uxu表5-2t检验小结零假设备择假设临界区域,拒绝,若0H1H0H0uux0uux0uux0uux0uux0uux..,0/fdtnSuXt..,0/fdtnSuXt..,2/0/||fdtnSuXt单边检验,拒绝域在右尾单边检验,拒绝域在左尾双边检验,拒绝域在双尾第5章30双边检验0100::uuHuuHxx单边检验0100::uuHuuHxx单边检验0100::uuHuuHxx5-7第5章31例:已知50支股票样本的P/E比值数据,计算得到:样本均值=11.5,样本标准差S=3.0456,用假设检验的方法判断总体真实均值是否为13。解:因为总体方差未知,只能使用t统计量:将样本均值、样本方差和零假设值代入计算得到t=-3.4826因为这是双边检验,拒绝域在两边,查t分布表得知:当显著性水平为5%时,临界值为-2.0096和2.0096,计算得到的t值落入拒绝域,所以拒绝零假设,认为在5%的显著性水平下,总体真实均值不等于13。13:13:10xxuHuH49~50/tSuXtX50/SuXtX第5章32显著水平的选择与P值P值(概率值)也称为统计量的精确显著性水平。它可定义为拒绝零假设的最小的显著性水平。一般规律:P值越小,越能拒绝零假设。某一点对应的p值指的是以该值为临界点确定的拒绝域的概率。第5章33如上例中计算得到t=-3.4826,查t分布表得:P(t-3.5)=0.0005,如果是单边检验,拒绝域在左尾,则-3.5对应的P值就是0.0005。如果是双边检验,拒绝域在双尾,则-3.5对应的P值就是0.001。这比我们通常用的显著性水平要小得多,所以可以拒绝零假设。第5章3421)-(n~)1(2222Sn显著性检验和F显著性检验21.检验例5-4:假定随机样本来自正态总体,样本容量为31,样本方差为12。检验零假设:真实的方差为9;备择假设:真实的方差不等于9。给定显著性水平为5%。第5章35解:将零假设值、n和S代入,计算得到当显著性水平为0.05时,查表得到计算得到的值落入接受域,所以接受零假设。也可以利用检验的p值,查表可得大于40的概率为0.1(自由度为30),因为这个概率值较大,所以我们不能拒绝原假设。9:9:21
本文标题:本科经济计量学第5章(第3版)
链接地址:https://www.777doc.com/doc-3203030 .html