您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 计量经济学第四章统计推断估计与假设检验
1第四章统计推断:估计与假设检验4.1统计推断的含义总体和样本总体是指我们所关注现象出现的可能结果的全体,样本是总体的一个子集(例如,杭州的人口;下沙开发区的人口)。宽泛地说,统计推断研究的是总体与来自总体的样本之间的关系。国内股票交易市场共有1500多支股票。假定某一天从中随机选取50支,并计算这50支股票价格与收入比的平均值—即P/E比值。(例如,一支股票的价格为50元,估计年收益为2.5美元,则P/E为20;也就是说,股票以20倍的年收益出售。)根据50支股票的平均P/E值,能否说这个P/E值就是总体的1000多股票的平均P/E值呢?如果令X表示一支股票的P/E值,X表示50支股票的平均P/E值,能否得知总体的均值E(X)呢?此处统计推断的实质就是从样本值均值(X)归纳出总体值E(X)的过程。4.2参数估计通常假定某一随机变量X服从某种概率密度,但并不知道其分布的参数值。例如,X服从正态分布,想知道其两个参数,均值E(X)=uX,及方差2x。为了估计未知参数,一般的步骤是:假定有来自某一总体,样本容量为n的随机样本,根据样本估计总体的未知参数。因此,可将样本均值作为总体均值(或期望)的估计量,样本方差作为总体方差的估计量。这个过程称为估计问题,估计问题有两类:点估计(pointestimation)和区间估计(intervalestimation)。假定随机变量X(P/E值)服从某一未知均值和方差的正态分布。但是,有来自该正态总体的一个随机样本(50个股票的P/E值),如何根据这些样本数据计算总体的均值uX(=E(X))和方差2x?2表4-1点估计据表4-1的数据50个P/E的样本均值为11.5,显然我们可以选择X作为uX的估计值。我们称这个单一数值为uX的点估计值。(注意:点估计量是一个随机变量,因为其值随样本的不同而不同。)某一特殊的估计值(比如11.5)的可信度有多大呢?虽然X可能是总体均值的“最好的”估计值,但是某个区间,比如8~10,更可能包括了总体均值。这正是区间估计的基本思想。区间估计区间估计的主要思想源于估计量的概率分布的概念。如果随机变量X~N(uX,2x),则(回忆第三章中心极限定理):X~N(uX,2n)或,(0,1)XuZNn3即样本均值的抽样分布也服从正态分布。如前所述,通常2未知,可用其估计量22()1iXXXSn代替,则:/xXutsn服从自由度为(n-1)的t分布。在P/E一例中,共有50个样本观察值,因此自由度为49。查附录中的t分布表可得:P(-2.0096≤t≤2.0096)=0.95也即区间(-2.0096,2.0096)包括t值的概率为95%。-2.0096和2.0096称为临界t值,表明了在临界值区间内,位于t分布曲线下区域的比例。把/xXutsn代到P(-2.0096≤t≤2.0096)=0.95中,得到:P(-2.0096≤/xXutsn≤2.0096)=0.95整理得:2.00962.0096()0.95xSSPXuXnn上式为真实的uX一个区间估计量。10.63≤uX≤12.36(近似值)即为uX的95%的置信区间。一般地,称42.00962.0096()0.95xSSPXuXnn为未知的总体均值uX的一个95%的置信区间。0.95称为置信系数。上式表示随机区间(;2.00962.0096SSXXnn)包括真实的uX概率为0.95。(2.0096SXn)称为区间的下限(lowerlimit),(2.0096SXn)称为区间的上限(upperlimit)。特别强调:2.00962.0096()0.95xSSPXuXnn给出的区间是随机的区间,因为它依赖于X和Sn的取值,而X和Sn的值随样本的不同而变化。虽然总体均值uX是未知的,但是它取某一固定值,因而它是非随机的。简言之,区间是随机的,而参数uX不是随机的。2.00962.0096()0.95xSSPXuXnn也可以理解为,如果建立类似上式这样的置信区间100次,将有95次的区间包括真实的uX。4.3点估计量的性质在P/E一例中,用样本均值作为uX的点计量,同时还得到了uX的区间估计量。但除了样本均值以外,样本中位数同样可用作uX的点估计量,为什么要选择样本均值为uX的估计量呢?在实践中,样本均值是度量总体均值最广泛使用的统计量,因为它满足了下面的一些统计性质:(1)线性(linearity)(2)无偏性(unbiasedness)(3)有效性(efficiency)(4)最优线性无偏估计量(BLUE)(5)一致性(consistency)4.4.1线性若估计量是样本观察值的线性函数,则称该估计量是线性估计量。54.3.2无偏性如果重复使用某种方法,得到的估计量的均值与真实参数值一致,那么,这个估计量就是无偏估计量。如果X称为无偏估计量,则有:E(X)=uX如果不是这样,则称该估计量是有偏的估计量,比下图中的估计量X*。4.3.3有效性虽然无偏性是令人想往的性质,但却不是充分的。如果有两个或更多的无偏估计量,该作何选择呢?假定随机变量X的某一随机样本,样本的容量为n,并且X~N(u,2),令X、Xmed分别表示样本均值和样本中位数。已知:X~N(uX,2n)同时,若样本容量足够大,Xmed~N(uX,22n)其中,p=3.142(近似值)。也即对大样本而言,样本中位数也服从均值为uX正态分布,但方6差是样本均值X方差的2=1.571倍。究竟选择哪一个估计量呢?一般地会选择X,因为虽然两个估计量都是无偏估计量,但X的方差比Xmed的方差小。简言之,X提供了一个比Xmed更为准确的总体均值的估计值,称X是有效估计量。若仅考虑惟一一个参数估计量,则方差最小的估计量是最好的或称为有效的估计量。4.3.4最优线性无偏估计量(bestlinearunbiasedestimator,BLUE)如果一个估计量是线性的和无偏的,并且在参数的所有线性无偏估计量中,这个估计量的方差最小,则称这个估计量是最优线性无偏估计量。显然,这条性质包括了线性,无偏性及最小方差性。4.3.5一致性为了解释一致性,假定X~N(u,2),从该正态总体中抽取一容量为n的随机样本。现考虑uX的两个估计量:iXXn*1iXXn第一个估计量就是常用的样本均值。可知E(X)=uX7可以证明:E(*X)=1nnuX既然E(X*)不等于uX,显然X*是一个有偏的估计量。但是,假定增大样本容量,情况又会怎样呢?估计量X、X*的差别仅仅在于前者的分母为n而后者的分母为n+1。但是随着样本容量增大,发现两个估计量的差别不大。也就是说,随着样本容量的增加,X*也将近似于真实的uX,称这样的估计量为一致估计量。估计量(比如X*)称为一致估计量,如果随着样本容量的逐渐增大,该估计量接近参数的真实值。4.4假设检验回到P/E一例。根据50个P/E值组成的随机样本,我们对(真实的但未知的1000多支股票的平均P/E值)建立了一个95%的置信区间。现假设真实的uX取某一特定值,比如uX=13。现在去“检验”这个假设—即是接受还是拒绝该假设?用假设检验的语言,类似uX=13的假设称为零假设。通常用符号H0表示。因而,H0:8uX=13。零假设通常与备择假设成对出现。用符号H1表示备择假设,备择假设有以下几种形式:H1:uX13,称为单边备择假设。H1:uX13,也称为单边备择假设。H1:uX≠13,称为双边备择假设。为了检验零假设(与备择假设),可以根据样本数据(比如,根据表4-1得到的样本平均P/E值11.5)以及统计理论建立判定规则来判断样本信息是否支持零假设。如何建立判定规则呢?有两个互补的方法:(1)置信区间法(2)显著性检验法4.4.1置信区间法根据表4-1提供的数据计算出样本均值为11.5。可指样本均值服从均值为uX,方差为2n的正态分布。但是由于真实的方差是未知的,所以用样本方差来代替,在这种情况下,样本均值服从t分布,/Xutsn。根据t分布,得到uX的一个95%的置信区间:10.63≤uX≤12.36(近似值)置信区间提供了在某一置信系数下(比如95%)真实的uX取值范围。因此,如果这个区间不包括零假设中的值,比如uX=13,那么会拒绝零假设——以95%的置信度拒绝该零假设。从上面的讨论中,可以看到置信区间与假设检验密切相关。用假设检验的语言,不等式10.63≤uX≤12.36描述的置信区间称为接受区域,接受区域以外的称为拒绝区域。接受区域的上界和下界称为临界值(criticalvalues)。可以表述为:如果参数值在零假设下位于接受区域内,则不拒绝零假设。但如果落在接受区域以外(也即落在拒绝区域内),则拒绝零假设。在这个例子中,拒绝零假设H0:uX=13,因为这个值落在临界区域,它比接受区域的上界12.36大,也即这是一个小概率事件—不到2.5%。简言之,如果参数值超过上临界值或低于下临界值,那么就拒绝零假设。4.4.2第一类错误和第二类错误在P/E一例中,我们拒绝H0:uX=13,这是否意味着表4-1给出的样本不是来自于均值为13的正态总体呢?或许事实的确如此。但是不等式(10.63≤uX≤12.36)的置信区间的置信度仅为95%而并非100%。如果真的如此,那么拒绝H0:uX=13,就可能能犯错误。此时犯了第一类错误——即弃真错误。同样的原因,假定零假设H0:uX=12,在这种情况下,根据不等式(10.63≤uX≤12.36),我们应该不拒绝这个零假设。但是表4-1这个样本很可能不是来自均值为12的正态总体。此时,会犯第二类错误,也即取伪错误。用另一个例子进一步阐明假设检验的置信区间法。9例4.2某种包装椒盐花生的重量服从标准正态分布,但均值与标准差均是未知的,均值的度量单位为盎司。随机选取20包发现其样本均值和样本标准差分别为6.5盎司和2。检验零假设:真实均值为7.5盎司;备择假设:真实均值不是7.5盎司。给定99%的置信系数(或1%的置信水平,皆表示犯第一类错误的概率至多为1%)。令X代表坛子中花生的重量,因此X~N(u,2),两个参数uX和2均未知。由于真实方差是未知的,所以它服从自由度为19的t分布:19/20Xutt从附录表可知,自由度为19时,P(-2.681≤t≤2.681)=0.99可得:2.6812.681()0.992020xSSPXuX将X=6.5,S=2,代入上式,我们得到了uX的一个99%的置信区间。5.22≤uX≤7.78(近似值)由于区间包括了零假设值7.5,因此,我们不拒绝零假设:真实的uX=7.5。10例4.3在例4.2中,若置信水平a为5%;即决定冒更大的风险犯第一类错误。那么情况如何呢?根据t分布表,当a=5%,自由度为19时,t的临界值为-2.093和+2.093,因为P(-2.093≤uX≤2.093)=0.95按照例4.3的步骤,能够求得:5.56≤uX≤7.44(近似值)从中可以看出,这个区间不包括7.5,因此,拒绝零假设:uX=7.5。两个例子的不同之处在于后者的置信区间比前者略窄一些,后者愿意冒较大的风险去犯第一类错误,即弃真错误。4.4.3显著性检验显著性检验方法的基本思想:由于/xXutsn服从自由度为(n-1)的t分布。可知X,S,n,惟一未知的是uX。但如果设定uX为某一值,则可以求出惟一个t值,根据t分布很容易求得获此t值的概率。如果X与uX的差(绝对值)不大,则|t|也会很小。如果X=uX,则t值为0,在此情况下接受零假设。因此,随着|t|值偏离0,将逐渐地趋向拒绝零假设,即根据t分布表,给定自由度,|t|值越大,则获此|t|值的概率就越小。但在能拒绝零假设之前,最大的|t|值是多少呢?取决于置信水平(或者理解为取决于置信区间大小),即犯第一类错误的概率,以及自由度。在P/E例中,uX=11.5,S=3.0456,n=50。令H0:uX=13,H1
本文标题:计量经济学第四章统计推断估计与假设检验
链接地址:https://www.777doc.com/doc-2061996 .html