您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 冶金工业 > 第二章均值和协方差的检验
2020/6/13中国人民大学六西格玛质量管理研究中心1第二章均值向量和协方差阵的检验目录上页下页返回结束•§2.1均值向量的检验•§2.2协方差阵的检验•§2.3有关检验的上机实现2020/6/13中国人民大学六西格玛质量管理研究中心2目录上页下页返回结束关于均值μ和方差Σ的各种形式的假设检验构成了本章的内容,不少结果都是一元的直接推广,但由于多指标问题的复杂性,本章只列出检验统计量,详细介绍如何使用这些统计量坐检验,有关理论的推证将全部略去。最后还将介绍形象分析及有关上机的实现2020/6/13中国人民大学六西格玛质量管理研究中心3目录上页下页返回结束§2.1均值向量的检验§2.1.1一个指标检验的回顾§2.1.2多元均值检验§2.1.3两总体均值的比较§2.1.4多总体均值的检验2020/6/134目录上页下页返回结束§2.1.1一个指标检验的回顾0100:,:HH设从总体中抽取了一样本,我们需要检验下面的假设当已知时,用统计量2020/6/135目录上页下页返回结束来做检验。当建设成立是,t统计量遵从自由度为n-1的t分布,拒绝域为2020/6/136目录上页下页返回结束(2.3))()()()2.2(01202xSxnt:也可以改写成如下形式统计量)(,~112112nnFtFt,,其拒绝域为当假设为真时,统计量2020/6/137目录上页下页返回结束(1)根据问题的要求提出统计假设H0和H1;(2)选择一个合适的统计量,并求出它的抽样分布;(3)指定α风险值(显著水平),并在H0成立的条件下,求出风险值控制在α的临界值W;(4)建立判别准则;(5)由样本观测值计算统计量值,再有准则作统计判断,作出具体解释§2.1.2多元均值检验多元均值检验的基本思想和一元时候是一样的,例如某企业为分析经营情况,选择p个指标进行分析,今年的p项指标均值为μ,而历史水平为μ0,为考察今年和历史有无差异,需要检验下面的假设0100:,:HH基本思想为:2020/6/138目录上页下页返回结束(ⅰ)协方差阵Σ已知类似于(2.3)的统计量(注意(2.3)的形式)是)5.2()()(01'020xxn可以证明,在假设为真时,统计量遵从自由度为p的分布;事实上)p(~)X()X(n)X()n1()X(201'001'0的样本是一容量为,设nnXXXp,...,1)',,(1)(马氏距离2020/6/139目录上页下页返回结束统计量实质上是样本均值与已知平均水平之间的马氏距离的倍,这个值越大,μ与相等的可能性就越小,因而,在备择假设成立时,有变大的趋势,所以拒绝域应取为值较大的右侧部分。式中是样本均值,是样本容量。n当给定显著性水平后,由样本值可以算出的值,当时,便拒绝零假设,说明均值μ不等于,其中是自由度为P的分布的分为点。即2020/6/1310目录上页下页返回结束(ⅱ)协方差阵Σ未知此时Σ的无偏估计是,类似于式(2.3)的统计量是:可以证明,统计量遵从参数为p,n-1,,的分布,即。统计量实际上也是样本均值与已知均值向量之间的马氏距离再乘以n(n-1),这个值越大,μ与相等的可能性就越小。2020/6/1311目录上页下页返回结束因而,在备择假设成立时,的值有变大的趋势,所以拒绝域可取为值较大的右侧部分。因此,当给定显著性水平后,由样本的数值可立即算出值,当时,便拒绝零假设。分布的5%及1%的分位点已列成专表,由网上下载,为的上分位点。2020/6/1312目录上页下页返回结束事实上,将统计量乘上一个适当的常数后,便成为F统计量,也可用F分布表获得零假设的拒绝域。即关于、的合理性及推证见参考文献[3]在实际工作中,一元检验与多元检验可以联合使用,多元的检验具有概括和全面考察的特点,而一元的检验容易发现各指标之间的关系和差异,能帮助我们找出存在差异的侧重面,提供了更多的统计分析信息。2020/6/1313目录上页下页返回结束§2.1.3两总体均值的比较在许多实际问题中,往往要比较两个总体之间的平均水平有无差异。例如,两所大学新生录取成绩是否有明显差异;研究职工工资总额的构成情况,若按国民经济行业分组,就是例如要研究工业与建筑业这两个行业之间,是否有明显的不同之处;同理,可按工业领导关系(中央、省、市、县属工业)分组;也可按工业行业分组。组与组之间的工资总额构成有无显著差异,本质上就是两个总体的均值向量是否相等,这类问题,通常也称为两样本问题。两总体均值比较的问题,又可分为两总体协方差阵相等与两总体协方差阵不等两种情形。2020/6/1314目录上页下页返回结束1.协方差阵相等的情形进行检验。与前面类似的统计量的形式是:设为来自p元正态总体的容量为的样本,是来自p元正态总体容量为的样本,且两样本之间相互独立,假定两总体协方差阵相等,但未知,现对假设)9.2(,:21210H2020/6/1315目录上页下页返回结束总体均值的马氏距离2020/6/1316目录上页下页返回结束因为的值与总体均值的马氏距离成正比例,此值愈大,说明两总体的均值很接近的可能性就愈小,因而拒绝域可以取为值较大的右侧区域,即当给定显著性水平的值时,若时,拒绝,否则没有足够理由拒绝。2020/6/1317目录上页下页返回结束2.协方差阵不相等情形设从两个总体和,分别抽取容量为和的两个样本,,假定两总体协方差阵不相等,我们考虑对假设(2.9)作检验。这是著名Behrens—Fisher问题。长期以来,统计学家用许多方法试图解决这个问题。当与相差较大时,统计量的形式是:2020/6/1318目录上页下页返回结束式中,的统计含义与前相同,再令2020/6/1319目录上页下页返回结束当假设(2.9)的成立时,可以证明(见文献[3])近似遵从第一自由度为、第二自由度为的F分布,即2020/6/1320目录上页下页返回结束§2.1.4多总体均值的检验在许多实际问题中,我们要研究的总体往往不止两个。例如,要对全国的工业行业的生产经营状况做一比较时,一个行业可以看成一个总体,此时要研究的总体就达几十甚至几百个之多。这类问题的研究就需要多元方差分析的知识。多元方差分析是一元方差分析的直接推广,为了易于理解多元方差分析的方法,我们先回顾一元的方差分析。2020/6/1321目录上页下页返回结束假设r个总体的方差相等,要检验的假设就是jirjiHH使得至少存在,:,:110设有r个总体,G1,…,Gr,它们分别服从一元正态分布,现在从各个总体中抽取的样本如下:2020/6/1322目录上页下页返回结束这个检验的统计量与下列平方和密切相关2020/6/1323目录上页下页返回结束将上述方法推广到多元,就是设有r个总体G1,…,Gr,从这r个总体抽取独立样本如下:)(使得至少存在2.15110jir,ji:H,:H2020/6/1324目录上页下页返回结束用类似于一元方差分析的办法,前面所述的三个平方和变成了矩阵,形式如下:很显然W=B+E关于检验可用WilksΛ分布,再化为F分布2020/6/1325目录上页下页返回结束§2.2协方差阵的检验§2.2.1检验§2.2.2检验2020/6/1326目录上页下页返回结束上面讨论了多元正态分布均值的检验。但这仅仅研究了问题的一个方面,倘若要进一步深究不同总体的平均水平(均值)波动的幅度,前面介绍的方法就无能为力了。本节所介绍的协方差阵的检验可以解决该类问题2020/6/1327目录上页下页返回结束是样本协方差阵,关于统计量M的推证过程见参考文献[1]。0§2.2.1检验(2.17):,:0100HH检验假设(2.17)式,需要用到的统计量是:设是来自正态总体的一个样本,是一个已知的正定矩阵,要检验其中2020/6/1328目录上页下页返回结束柯云(Korin1968)已导出M的极限分布和近似分布,并对小的n算出了表,当p≤10,n≤75,α=0.05及α=0.01时M的α分位数表,当p10或n75时,M近似于bF(f1,f2),记作2020/6/1329目录上页下页返回结束上面讨论的检验,是帮助我们分析当前的波动幅度与过去的波动情形有无显著差异。但在实际问题中,我们往往面临多个总体,需要了解这多个总体之间的波动幅度有无明显的差异。例如在研究职工工资构成时,若按工业行业分组,就有采掘业、制造业、文化教育、金融保险等,不同行业间工资总额的构成存在波动,研究波动是否存在显著的差异,就是做行业间协方差阵相等性的检验。用统计理论来描述就是:设有r个总体,从各个总体中抽取样品如下:§2.2.2检验r12020/6/1330目录上页下页返回结束(2.21))1(ln)1()(ln)(1kkrkknLnrnLrnMrkkLL12020/6/1331目录上页下页返回结束当不大且时,本书附表4中列出了M的上分位点;若较大且互不相当时,附表4中未列出它们对应的临界值,此时可用F分布去近似,M近似遵从,记作M≈(2.22)2020/6/1332目录上页下页返回结束其中2020/6/1333目录上页下页返回结束【例2.1】1999年财政部、国家经贸委、人事部和国家计委联合发布了《国有资本金效绩评价规则》。其中,对竞争性工商企业的评价指标体系包括下面八大基本指标:净资产收益率、总资产报酬率、总资产周转率、流动资产周转率、资产负债率、已获利息倍数、销售增长率和资本积累率。下面我们借助于这一指标体系对我国上市公司的运营情况进行分析,表2-1所列的是35家上市公司2000年年报数据,这35家上市公司分别来自于电力、煤气及水的生产和供应业,房地行业,信息技术业,在后面各章中也经常以该数据为例进行分析。§2.3有关检验的上机实现2020/6/1334目录上页下页返回结束行业公司简称净资产收益率%总资产报酬率%资产负债率%总资产周转率流动资产周转率已获利息倍数销售增长率%资本积累率%电力、煤气及水的生产和供应业深能源A16.8512.3542.320.371.787.1845.7354.54深南电A2215.3046.510.761.7715.6748.1119.41富龙热力8.977.9830.560.170.5810.4317.809.44穗恒运A10.258.9940.440.462.465.0611.061.09粤电力A20.8120.0035.870.431.2534.8924.7712.67韶能股份8.867.5227.590.240.8420.59-3.5054.02惠天热电10.987.9449.300.360.6912.4316.883.52原水股份8.858.8836.200.130.418.53-11.492.44大连热电9.037.4146.890.280.796.8616.23-1.52龙电股份12.078.7016.810.280.6829.754.1163.06华银电力6.856.1241.930.240.654.3811.203.80表2-12020/6/1335目录上页下页返回结束续前表房地产行业长春经开9.8510.5031.230.340.4017.1318.057.18兴业房产1.071.5266.910.210.241.53-31.931.08金丰投资19.447.0173.340.260.307.0271.2212.73新黄浦7.615.9239.640.160.174.2014.777.91浦东金桥4.243.9937.300.200.253.98-9.244.69外高桥1.6731.9249.050.030.051.06-21.740.24中华企业8.786.2857.420.170.193.5875.292.93渝开发A0.22.2463.400.090.151.07-12.560.29辽房天8.123.9869
本文标题:第二章均值和协方差的检验
链接地址:https://www.777doc.com/doc-5860850 .html