您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 概率与数理统计第8章--假设检验与方差分析
第8章假设检验与方差分析【引例】重庆啤酒股份有限公司(以下简称重庆啤酒)于1990年代初斥巨资开始乙肝新药的研发,其股票被视作“生物医药”概念股受到市场热捧。尤其是2010~2011年的两年间,在上证指数大跌1/3的背景下,重庆啤酒股价却从23元左右飙升最高至83.12元,但公司所研制新药的主要疗效指标的初步统计结果于2011年12月8日披露后,股价连续跌停,12月22日以28.45元报收后停牌。2012年1月10日重庆啤酒公告详细披露了有关研究结论,复牌后股价又遭遇连续数日下跌,1月19日跌至20.16元。此公告明确告知:“主要疗效指标方面,意向性治疗人群的安慰剂组与600μg组,及安慰剂组与εPA-44900μg组之间,HBeAg/抗HBe血清转换在统计意义上均无差异”。通俗地说,用药与不用药(安慰剂组)以及用药多与少(900μg组与600μg组),都没有明显差异,这意味着该公司研制的乙肝新疫苗无效。有关数据如表8.1所示:表8.1乙肝新疫苗的应答率统计人数(人)应答人数(人)应答率(%)安慰剂组1173328.2εPA-44600μg组1203630.0εPA-44900μg组1173429.1注:εPA-44为治疗用(合成肽)乙型肝炎疫苗简称。上表数据显示,两个用药组的应答率都高于安慰剂组的应答率,但为什么说“在统计意义上均无差异”?为什么说这个结论表示乙肝新疫苗无效?什么叫“在统计意义上无差异”?如何根据样本数据作出统计意义上有无差异的判断?解答这些问题就需要本章所要介绍的假设检验。现实中,人们经常需要利用样本信息来判断有关总体特征的某个命题是真还是伪,或对某个(些)因素的影响效应是否显著作出推断,所以假设检验和方差分析有着广泛的应用。例如,在生物医学领域,判断某种新药是否比旧药更有效;在工业生产中,根据某批零件抽样检查的信息来判断整批零件的质量是否符合规格要求;在流通领域,鉴别产品颜色是否对销售量有显著影响等等。这些分析研究都离不开假设检验或方差分析。假设检验与方差分析的具体方法很多,研究目的和背景条件不同,就需采用不同的方法。本教材介绍假设检验与方差分析的基本原理和一些基本方法。但通过本章的学习,理解了有关概念和基本思想,对更为复杂的检验结果也不难作出基本的判断和解读。本章小结1.假设检验是基于小概率原理的一种统计推断方法,针对待检验的原假设和备择假设,检验统计量及其分布是检验的理论基础,检验统计量的观测值及P值是作出检验结论的依据。检验结论可能犯的错误有两类,它们的概率α和β此消彼长。2.参数的假设检验主要包括总体均值、总体方差和总体比例的检验。本章所介绍的检验方法有Z检验、t检验、2检验、F检验等等。3.一个总体参数的假设检验和两个总体参数之差(或比)的检验,其检验统计量不同,要注意它们之间的联系与区别。4.单因素方差分析法从形式上看是对多个总体均值相等性的一种F检验,实质上是研究一个定性变量对一个定量变量有无显著影响。基本概念主要有系统误差、随机误差、组内平方和、组间平方和、组内方差、组间方差等。方差分析法的基本思想是通过观察组间方差与组内方差之比(F统计量)是否显著偏大来判断有无系统误差的存在,从而检验多个总体均值是否相等。5.假设检验和方差分析的计算可借助于EXCEL或SPSS等软件来实现。基本知识梳理基本知识点含义或公式原假设H0与备择假设H1原假设或称零假设(记为H0)是有待根据样本信息来验证的、关于总体特征的某个命题;与之对立的假设称为备择假设(记为H1),意即预备在拒绝原假设时所选择的假设。检验统计量用于检验原假设是否成立的统计量,它反映样本的信息,不含未知总体参数但要包含待检验的参数假设值。检验统计量的概率分布是假设检验的理论依据。检验法假设检验的具体方法通常以检验统计量服从的分布来命名。如Z检验(正态检验)就是指检验统计量Z服从标准正态分布。常用的检验法还有t检验、F检验、χ2检验等。小概率原理发生概率很小的事件在一次试验中是不应该发生的。显著性水平α事先对“小概率”所规定的一个标准,由研究者根据具体情况确定,常常取0.05,也可取0.01,0.10等。第一类错误(弃真)原假设H0为真时误认为原假设不真,即拒绝了正确的原假设。犯第一类错误的概率为(即显著性水平)。第二类错误(取伪)原假设H0不真时误认为原假设为真,即未拒绝错误的原假设。犯第二类错误的概率用表示。P值(P-value)检验统计量等于检验统计值及更背离原假设情况的概率。P值越小,拒绝原假设的信心越充足。拒绝域与一定显著性水平相对应的检验统计量取值区域,位于检验统计量分布的尾端。检验统计量的值落入该区域时,就应按检验规则拒绝原假设H0,反之则不能拒绝原假设。临界值原假设的拒绝区域和不能拒绝区域的分界点。双侧(双尾)检验原假设的拒绝域在检验统计量分布曲线的双侧(双尾)。若以θ表示待检验的总体参数,θ0表示假设值,双侧检验的假设形式为H0:θ=θ0;H1:θ≠θ0。单侧(单尾)检验拒绝域在检验统计量分布的单侧(单尾),又分左侧检验和右侧检验。左侧检验的拒绝域在左侧,其假设形式为:H0:θ=θ0(或θ≥θ0);H1:θ<θ0。右侧检验的拒绝域在右侧,其假设形式为:H0:θ=θ0(或θ≤θ0);H1:θ>θ0。方差分析检验多个总体均值是否存在显著性差异(以鉴别所考察因素对试验结果是否存在显著影响或效应)的统计推断方法。水平(处理)所考察因素在随机试验中的各种不同状态或不同类别。总离差平方和(SST)kinjijiyySST112)(,反映样本的全部观测值的差异。总离差平方和=组内平方和+组间平方和组内平方和(SSE)与组内方差(MSE)组内平方和kinjiijiyySSE112)(,反映相同水平下样本观测值之间由于随机波动而引起的差异,也称为误差平方和。SSE/(n-k)=MSE,称为组内方差。组间平方和(SSA)与组间方差(MSA)kiiiyynSSE12)(,反映不同水平下样本均值之间的差异,它既包含随机误差,也包含系统误差。SSA/(n-k)=MSA,称为组间方差。检验方法一览表待检验的总体参数原假设前提条件检验统计量H0成立时检验统计量的分布单个总体均值0正态总体,方差已知nXZ/001(,)N正态总体,方差未知nSXt/0t(n-1)方差σ2=σ02正态总体2022)1(Sn)12n(成数P=P0大样本nPPPpZ/)1(000或nppPpZ/)1(001(,)N两个总体均值21=D0正态总体,方差已知120221212()XXDZnn01(,)N正态总体,方差未知但相等)11()(212021nnSDXXtWt(n1+n2-2)正态总体,成对样本0/ddDtSnt(n-1)方差σ12=σ22正态总体2221SSFF(n1-1,n2-1)成数P1-P2=D0两个都是大样本222111021)1()1(nppnppDppZ01(,)N多均值μi全相随机项εij独立εij~N(0,σ2)MSEMSAknSSEkSSAF)/()1/(F(k-1,n-k)总体等练习题一、单项选择题(在4个备选答案中选出1个正确答案)1.当检验统计量的观测值未落入原假设的拒绝域时,表示()A可以放心地接受原假设B没有充足的理由否定原假设C没有充足的理由否定备择假设D备择假设是错误的2.在其他条件不变的情况下,增加样本量,犯两类错误的概率会()A都减小B都增大C都不变D一个增大一个减小3.某企业考虑从外地紧急采购一批加工原料,若这批原料的质量达到标准,企业可盈利10万元,但是如果这批原料质量达不到标准,企业将损失25万元。该企业面临判断:H0:原料质量达标;H1:原料质量未达标。对这个问题进行假设检验时,下列说法不正确的是()A拒绝购买达标原料属于犯Ⅰ类错误B购进未达标原料属于犯Ⅱ类错误C这个检验中只允许犯第一类错误D不宜太小4.若假设检验为左侧检验,检验统计量为t,由样本计算的检验统计值为0t,则检验的P值等于()AP{t≤0t}BP{t0t}C2P{t0t}D1-P{t0t}5.对总体均值进行检验的假设为H0:μ=100,H0:μ≠100。由随机样本得到的检验统计量为Z=1.8,则检验的P值为()A0.036B0.072C0.928D0.9646.如果某项假设检验的结论在0.05的显著性水平下是显著的(即在0.05的显著性水平下拒绝了原假设),则错误的说法是()A.检验的P值不大于0.05B.在0.01的显著性水平下不一定具有显著性C.原假设为真的概率小于0.05D.在0.10的显著性水平下必定也是显著的7.关于检验统计量,下列说法中错误的是()A检验统计量是样本的函数B检验统计量包含未知总体参数C在原假设成立的前提下检验统计量的分布是明确可知的D检验同一总体参数可以采用多个不同检验统计量8.已知总体服从正态分布,现抽取一容量为15的样本对总体方差进行假设检验,0H:2=1;1:21H。=0.05,则原假设的拒绝区域为()A(0,23.685)B(0,24.996)C(0,6.571)D(0,7.261)9.对两个总体方差相等性进行检验(H1:σ12≠σ22)。检验的P值越小说明()A.两样本方差的差别越大B.两总体方差的差别越大C.越有信心断定两样本方差有差别D.越有信心断定两总体方差有差别10.在方差分析中,组内平方和是指()A各水平内部的观察值与其均值的离差平方和B各水平总体均值之间的离差平方和C由各水平效应不同所引起的离差平方和D试验条件变化所引起的离差平方的总和二、多项选择题(在5个备选答案中选择2-5个正确答案)1.若θ是待检验参数,θ0代表参数θ的某个具体数值。下列假设检验形式写法错误的有()AH0:θ=1,H1:θ<1BH0:θ0=100,H1:θ0<100CH0:θ≥1,H1:θ1DH0:θ=100,H1:θ≤100EH0:θ≠1,H1:θ=12.某机场的塔台面临一个决策问题:如果荧幕上出现一个小的不规则点,并逐渐接近飞机时,工作人员必须作出判断:H0:一切正常,那只是荧幕上受到一点干扰罢了;H1:可能会发生碰撞意外。在这个问题中()A.错误地发出警报属于第一类错误B.错误地发出警报属于第二类错误C.错误地发出警报的概率为αD.错误地发出警报的概率为βE.α的数值宜小3.随机抽取200个家庭,测得拥有汽车的家庭占26.5%,若要求检验总体这一比率是否超过了25%,下列陈述中正确的有()A.此检验应为双侧检验B.此检验应为单侧检验C.200/%5.73%5.26|%25%5.26|ZD.200/%5.73%5.26%25%5.26ZE.200/%75%25%25%5.26Z4.若采用方差分析法来推断某个因素对所考察的指标有无显著影响,该因素有K个水平,样本容量为n,则下列表述中正确的有()A检验统计量=组间方差/组内方差B组间方差=组间平方和/(K-1)C检验统计量=组间平方和/组内平方和D组间方差=组间平方和/(n-K)E检验统计量的分布为F(K-1,n-K)5.运用单因素方差分析法,则下列表述中正确的有()A组间方差显著大于组内方差时,该因素对所考察指标的影响显著B组内方差显著大于组间方差时,该因素对所考察指标的影响显著C拒绝原假设时,可推断各水平的效应完全没有相同的D拒绝原假设时,可推断各水平的效应是不完全相同的E各水平下的样本单位数可以相等也可以不等三、判断分析题(判断正误,并简要说明理由)1.有个研究者猜测,某贫困地区失学儿童中女孩数是男孩数的3倍以上(即男孩数不足女孩数的1/3)。为了对他的这一猜测进行检验,拟随机抽取50个失学儿童构成样本。那么原假设可以为:H0:P≤1/3。2.对某一总体均值进行假设检验,H0:μ=100,H1:μ≠100。检验结论是:在1%的显著性水平下,应拒绝H0。据此可认为:(1)对原假设进行检验的P值小于1%;(
本文标题:概率与数理统计第8章--假设检验与方差分析
链接地址:https://www.777doc.com/doc-6258053 .html