您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第4章--假设检验-《管理统计学》课件
第4章假设检验4.1假设检验的基本原理4.2参数假设检验4.3非参数假设检验例:某种大量生产的袋装食品,按规定每袋重量不得少于250g。今从一批该种食品中任意抽取50袋,发现有6袋低于250g。若规定不符合标准的比例达到5%,食品就不得出厂,问该批食品能否出厂。从2000年的新生儿中随机抽取30个,测得其平均体重为3210g,而根据1999年的统计资料,新生儿的平均体重为3190g,问2000年的新生儿与1999年相比,体重有无显著差异。4.1.1假设检验的定义•统计假设:关于总体的分布以及分布中所含参数的各种论断.•假设检验:施加于一个或多个总体的概率分布或参数的假设–假设总体分布的形式或总体的参数有某种特征–判断原先的假设是否合理•合理:承认假设的正确性•不合理:否定原先的假设–对问题作出分析或推断假设检验的过程和思路——概率意义下的反证法总体假设总体的平均年龄是35岁判断样本均值是32岁样本35X32?样本均值=35基本原理抽样分布这是样本均值如果这是总体均值判断:拒绝or不拒绝零假设=35?32H04.1.2假设检验的分类•假设检验包括:参数假设检验和非参数假设检验–参数假设检验:X1,X2,…,Xn是来自分布形式已知、参数未知总体的样本,由其观测值检验假设H0:=0;H1:≠0,为已知实数–非参数假设检验:X1,X2,…,Xn是来自分布形式未知总体的样本,由其观测值检验假设H0:F(x)=F0(x,);H1:F(x)≠F0(x,),F0(x,)为已知分布函数4.1.3假设检验的基本原理•假设检验的基本思想–提出统计假设,根据小概率原理对其进行检验•实际推断原理/小概率原理–小概率事件:在某次试验或观测中,出现的概率很小的事件–小概率事件在一次试验中几乎不会发生–小概率事件发生,否定原来的假设假设检验基本原理假设检验的基本思想前提:承认原假设小概率事件发生大概率事件发生拒绝原假设接受原假设进行一次实验4.1.4原假设和备择假设•假设检验的三种形式–左尾检验、右尾检验和双尾检验–H0为原假设,H1为备择假设0100::1HH0100::2HH0100::3HH1-αμ=μ0xα接受H0临界值拒绝H01-αμ=μ0xα拒绝H0临界值接受H0μ=μ0x接受H0临界值1拒绝H0临界值2拒绝H0α/21-αα/2原假设与备择假设的确定•若想支持某种假设,把它作为备择假设,把该陈述的否定假设作为原假设•两种假设互斥且完备,接受H0,必须拒绝H1•一个特定形式的H1不只与唯一的H0相对4.1.5假设的两类错误分析4.1.5假设的两类错误分析4.1.5假设的两类错误分析•两类错误的对比情况表–为拒真概率,为存伪概率,1为检验功效•控制第一类型错误较为实际,即只分析原假设H0,这样的假设为显著性检验,为显著性水平接受拒绝H0真实正确的决定(1)第一类型错误()H0不真实第二类型错误()正确的决定(1)两类错误对比情况表对于一定的样本容量n,不能同时做到两类错误的概率都很小。如果减小α错误,就会增大犯β错误的机会;若减小β错误,也会增大犯α错误的机会。使α、β同时变小的办法就是增大样本容量。一般地说,哪一类错误所带来的后果越严重,危害越大,在假设检验中就应当把哪一类错误作为首要的控制目标。但在假设检验中,一般均首先控制犯α错误概率。两类错误关系4.1.6总体参数检验的步骤(1)提出假设–根据检验目标,对待推断的总体参数或分布提出一个基本假设(2)决定检验的显著性水平α–由被检验的统计量分布求出相应的临界值–该临界值为零假设的拒绝域和接受域的分界线(3)构造检验统计量,依据样本信息计算检验统计量的实际值(4)将实际求得的检验统计量取值与临界值进行比较,作出拒绝或接受零假设的决策–pα,拒绝零假设–pα,不应拒绝零假设举例1•某健身俱乐部主管经理估计会员的平均年龄是35岁,研究人员从2005年入会的新会员中随机抽取40人,调查得到他们的年龄数据如下。•试根据调查结果判断主管经理的估计是否准确?33283226373527293330352939342737343631292926192136384239363827222934362039372239①提出原假设和备选假设•原假设(Nullhypothesis)又称零假设,是需要通过样本推断其正确与否的命题,用H0表示。–本例中可以提出:H0:35;这里表示总体会员的平均年龄,意味着总体会员的平均年龄与主管经理估计的35岁没有差异。•与原假设对立的假设是备选假设,用H1表示。–在本例中,备选假设意味着“总体会员的平均年龄与主管经理估计的会员平均年龄35岁有显著差异”,可以表示为H1:≠35。•原假设与备选假设互斥,检验结果二者必取其一。原假设•1.陈述需要检验的假设–例如:H0:35•2.零假设用H0表示•3.代表“正常”的情形•4.总是包含等号“=”•5.检验以“假定原假设为真”开始备择假设•1.为原假设的对立情况–例如:H1:≠35•2.备择假设用H1表示•3.代表“不能轻易肯定的情况”•4.很少包含等号②确定适当的检验统计量•假设检验需要借助样本统计量进行统计推断,称为检验统计量。不同的假设检验问题需要选择不同的检验统计量。•在具体问题中,选择什么统计量,需要考虑的因素有:总体方差已知还是未知,用于进行检验的样本是大样本还是小样本,等等。•在本例中,由于n=4030是大样本,所以近似服从正态分布,以样本标准差代替总体标准差,所用的统计量是:_3.184/xsn_x③选取显著性水平,确定接受域和拒绝域•显著性水平(SignificantLevel):事先给定的形成拒绝域的小概率,用表示。–通常取0.01,0.05或0.10;这表明,当作出接受原假设的决定时,其正确的概率为99%,95%或90%。•拒绝域:原假设H0成立条件下,统计量落入的小概率区域。•接受域:统计量能够取值的非拒绝域。•本例为双侧检验,有–接受域:-1.96≤z≤1.96–拒绝域:z-1.96或z1.96/20.05,1.96Z•在实际应用中,一般是先给定了显著性水平,这样就可以由有关的概率分布表查到临界值(criticalvalue),从而确定H0的接受域和拒绝域。对于不同形式的假设,H0的接受域和拒绝域也有所不同。Z0拒绝域拒绝域接受域(1)双侧检验0拒绝域接受域(2)左单侧检验0拒绝域接受域(3)右单侧检验如图所示,双侧检验的拒绝域位于统计量分布曲线的两侧,左单侧检验的拒绝域位于统计量分布曲线的左侧,右单侧检验的拒绝域位于统计量分布曲线的右侧。④计算检验统计量的值•在提出原假设H0和备选假设H1,确定了检验统计量,给定了显著性水平以后,接下来就要根据样本数据计算检验统计量的值。其计算的基本公式为:•上式不是计算检验统计量的唯一公式•在本例中,_0/xZn_32353.184/5.96/40xsn⑤作出统计决策•根据样本信息计算出统计量z的具体值,将它与临界值相比较,就可以作出接受原假设或拒绝原假设的统计决策。•在本例中,由于z=3.1841.96,落在拒绝域内,所以拒绝原假设H0。可以得出结论:在0.05的显著性水平下,抽样结果的平均年龄显著低于主管经理的估计值,有理由认为经理的估计不准确。Z4.2参数假设检验4.2.1一个正态总体参数假设检验4.2.2一个正态总体参数假设检验的SPSS应用4.2.3两个正态总体参数假设检验4.2.4两个正态总体参数假设检验的SPSS应用假设检验的内容假设检验一个总体均值的假设检验未知已知大样本小样本两个总体均值差的假设检验4.2.1一个正态总体参数假设检验•已知的Z检验已知的Z检验•1.将样本统计量(如)转换为标准正态分布Z变量•2.与Z的临界值比较–如Z检验统计量的值落在临界域内则拒绝H0–否则,不能拒绝H0ZXXnxx/X已知,均值的双侧Z检验•1.假设–总体服从正态分布;–当(n30)时,不服从正态分布的总体可以用正态分布来近似。•2.零假设只有“=”号•3.使用Z检验统计量ZXXnxx/H0临界值临界值1/21/2样本统计量拒绝域拒绝域非拒绝域拒绝域抽样分布1-置信度举例•2005年北京市职工平均工资为32808元,标准差为3820元。现在随机抽取200人进行调查,测定2006年样本平均工资为34400元。按照5%的显著性水平判断该市2006年的职工平均工资与2005有无显著差异?解答•在本例题中,我们关心的是前后两年职工的平均工资有没有显著的差异,不涉及差异的方向,因此,本题属于双侧检验。检验过程如下:–(1)提出假设:H0:32808;H1:≠32808;–(2)总体标准差已知,大样本抽样,故选用Z统计量;–(3)显著性水平0.05,由双侧检验,查表可以得出临界值:。判断规则为:若z1.96或z-1.96,则拒绝H0;若-1.96≤z≤1.96,则不能拒绝H0。96.12/z–(4)计算统计量Z的值–(5)检验判断:由于,落在拒绝域,故拒绝原假设H0。–结论:以5%的显著性水平可以认为该市2006年的职工平均工资比2005年有明显的差异。19.2200/38203280833400/_nxZ/22.191.96ZZ已知,均值的单侧Z检验•1.假设–总数服从正态分布;–当(n30)时,不服从正态分布的总体可以用正态分布来逼近。•2.零假设只有或者号•3.使用Z检验统计量ZXXnxx/Z0Z0拒绝域拒绝域H0:0H1:0H0:0H1:0较小的值与H0不矛盾.拒绝域1-1-举例•已知某电子产品的使用寿命服从正态分布,根据历史数据,其平均使用寿命为8000小时,标准差为370小时。现采用新的机器设备进行生产,随机抽取了100个产品进行检测,得到样本均值为7910小时。试问在5%的显著性水平下,新的机器是否合格?解答•这是一个左单侧检验问题。抽样的目的是为了检测新机器生产的产品的使用寿命是否达到标准,我们比较关心的是使用寿命的下限,如果新产品的使用寿命与过去相比没有明显降低,则说明所使用的新机器合格;反之,则说明新机器不合格。检验过程如下:–(1)提出假设:H0:≥8000;H1:8000;–(2)总体标准差已知,大样本抽样,故选用Z统计量;–(3)显著性水平0.05,由单侧检验,查表可以得出临界值645.105.0zz–(4)计算统计量Z的值:–(5)检验判断:由于,落在拒绝域;故拒绝原假设H0。即认为产品的使用寿命有明显降低,新机器不合格。43.2100/37080007910/0_nxZZZ未知的大样本检验•1.假设–总体服从正态分布;–当(n30)时,不服从正态分布的总体可以用正态分布来近似。•2.使用Z检验统计量•3.将样本统计量转换为标准正态分布Z变量•4.与Z的临界值比较–如Z检验统计量的值落在临界域内则拒绝H0–否则,不能拒绝H0_/xZsn举例•某乳制品厂生产的一种盒装鲜奶的标准重量是495克。为了检测产品合格率,随机抽取100盒鲜奶,测得产品的平均重量为494克,标准差为6克,试以5%的显著性水平判断这批产品的质量是否合格。解答•产品的标准重量是495克,过轻或者过重都不符合产品质量标准。检验过程如下:–(1)提出假设:H0:495;H1:≠495;–(2)总体标准差未知,但是由于大样本抽样,故仍选用Z统计量–(3)显著性水平0.05,由双侧检验,查表可以得出临界值–(4)计算统计量Z的值,式中用s代替:–(5)检验判断:由于,落在接受域;故不能拒绝原假设H0,即不能说明这批产品的不符合质量标准。96.12/z/21.671.
本文标题:第4章--假设检验-《管理统计学》课件
链接地址:https://www.777doc.com/doc-7225947 .html