您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 假设检验-PPT课件
假设检验假设检验参数估计统计推断在总体理论分布和小概率原理的基础上,通过提出假设、确定显著水平、计算统计数、做出推断等步骤来完成在一定概率意义上的推断。会出现两类错误。参数估计又分为区间估计和点估计,与假设检验比较,二者主要是表示结果的形式不同,其本质是一样的。常见的假设检验有:一样个本平均数的检验两个样本平均数的检验频率检验方差检验U检验或Z检验t检验卡方检验F检验§1假设检验概述Hypothesistest假设检验参数假设检验非参数假设检验总体分布已知,检验关于未知参数的某个假设总体分布未知时的假设检验问题一、解决的基本问题利用两组样本信息,根据一定概率对总体参数或分布的某一假设作出拒绝或保留的决断.。一个质量检验例子:本章讨论参数假设检验.生产流水线上罐装可乐不断地封装,然后装箱外运.怎么知道这批罐装可乐的容量是否合格呢?把每一罐都打开倒入量杯,看看容量是否合于标准.这样做显然不行!罐装可乐的容量按标准应在350毫升和360毫升之间.每隔一定时间,抽查若干罐.如每隔1小时,抽查5罐,得5个容量的值X1,…,X5,根据这些值来判断生产是否正常.通常的办法是进行抽样检查.方法:事先对生产状况提出一个假设,然后利用样本统计量的值检验提出的假设是否正确。(二)备择假设(alternativehypothesis),与原假设相对立(相反)的假设。一般为研究者想收集数据予以证实自己观点的假设。用H1表示。表示形式:H1:总体参数≠某值(<)(>)0H0:(=355)0例:H1:0二、两类假设(一)原假设(nullhypothesis),又称零假设,指检验前对总体参数值所做的假设。一般为研究者想收集证据予以反对的假设。用H0表示。表示形式:H0:总体参数=某值(≥)(≤)例:(三)两类假设建立原则1、H0与H1必须成对出现2、通常先确定备择假设,再确定原假设3、假设中的等号“=”总是放在原假设中例:予以检验的问题是“生产过程是否正常?”,研究者想收集证据检验“生产过程不正常”。(**正常时就无必要检查!)H1:350H0:350三、假设检验的原理,如何判断原假设H0是否成立呢?在实践中普遍采用小概率原则:小概率事件在一次试验中基本上不会发生.如果在H0条件下发生了小概率事件,则认为H0不正确四、双侧检验和单侧检验(一)双侧检验与单侧检验(三类假设的形式,以均值为例)假设研究的问题双侧检验左侧检验右侧检验H0=000H1≠000(二)双侧检验定义:只强调差异而不强调方向性的检验称为双侧检验。例:某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格。建立的原假设与备择假设应为H0:110H1:1102、双侧检验的显著性水平与拒绝域如果统计量的值界于左、右临界值间,则H0成立;如果大于右临界值或小于左临界值,H0不成立。抽样分布H0值临界值临界值a/2a/2样本统计量拒绝域拒绝域接受域1-a置信水平(三)单侧检验1、定义:强调方向性的检验叫单侧检验。目的在于检验研究对象是高于(右尾检验)或低于某一水平(左尾检验)。2、左尾检验(左侧检验)例如:改进生产工艺后,会使产品的生产时间降低到2小时以下–建立的原假设与备择假设应为H0:12H1:12单下尾检验(左侧检验)显著性水平与拒绝域:如果统计量的值大于左临界值,则H0成立;如果小于左临界值,H0不成立。H0值临界值a样本统计量拒绝域接受域抽样分布1-a置信水平3、右侧检验检验研究对象是否高于某一水平。•例:采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上–建立的原假设与备择假设应为•H0:11500H1:11500右侧检验显著性水平与拒绝:如果统计量值小于右临界值,则H0成立;如果大于右临界值,H0不成立。H0值临界值a样本统计量拒绝域接受域抽样分布1-a置信水平观察到的样本统计量五、假设检验中的两类错误(决策风险)如果H0实际上为真,但统计量的实测值落入了否定域,从而作出否定H0的结论,那就犯了“以真为假”的错误.如果H0不成立,但统计量的实测值未落入否定域,从而没有作出否定H0的结论,即接受了错误的H0,那就犯了“以假为真”的错误.请看下表H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假接受H01-a第二类错误(b)拒绝H0第一类错误(a)功效(1-b)假设检验就好像一场审判过程统计检验过程a/2a/2bH0真H0不真6062.56567.57072.57567.57072.57577.58082.5两类错误的关系两类错误是互相关联的,当样本容量固定时,一类错误概率的减少导致另一类错误概率的增加.要同时降低两类错误的概率,或者要在不变的条件下降低,需要增加样本容量.baabab六、假设检验的过程与步骤总体1、假设检验的过程(提出假设→抽取样本→作出决策)抽取随机样本均值X=20我认为人口的平均年龄是50岁提出假设拒绝假设!别无选择.作出决策2、假设检验的步骤–提出原假设和备择假设–确定适当的计算检验统计量的公式–规定显著性水平–由样本信息,计算检验统计量的值–作出统计决策提出原假设和备择假设1、提出原假设与备择假设。H0、H1是对立的,“先将研究者收集证据要证明的观点定为H1,再提出H0”。2、三种假设形式H0:参数某值H1:参数某值双侧检验H0:参数某值H1:参数某值右尾检验H0:参数某值H1:参数某值左尾检验1、根据不同类型的问题选择统计量2、选择统计量的方法与参数估计相同,需考虑–是大样本还是小样本–总体方差已知还是未知确定适当的检验统计量并计算值规定显著性水平a常用的a值有0.01,0.05,0.10a0.05“有显著性差异”a0.01“有极其显著性差异”a0.10“有明显的差异趋势”一般差异达到显著水平,则在资料的右上方标以“*”,差异达到极显著水平,则在资料右上方标以“**”。作出统计决策(1)临界值比较法•用计算出的统计量的值与双侧临界值,或单侧(左临界值、右临界值)比较。(2)利用P值法•P值是指统计量值在分布曲线上所截取的剩余面积值,可由计算机自动给出。•无论是双侧还是单侧检验问题:•当P≤α时,H0不成立;•Pα时,H0成立多重检验及校正在同一研究中,有时我们会用到二次或多次显著性检验,从上表可以看出,如果我们将显著性水平确定为α=0.05水平,做一次显著性检验后我们只能保证有95%的研究结果与真值是一致的;如果做两次显著性检验后,研究结果与真值的符合程度就会降至95%*95%=90.25,当我们进行5次显著性检验后,就会降至77.4%,即在5次显著性检验后,由α水平所得到的显著性检验结果的可靠性只有3/4的可靠性。校正方法1:Bonferroni校正法----如果研究中进行了n次显著性检验,则将每次显著性检验的水平降至0.05的n分之一倍。****或实验结果的P值的n倍,与0.05比较校正方法2:Newman-Keuls检验法(SNK,检验)校正方法3:最小显著差法(LSD法)校正方法4:Q-value检验在同一个研究中,所有显著性检验的p值的分布也是随机的,符合一定的分布规律,因此可以通过这个特点对所得到的所有p值进行校正,使之与总体相一致。§2样本平均数的假设检验检验问题:用从总体中抽取的一个样本的均值,检验该总体均值是否等于某个值。一、单样本均值显著性检验(One-samplettest)例:食品安全要求防腐剂添加量必须低于0.1g/kg,如何检验市场中投放的康氏方便面是否达标?方案:随机抽检20盒得到样本“防腐剂添加量均值”与0.1g/kg比较得出结论**********SPSS分析********方法1:总体方差已知时的检验•1、假定条件–总体服从正态分布–若不服从正态分布,可用正态分布来近似(n30)•2、原假设:H0:=0•备择假设:H1:03.使用z-统计量:)1,0(~0Nnxz方法2:总体方差未知时的均值检验*(2未知,小样本)•1.假定条件–总体为正态分布•2.使用t统计量)1(~0ntn-1sxt方法3:近似正态分布的检验•1t检验时,样本大于30•2总体非正态分布,样本大于300nsxZ'方法总结1、需要依据不同的数据特点选择不同的分析方法2、特点分析1:检验数据分布是否为正态分布?3、特点分析2:抽样数据样本是大样本还是小样本?单样本检验的SPSS分析操作•1、检验数据分布是否为正态分布(非参数统计分析)•2、无论是大样本还是小样本•SPSS菜单:•Analyze—》comparemean—》one-samplettest•输入μ0值(testvalue)与显著性水平(confidenceinterval)值•3、读取结果:用sig.值与0.05比较进行决策。*单样本检验结果读取实例One-SampleTestTestValue=100tdfSig.(2-tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUpperDQ2-14.898213.000-21.53255262-24.38161778-18.68348745用sig.值与0.05比较进行决策。结论:H0不成立检验问题:用两个样本平均数之间的差异值X1-X2检验所代表的两个总体之间u1-u2是否有差异?二、平均数差值的显著性检验例:如何检验某种新型降压药的治疗效果?方案:病例----对照研究•随机将高血压病人分为两组•或用同一组病人服药前、后•得到两个样本均值差异值•检验其是否等于“0”•得出结论**********SPSS分析********数据获取与分析方案•方案1:随机分组服药组服药后平均血压值统计分析方法:独立样本检验(Independent-samplesttest)•方案2:配对分组服药组服药前平均血压值统计分析方法:配对样本检验(Paired-samplesttest)未服药组平均血压值服药组服药后平均血压值(一)独立样本检验(Independent-samplesttest)用于处理生物学研究中比较不同处理效应的差异显著性。数据资料中,两个样本的各个变量从各自总体中抽取,两个样本之间变量没有任何关联,即两个抽样样本彼此独立,不论两个样本容量是否相同。•假定条件–两个样本是独立的随机样本–两个总体都是正态分布–若不是正态分布,可以用正态分布来近似(n130和n230)•原假设H0:12=0备择假设:H1:120•检验统计量2221212121)()(nnxxz2221212121)()(nsnsxxz或方法1:两个总体方差都已知(或方差未知大样本)有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得x2=50公斤,x1=44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别?(a=0.05)例题计算结果•H0:1-2=0•H1:1-20•a=0.05•n1=32,n2=40•临界值(s):检验统计量:决策:结论:拒绝H0有证据表明两种方法生产的产品其抗拉强度有显著差异83.240100326404050)()(2221212121nnxxzZ01.96-1.96.025拒绝H0拒绝H0.025两个总体方差未知,但相等。(1)假定条件–两个样本是独立随机样本–两个总体都是正态分布–两个总体方差未知但相等1222(样本方差差异不显著)(2)假设:原假设?备择假设?(3)检验统计量21212111)()(nnsxxtp
本文标题:假设检验-PPT课件
链接地址:https://www.777doc.com/doc-7285054 .html