您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 沈阳理工大学徐静霞版统计学-(12)第6章-假设检验
LOGO第6章假设检验6.1假设检验的基本原理6.2总体均值的检验6.3总体比例的检验学习目标假设检验的基本原理。掌握假设检验的基本思想和假设检验中的一些基本问题,包括如何陈述假设、假设检验中的两类错误和显著性水平、检验统计量和拒绝域以及利用P值进行检验等。总体均值检验。掌握在大样本和小样本的条件下,对总体均值进行假设检验的程序。总体比例检验。掌握大样本情形下总体比例的检验方法。导入案例航空公司的售票超时了吗?航空公司服务规定,销售一张机票的平均时间为2分钟。为检验航空公司的售票服务质量,特抽验30名顾客购买机票所用时间组成的一个随机样本,下表是抽验的30个顾客的购买时间数据导入案例根据样本数据计算的平均值是2.18分钟,标准差为0.41分钟。根据参数估计方法得到的顾客购买机票所用时间的95%的置信区间为(2.03,2.33)分钟。调查人员发现这个区间内并没有包括2分钟。因此提出航空公司的售票超时,没有达到规定的标准要求。我们能否根据这一样本断定航空公司的售票时间没有达标呢?本章的内容将提供一套标准统计程序来检验这样的结论。18.2x18.2x18.2x6.1假设检验的基本原理6.1.1假设检验的基本思想6.1.2原假设和备择假设及其提出6.1.3假设检验中的两类错误6.1.4显著性水平6.1.5检验统计量与拒绝域6.1.6利用P值进行决策6.1.1假设检验的基本思想基本思想:利用样本信息来对总体参数提出的一个假设值做出拒绝和不拒绝的决策。决策的依据:小概率原理,是指概率很小的事件在一次试验中是不可能发生的。在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设假设(hypothesis)就是对总体参数的一种事先猜想,并将这种猜想的具体数值陈述出来,也称为称统计假设。假设检验(hypothesistest)就是对总体参数提出假设的基础上,利用样本信息来判断假设是否成立的一种统计方法。原假设(nullhypothesis)1.又称“0假设”,研究者想收集证据予以反对的假设,用H0表示2.所表达的含义总是指参数没有变化或变量之间没有关系3.最初被认为是成立的,之后根据样本数据确定是否有足够的证据拒绝它4.总是有符号,或H0:=某一数值H0:某一数值H0:某一数值例如,H0:10cm1.也称“研究假设”,研究者想收集证据予以支持的假设,用H1表示2.所表达的含义是总体参数发生了变化或变量之间有某种关系3.备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择假设4.总是有符号,或H1:某一数值H1:某一数值H1:某一数值备择假设(alternativehypothesis)1.原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设有且只有一个成立2.先确定备择假设,再确定原假设3.等号“=”总是放在原假设上4.因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)1.备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailedtest)2.备择假设具有特定的方向性,并含有符号“”或“”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“”,称为左侧检验备择假设的方向为“”,称为右侧检验双侧检验与单侧检验假设检验的基本形式假设双侧检验单侧检验左侧检验右侧检验原假设备择假设00:H00:H00:H01:H01:H01:H解:【例6.1】一种袋装酸奶采用自动生产线生产,每袋重量是150g,标准差为3g。为检验每袋重量是否符合要求,质检人员在某天生产的酸奶中随机抽取了50袋进行检验,试陈述用来检验生产过程是否正常的原假设和备择假设。150:1H(生产过程不正常)(生产过程正常)150:0H解:【例6.2】一个生产宇航飞行器的工厂需要经常购置一种耐高温的零件,要求抗热的平均温度是1250度。在过去,供货者提供的产品都符合要求,并从大量的数据获知零件抗热的标准差是150度,在最近的一批进货中随机测试了100个零件,其平均的抗热为1200度,问能否接受这批产品?试陈述用于检验的原假设与备择假设。1250:1H1250:0H(抗热性能达标,不拒绝采购)(抗热性能没达标,拒绝采购)CoCoCoCo(由于接打电话而造成交通事故的比例不超过30%)【例6.3】一家研究机构估计,由于接打电话而造成交通事故的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设。%30:0H%30:1H(由于接打电话而造成交通事故的比例超过30%)假设提出的主观性与研究目的尽管通过原假设与备择假设的概念就能确定两个假设的内容,但实质上它们是带有一定的主观色彩的,因为所谓的“将研究者对总体参数值提出的假设”和“研究者通过检验希望支持的假设”显然最终仍都取决于研究者本人的意向。所以,在面对某一实际问题时,由于不同的研究者有不同的研究目的,即使对同一问题也可能提出截然相反的原假设和备择假设,这是十分正常的,也并不违背关于原假设与备择假设的最初定义。无论怎样确定假设的形式,只要它们符合研究者的最终目的,便是合理的。6.1.3假设检验中的两类错误1.研究者总是希望能做出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误。2.原假设和备择假设不能同时成立,决策的结果要么拒绝H0,要么不拒绝H0。决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误3.第Ⅰ类错误(错误)原假设为正确时拒绝原假设第Ⅰ类错误的概率记为,被称为显著性水平4.第Ⅱ类错误(错误)原假设为错误时未拒绝原假设第Ⅱ类错误的概率记为(Beta)6.1.3假设检验中的两类错误法官判案的结论与后果判决结果实际情况嫌犯无罪嫌犯有罪法官判决无罪正确判决判决错误Ⅱ法官判决有罪判决错误Ι正确判决假设检验的结论与后果决策结果实际情况正确不正确未拒绝正确决策第二类错误拒绝第一类错误正确决策0H0H0H0H错误和错误的关系你要同时减少两类错误的惟一办法是增加样本量和的关系就像翘翘板,小就大,大就小两类错误的控制1.一般来说,对于一个给定的样本,如果犯第Ι类错误的代价比犯第Ⅱ类错误的代价相对较高,则将犯第Ⅰ类错误的概率定得低些较为合理;反之,如果犯第Ι类错误的代价比犯第Ⅱ类错误的代价相对较低,则将犯第Ⅰ类错误的概率定得高些。2.一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第Ι类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第Ι类错误的发生概率。6.1.4显著性水平假设检验中犯第一类错误的概率,称为显著性水平(levelofsignificance),记为α,是人们事先指定的犯第一类错误概率α的最大允许值。显著性水平是指当原假设实际上是正确时,检验统计量出现了本不应该出现的极端情况的概率。显著性水平α越小,犯第一类错误的可能性自然就越小,但犯第二类错误的可能性则随之增大。常用的显著性水平有α=0.01、α=0.05、α=0.1等,当然也可以取其他值,但一般不会大于0.1。依据什么做出决策?1.若假设为H0:=500,H1:500。样本均值为495,拒绝H0吗?样本均值为502,拒绝H0吗?2.做出拒绝或不拒绝原假设的依据是什么?3.传统上,做出决策所依据的是样本统计量,现代检验中人们直接使用由统计量算出的犯第Ⅰ类错误的概率,即所谓的P值6.1.5检验统计量与拒绝域根据样本观测结果计算得到的,并据以对原假设和备择假设做出决策的某个样本统计量,称为检验统计量(teststatistic)。标准化检验统计量(standardizedteststatistic)反映了点估计量(比如样本均值)与假设的总体参数(比如假设的总体均值)相比相差多少个标准差。拒绝域(rejectionregion)就是由显著性水平和相应的临界值所围成的区域。根据给定的显著性水平确定的拒绝域的边界值,称为临界值(criticalvalue)。点估计量的抽样标准差假设值点估计量标准化检验统计量用统计量决策(双侧检验)抽样分布H0临界值临界值/2/2拒绝H0拒绝H01-置信水平RegionofRejectionRegionofNonrejectionRegionofRejection用统计量决策(左侧检验)抽样分布H0临界值拒绝H01-置信水平RegionofRejectionRegionofNonrejection用统计量决策(右侧检验)抽样分布H0临界值拒绝H01-置信水平RegionofNonrejectionRegionofRejection统计量决策规则1.给定显著性水平,并计算出其临界值2.将检验统计量的值与的临界值比较3.作出决策双侧检验:I统计量I临界值,拒绝H0左侧检验:统计量-临界值,拒绝H0右侧检验:统计量临界值,拒绝H06.1.6利用P值进行决策如果原假设H0为是正确的,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P值(P-value),也称为观察到的显著性水平(observedsignificancelevel)。决策规则:若p值,拒绝H0P值1/2P值1/2临界值临界值0/2/2计算出的统计量值计算出的统计量值(a)双侧检验P值临界值0计算出的统计量值P值临界值0计算出的统计量值(b)左侧检验(c)右侧检验图:P值示意图1.用P值进行检验比根据统计量检验提供更多的信息2.统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少比如,根据统计量进行检验时,只要统计量的值落在拒绝域,我们拒绝原假设得出的结论都是一样的,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际的显著性是不同的。比如,统计量落在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异。而P值给出的是实际算出的显著水平,它告诉我们实际的显著性水平是多少P值决策与统计量的比较P值是用于确定是否拒绝原假设的另一个重要工具,它有效地补充了提供的关于检验可靠性的有限信息。统计量1统计量2拒绝H0的P1拒绝H0的0拒绝H0的P2图:拒绝H0的两个统计量的不同显著性假设检验结论的表述(“显著”与“不显著”)1.当拒绝原假设时,我们称样本结果是统计上显著的。拒绝原假设时结论是清楚的2.当不拒绝原假设时,我们称样本结果是统计上不显著的不拒绝原假设时,并未给出明确的结论,不能说原假设是正确的,也不能说它不是正确的。假设检验结论的表述(“不拒绝”不等于“接受”)1.假设检验的目的在于试图找到证据拒绝原假设,而不在于证明什么是正确的。2.当没有足够证据拒绝原假设时,不采用“接受原假设”的表述,而采用“不拒绝原假设”的表述。“不拒绝”的表述实际上意为着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确。3.“接受”的说法有时会产生误导,因为这种说法似乎暗示着原假设已经被证明是正确的了。但实事上,H0的真实值我们永远也无法知道,H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确。第一步:提出原假设H0和备择假设H1;第二步:从总体中抽出一个随机样本;第三步:构造合适的统计量,根据样本观测数据计算出检验统计量值;第四步:确定检验的显著性水平α,计算临界值,确定拒绝域;第五步:利用P值或利用临界值进行决策。其中P值决策既简单又精确,双侧检验若2P≥α,不拒绝原假设;若2P<α,拒绝原假设。在单侧检验中,若P≥α,不拒绝原假设;若P<α,则要拒绝原假设。假设检验的具体步骤:第6章假设检验6.1假设检验的基本原
本文标题:沈阳理工大学徐静霞版统计学-(12)第6章-假设检验
链接地址:https://www.777doc.com/doc-5820549 .html