您好,欢迎访问三七文档
第八章假设检验第一节假设检验的基本问题•§8.1假设检验的基本概念•对总体的概率分布或分布参数作出某种“假设”,根据抽样得到的样本观测值,运用数理统计的分析方法,检验这种“假设”是否正确,从而决定接受或拒绝“假设”,这就是本章要讨论的假设检验问题。1、什么是假设?•假设:定义为一个调研者或管理者对被调查总体的某些特征所做的一种假定或猜想。是对总体参数的一种假设。常见的是对总体均值或比例和方差的检验;在分析之前,被检验的参数将被假定取一确定值。我认为到KFC消费的人平均花费2.5美元!2、市场调研中常见的假设检验问题一项跟踪调查的结果表明,顾客对产品的了解程度比6个月前所做的类似调查中的显示要低。结果是否明显降低?是否低到需要改变广告策略的程度?一位产品经理认为其产品购买者的平均年龄为35岁。为检验其假设,他进行了一项调查,调查表明购买者平均年龄为38.5岁。调查结果与其观点的差别是够足以说明此经理里的观点是不正确的?3、问题在哪里?某广告商宣称其代理的A产品的合格率达到99%,质检人员为了验证,随机抽取了一件产品,发现是一件次品。质检人员会是什么反应呢?什么是假设?•对总体参数的一种看法–总体参数包括总体均值、比例、方差等–分析之前必需陈述什么是假设检验?1.概念–事先对总体参数或分布形式作出某种假设–然后利用样本信息来判断原假设是否成立2.类型–参数假设检验–非参数假设检验3.特点–采用逻辑上的反证法–依据统计上的小概率原理假设检验的基本思想...因此我们拒绝假设=20...如果这是总体的真实均值样本均值m=50抽样分布H0这个值不像我们应该得到的样本均值...204.小概率原理小概率原理是假设检验的基本依据,即认为小概率事件在一次试验中几乎是不可能发生的。当进行假设检验时,先假设H0正确,在此假设下,若小概率事件A出现的概率很小,例如P(A)=0.01,经过取样试验后,A出现了,则违反了上述原理,我们认为这是一个不合理的结果。这时,我们只能怀疑作为小概率事件A的前提假设H0的正确性,于是否定H0。反之,如果试验中A没有出现,我们就没有理由否定假设H0,从而做出接受H0的结论。下面我们通过实例来说明假设检验的基本思想及推理方法。5、原假设和备择假设原假设是关于总体均值而非样本统计量的假设总是假设原假设是正确的原假设可能被接受也可能被拒绝备择假设是原假设的对立备择假设可能被接受也可能被拒绝备择假设是试图要建立的检验8.2假设检验的基本思路与方法•假设检验的步骤–提出原假设和备择假设–确定适当的检验统计量–规定显著性水平–计算检验统计量的值–作出统计决策提出原假设和备择假设•什么是原假设?(NullHypothesis)•1.待检验的假设,又称“0假设”•2.如果错误地作出决策会导致一系列后果•3.总是有等号,或•4.表示为H0–H0:m某一数值–指定为=号,即或–例如,H0:m3190(克)为什么叫0假设•什么是备择假设?(AlternativeHypothesis)•1.与原假设对立的假设•2.总是有不等号:,或•3.表示为H1–H1:m某一数值,或m某一数值–例如,H1:m3910(克),或m3910(克)提出原假设和备择假设•什么检验统计量?1.用于假设检验问题的统计量2.选择统计量的方法与参数估计相同,需考虑1.是大样本还是小样本2.总体方差已知还是未知3.检验统计量的基本形式为确定适当的检验统计量nxzm0规定显著性水平•什么是显著性水平?•1.是一个概率值•2.原假设为真时,拒绝原假设的概率–被称为抽样分布的拒绝域•3.表示为(alpha)–常用的值有0.01,0.05,0.10•4.由研究者事先确定作出统计决策1.计算检验的统计量2.根据给定的显著性水平,查表得出相应的临界值Z或Z/23.将检验统计量的值与水平的临界值进行比较4.得出接受或拒绝原假设的结论两类错误分析小概率原理是假设检验的基本依据,然而,对于小概率事件,无论其概率多么小,还是可能发生的,所以,利用小概率原理为基础的假设检验方法进行检验,可能会做出错误的判断,主要有两种形式(1)原假设H0实际是正确的,但却错误地拒绝了H0,这样就犯了“弃真”的错误,通常称为第一类错误。由于仅当所考虑的小概率事件A发生时才拒绝H0,所以犯第一类错误的概率就是条件概率:(2)原假设H0实际是不正确的,但是却错误地接受了H0,这样就犯了“取伪”的错误,通常称为第二类错误。犯第二类错误的概率记为。)|(00真拒HHP•我们自然希望犯这两类错误的概率越小越好。但当样本容量n确定后,犯这两类错误的概率不可能同时被控制,通常在我们根据历史经验选取恰当的显著性水平后,通过扩大样本容量n的方式来使第二类错误的概率减小。H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假接受H01-第二类错误()拒绝H0第一类错误()功效(1-)假设检验就好像一场审判过程统计检验过程错误和错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小第二节单一总体参数的假设检验Z检验(单尾和双尾)t检验(单尾和双尾)Z检验(单尾和双尾)c2检验(单尾和双尾)均值一个总体比例方差•建立假设的三种情况:是生产的统计依据)可以得出结论,作为可(24:24:10mmHH新型汽化器提高燃料效率的评估•检验某项声明的有效性:怀疑生产厂商的陈述)(6.67:6.67:10mmHH制造商对产品质量的承诺•决策情况下的检验:拒绝接受零配件)(2:2:10mmHH质量把关的依据双侧检验与单侧检验(假设的形式)假设研究的问题双侧检验左侧检验右侧检验H0m=m0mm0mm0H1m≠m0mm0mm0双侧检验(原假设与备择假设的确定)1.双侧检验属于决策中的假设检验。也就是说,不论是拒绝H0还是接受H0,我们都必需采取相应的行动措施2.例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格3.建立的原假设与备择假设应为•H0:m10H1:m10双侧检验(确定假设的步骤)•1.例如问题为:检验该企业生产的零件平均长度为4厘米•2.步骤–从统计角度陈述问题(m=4)–从统计角度提出相反的问题(m4)•必需互斥和穷尽–提出原假设(m=4)–提出备择假设(m4)•有符号•提出原假设:H0:m=4•提出备择假设:H1:m4该企业生产的零件平均长度是4厘米吗?(属于决策中的假设)双侧检验(例子)双侧检验(显著性水平与拒绝域)抽样分布H0值临界值临界值/2/2样本统计量拒绝域拒绝域接受域1-置信水平双侧检验(显著性水平与拒绝域)H0值临界值临界值/2/2样本统计量拒绝域拒绝域接受域抽样分布1-置信水平双侧检验(显著性水平与拒绝域)H0值临界值临界值/2/2样本统计量拒绝域拒绝域接受域抽样分布1-置信水平双侧检验(显著性水平与拒绝域)H0值临界值临界值/2/2样本统计量拒绝域拒绝域接受域抽样分布1-置信水平例1某车间为了提高零件的强度进行了技改,已知零件强度X(单位:kg/mm2)服从正态分布N(52.8,0.82),其中μ0=52.8kg/mm2是零件强度,现进行了技改后,抽取n=16的样本,测得强度为:(kg/mm2)51.953.452.954.353.852.453.754.052.452.553.551.354.952.854.552.9假设2=0.82不变,试问技改后零件强度是否发生了实质性变化?我们的问题就是:已知总体,且要求检验下面的假设:通常把H0称为原假设或零假设,把H1称为备择假设或对立假设。从取样结果看,样本均值与总体均值之间存在差异,这种差异是因为抽样的随机性导致的不可避免的误差,还是因为技改而导致的实质性差异?),(~200uNX22028.08.52:00mmH8.52:1mH2.53xx8.520m为了回答这个问题,首先给定一个小概率,称为显著性水平,通常取较小的值,如0.05,0.01。在本例中,我们选取。选取统计量,它包含待检验参数,当H0为真时,它的分布是已知的,本例中,选取于是有05.0)1,0(~/0Nnxzm202/mznxPzzP其中,Z/2为临界值,查表得Z0.025=1.96。|z|的拒绝域为:(1.96,)将抽样值代入4-1式得:|z|落入拒绝域中,即小概率事件竟然出现,于是否定假设H0,认为技改后零件强度发生了变化。96.1216/8.08.522.53/025.00znxzm应当注意的是,上面例1的结论是在显著性水平的情况下得出的,如果,则,代入观察值,则会得出,技改后零件强度无实质变化的相反结论。可见,原假设取舍与否与的取值直接相关,当我们倾向于不要轻易否定H0时,可取小一些;反之,取大一些。05.001.058.2005.02/zz005.02zz)%95(96.105.051002.061.66H6cm22011的可靠程度否定原假设即有因此这批产品不合格。,体平均数存在显著差异,说明样本平均数和总因为时,对应的临界值:;:解::选择检验统计量方法mmmZZZnXUcmH某种产品的直径为6cm时,产品为合格,现随机抽取100件作为样本进行检查,得知样本平均值为6.1cm,现假设标准差为0.2cm,令α=0.05,检验这批产品是否合格。假设检验与区间估计的联系以该批产品不合格。未包含在该区间内,所),即:的区间为:的就不否定原假设如果求出的区间包含:方法,614.606.6(1002.096.11.696.195%,2mmmnXHO单侧检验(原假设与备择假设的确定)•检验研究中的假设1.将所研究的假设作为备择假设H12.将认为研究结果是无效的说法或理论作为原假设H0。或者说,把希望(想要)证明的假设作为备择假设3.先确立备择假设H1单侧检验(原假设与备择假设的确定)例如,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上–属于研究中的假设–建立的原假设与备择假设应为•H0:m1500H1:m1500例如,改进生产工艺后,会使产品的废品率降低到2%以下–属于研究中的假设–建立的原假设与备择假设应为•H0:m2%H1:m2%单侧检验(原假设与备择假设的确定)•检验某项声明的有效性1.将所作出的说明(声明)作为原假设2.对该说明的质疑作为备择假设3.先确立原假设H0–除非我们有证据表明“声明”无效,否则就应认为该“声明”是有效的单侧检验(原假设与备择假设的确定)例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在10000小时以上除非样本能提供证据表明使用寿命在10000小时以下,否则就应认为厂商的声称是正确的建立的原假设与备择假设应为•H0:m10000H1:m10000•提出原假设:H0:m10000•选择备择假设:H1:m10000该批产品的平均使用寿命超过10000小时吗?(属于检验声明的有效性,先提出原假设)单侧检验(例子)单侧检验(显著性水平与拒绝域)H0值临界值样本统计量拒绝域接受域抽样分布1-置信水平左侧检验(显著性水平与拒绝域)H0值临界值样本统计量拒绝域接受域抽样分布1-置信水平观察到的样本统计量左侧检验(显著性水平与拒绝域)H0值临界值样本统计量拒绝域接受域抽样分布1-置信水平均值的单尾Z检验(实例)•【例】某批发商欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中随机抽取100只灯泡,测得样本均值为960小时。批发商是否应该购买这批灯泡?(=0.05)均值的单尾Z检验(
本文标题:第八章 假设检验
链接地址:https://www.777doc.com/doc-4042242 .html