您好,欢迎访问三七文档
假设检验假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验假设检验的一般问题一、什么是假设检验二、假设检验的基本思想三、双侧检验和单侧检验四、假设检验中的拒绝域和接受域五、假设检验的两类错误六、假设检验中的P值七、假设检验的步骤一什么是假设?(hypothesis)对总体参数的的数值所作的一种陈述总体参数包括总体均值、比例、方差等分析之前必需陈述我认为该地区新生婴儿的平均体重为3190克!一什么是假设检验?(hypothesistesting)1.事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立2.有参数假设检验和非参数假设检验3.采用逻辑上的反证法,依据统计上的小概率原理二、假设检验的基本思想假设检验所依据的基本原理是小概率原理。什么是小概率?概率是0~1之间的一个数,因此小概率就是接近0的一个数著名的英国统计家RonaldFisher把20分之1作为标准,也就是0.05,从此0.05或比0.05小的概率都被认为是小概率Fisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的•什么是小概率原理?小概率原理——发生概率很小的随机事件(小概率事件)在一次实验中几乎是不可能发生的。根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。检验中使用的小概率是检验前人为指定的。•小概率原理举例:某工厂质检部门规定该厂产品次品率不超过4%方能出厂。今从1000件产品中抽出10件,经检验有4件次品,问这批产品是否能出厂?如果假设这批产品的次品率P≤4%,则可计算事件“抽10件产品有4件次品”的出现概率为:可见,概率是相当小的,1万次实验中可能出现4次,然而概率如此小的事件,在一次实验中居然发生了,这是不合理的,而不合理的根源在于假设次品率P≤4%,因而认为假设次品率P≤4%是不能成立的,故按质检部门的规定,这批产品不能出厂。00042.0)04.01()04.0()4(6441010CP假设检验的基本思想...因此我们拒绝假设=50...如果这是总体的真实均值样本均值=50抽样分布H0这个值不像我们应该得到的样本均值...20•假设检验的两个特点:第一,假设检验采用逻辑上的反证法,即为了检验一个假设是否成立,首先假设它是真的,然后对样本进行观察,如果发现出现了不合理现象,则可以认为假设是不合理的,拒绝假设。否则可以认为假设是合理的,接受假设。第二,假设检验采用的反证法带有概率性质。所谓假设的不合理不是绝对的,而是基于实践中广泛采用的小概率事件几乎不可能发生的原则。至于事件的概率小到什么程度才算是小概率事件,并没有统一的界定标准,而是必须根据具体问题而定。如果一旦判断失误,错误地拒绝原假设会造成巨大损失,那么拒绝原假设的概率就应定的小一些;如果一旦判断失误,错误地接受原假设会造成巨大损失,那么拒绝原假设的概率就应定的大一些。小概率通常用α表示,又称为检验的显著性水平。通常取α=0.05或α=0.01,即把概率不超过0.05或0.01的事件当作小概率事件。提出原假设和备择假设什么是原假设?(nullhypothesis)1.待检验的假设,又称“0假设”2.研究者想收集证据予以反对的假设3.总是有等号,或4.表示为H0H0:某一数值指定为=号,即或例如,H0:3190(克)什么是备择假设?(alternativehypothesis)1.与原假设对立的假设,也称“研究假设”2.研究者想收集证据予以支持的假设总是有不等号:,或3.表示为H1H1:某一数值,或某一数值例如,H1:3910(克),或3910(克)提出原假设和备择假设三、双侧检验和单侧检验根据假设的形式不同,假设检验可以分为双侧假设检验和单侧假设检验。若原假设是总体参数等于某一数值,如H0:μ=μ0,即备择假设H1:μ≠μ0,那么只要μ<μ0和μ>μ0二者中有一个成立,就可以否定原假设。这种假设检验称为双侧检验。若原假设是总体参数大于等于或小于等于某一数值,如H0:μ≥μ0(即H1:μ<μ0);或H0:μ≤μ0(即H1:μ>μ0),那么对于前者当μ<μ0时,对于后者当μ>μ0时,可以否定原假设。这种假设检验称为单侧检验。可以分为左侧检验和右侧检验。双侧检验与单侧检验(假设的形式)假设研究的问题(总体均值检验)双侧检验左侧检验右侧检验H0=000H1≠000四、假设检验中的拒绝域和接受域在规定了检验的显著性水平α后,根据容量为n的样本,按照统计量的理论概率分布规律,可以确定据以判断拒绝和接受原假设的检验统计量的临界值。临界值将统计量的所有可能取值区间分为两个互不相交的部分,即原假设的拒绝域和接受域。对于正态总体,总体均值的假设检验可有如下图示:•正态总体,总体均值假设检验图示:1.双侧检验设H0:μ=μ0,H1:μ≠μ0,有两个临界值,两个拒绝域,每个拒绝域的面积为α/2。也称双尾检验。双侧检验示意图μ0双侧检验示意图(显著性水平与拒绝域)抽样分布H0值临界值临界值a/2a/2样本统计量拒绝域拒绝域接受域1-a置信水平双侧检验示意图(显著性水平与拒绝域)H0值临界值临界值a/2a/2样本统计量拒绝域拒绝域接受域抽样分布1-a置信水平观察到的样本统计量双侧检验示意图(显著性水平与拒绝域)H0值临界值临界值a/2a/2样本统计量拒绝域拒绝域接受域抽样分布1-a置信水平观察到的样本统计量双侧检验示意图(显著性水平与拒绝域)H0值临界值临界值a/2a/2样本统计量拒绝域拒绝域接受域抽样分布1-a置信水平观察到的样本统计量2.单侧检验有一个临界值,一个拒绝域,拒绝域的面积为α。分为左侧检验和右侧检验两种情况。单侧检验示意图(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域接受域抽样分布1-a置信水平⑴左侧检验设H0:μ≥μ0,H1:μ<μ0;临界值和拒绝域均在左侧。也称下限检验。μ0左侧检验示意图(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域接受域抽样分布1-a置信水平观察到的样本统计量左侧检验示意图(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域接受域抽样分布1-a置信水平观察到的样本统计量⑵右侧检验设H0:μ≤μ0,H1:μ>μ0;临界值和拒绝域均在右侧。也称上限检验。μ0右侧检验示意图(显著性水平与拒绝域)H0值临界值a样本统计量拒绝域接受域抽样分布1-a置信水平观察到的样本统计量右侧检验示意图(显著性水平与拒绝域)H0值临界值a样本统计量接受域抽样分布1-a置信水平拒绝域观察到的样本统计量五、假设检验的两类错误根据假设检验做出判断无非下述四种情况:1、原假设真实,并接受原假设,判断正确;2、原假设不真实,且拒绝原假设,判断正确;3、原假设真实,但拒绝原假设,判断错误;4、原假设不真实,却接受原假设,判断错误。假设检验是依据样本提供的信息进行判断,有犯错误的可能。所犯错误有两种类型:第一类错误是原假设H0为真时,检验结果把它当成不真而拒绝了。犯这种错误的概率用α表示,也称作α错误(αerror)或弃真错误。第二类错误是原假设H0不为真时,检验结果把它当成真而接受了。犯这种错误的概率用β表示,也称作β错误(βerror)或取伪错误。假设检验的两类错误正确决策和犯错误的概率可以归纳为下表:假设检验中各种可能结果的概率接受H0拒绝H0,接受H1H0为真1-α(正确决策)α(弃真错误)H0为伪β(取伪错误)1-β(正确决策)•假设检验两类错误关系的图示以单侧上限检验为例,设H0:μ≤μ0,H1:μ>μ0弃真错误区取伪错误区从上图可以看出,如果临界值沿水平方向右移,α将变小而β变大,即若减小α错误,就会增大犯β错误的机会;如果临界值沿水平方向左移,α将变大而β变小,即若减小β错误,也会增大犯α错误的机会。图(a)μ≤μ0H0为真图(b)μ=μ1>μ0H0为伪a错误和错误的关系a你不能同时减少两类错误!a和的关系就像翘翘板,a小就大,a大就小在样本容量n一定的情况下,假设检验不能同时做到犯α和β两类错误的概率都很小。若减小α错误,就会增大犯β错误的机会;若减小β错误,也会增大犯α错误的机会。要使α和β同时变小只有增大样本容量。但样本容量增加要受人力、经费、时间等很多因素的限制,无限制增加样本容量就会使抽样调查失去意义。因此假设检验需要慎重考虑对两类错误进行控制的问题。•两类错误的控制准则假设检验中人们普遍执行同一准则:首先控制弃真错误(α错误)。假设检验的基本法则以α为显著性水平就体现了这一原则。两个理由:统计推断中大家都遵循统一的准则,讨论问题会比较方便。更重要的是:原假设常常是明确的,而备择假设往往是模糊的。如H0:μ=μ0很清楚,而H1:μ≠μ0则不太清楚,是μ<μ0还是μ>μ0?大多少小多少都不清楚。对含义清晰的数量标准进行检验更容易被接受。因此,第一类错误成为控制两类错误的重点。在固定α的条件下,可以考虑如何减小犯β错误的概率。此问题超出本课程范围,不予介绍。P值是用于确定是否拒绝原假设的另一重要工具,是现代统计检验中常用的检验统计量。传统的统计量检验方法是事先确定检验的显著性水平a,明确拒绝域,检验时只要检验统计量的值落入拒绝域就拒绝原假设。但a只给出检验结论可靠性(或犯弃真错误)的大致范围,无法给出某一样本观测结果与原假设不一致程度的精确度量。P值是当原假设为真时,得到特定样本观测结果及更极端结果的概率,其具体取值可以用计算机统计软件计算出来。如果P值很小,说明这种样本观测结果出现的可能性很小,有理由拒绝原假设。P值越小,拒绝原假设的理由就越充分。六、假设检验中的P值(P-value)假设检验中的P值影响P值的因素:样本数据与原假设值之间的差异样本量的大小被假设参数的总体分布利用P值进行假设检验的准则:将P值与事先确定的检验显著性水平a进行比较,若P值小于a,说明小概率事件发生,则拒绝原假设;若P值大于a,说明小概率事件没有发生,则不能拒绝原假设。双侧检验的P值图示a/2a/2样本统计量拒绝拒绝H0值临界值计算出的统计量值计算出的统计量值临界值1/2P值1/2P值抽样分布图左侧检验的P值图示H0值临界值a样本统计量拒绝域抽样分布图1-a置信水平计算出的统计量值P值右侧检验的P值图示H0值临界值a拒绝域抽样分布图1-a置信水平计算出的统计量值P值样本统计量七、假设检验的步骤㈠根据研究需要提出原假设H0和备择假设H1㈡确定适当的检验统计量㈢确定显著性水平α和临界值及拒绝域㈣根据样本数据计算检验统计量的值(或P值)㈤将检验统计量值与临界值比较,作出拒绝或接受原假设的决策T检验80/20原则一,配对T检验的基本概念用配对设计的均数的显著性检验有三种情况:1,自身比较,是指同一被试样本处理前后的比较;2,同一样本分成两半,用两种不同方法来测定;3,将年龄\性别\受教育程度进行配伍,随即分成两组.商务网站订单SPSS.二,单样本T检验检验在问卷分析中经常用到,尤其是通过李克特五级量表收集到的调查数据。比如:非常同意5、基本同意4、不能确定3、不太同意2、非常不同意1,收集到的数据都是1-5的离散值,还有诸如非常满意、比较满意、不满意等等。很容易发现一个问题,那就是五级量表中间值是3,如果我们的汇总结果能够显著与3不同,那我们的调查基本上是由意义的。也就是说,我们要判断一组数据是否显著不同于3,这个时候,就要用的单样本T检验。【源数据】假设我们已经通过李克特五级量表收集并整理好一份调查数据,包括个性服务、服务态度、促销活动、服务流程、总体满意度5个维度。量表为:非常同意5、
本文标题:假设检验
链接地址:https://www.777doc.com/doc-3154584 .html