您好,欢迎访问三七文档
第5章假设检验5.1假设检验的基本问题5.2一个总体参数的检验5.3两个总体参数的检验假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验学习目标1.假设检验的基本思想和原理2.假设检验的步骤3.一个总体参数的检验4.两个总体参数的检验5.P值的计算与应用6.用Excel进行检验5.1假设检验的基本问题一、假设的陈述二、两类错误与显著性水平三、统计量与拒绝域四、利用P值进行决策假设的陈述什么是假设?(hypothesis)对总体参数的具体数值所作的陈述总体参数包括总体均值、比率、方差等分析之前必须陈述我认为这种新药的疗效比原有的药物更有效!什么是假设检验?(hypothesistest)1.先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程2.有参数检验和非参数检验3.逻辑上运用反证法,统计上依据小概率原理假设检验的基本思想...因此我们拒绝假设=50...如果这是总体的假设均值样本均值=50抽样分布H0这个值不像我们应该得到的样本均值...20总体假设检验的过程抽取随机样本均值x=20我认为人口的平均年龄是50岁提出假设拒绝假设别无选择!作出决策原假设与备择假设原假设(nullhypothesis)1.研究者想收集证据予以反对的假设2.又称“0假设”3.总是有符号,或4.表示为H0H0:=某一数值指定为符号=,或例如,H0:10cm1.研究者想收集证据予以支持的假设2.也称“研究假设”3.总是有符号,或4.表示为H1H1:某一数值,或某一数值例如,H1:10cm,或10cm备择假设(alternativehypothesis)【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设提出假设(例题分析)解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为H0:10cmH1:10cm【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为H0:500H1:500500g【例】一家研究机构估计,某城市中家庭拥有汽车的比率超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设提出假设(例题分析)解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比率超过30%”。建立的原假设和备择假设为H0:30%H1:30%1.原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立2.先确定备择假设,再确定原假设3.等号“=”总是放在原假设上4.因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)双侧检验与单侧检验1.备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailedtest)2.备择假设具有特定的方向性,并含有符号“”或“”的假设检验,称为单侧检验或单尾检验(one-tailedtest)备择假设的方向为“”,称为左侧检验备择假设的方向为“”,称为右侧检验双侧检验与单侧检验双侧检验与单侧检验(假设的形式)假设双侧检验单侧检验左侧检验右侧检验原假设H0:=0H0:0H0:0备择假设H1:≠0H1:0H1:0两类错误与显著性水平假设检验中的两类错误1.第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设第Ⅰ类错误的概率记为被称为显著性水平2.第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设第Ⅱ类错误的概率记为(Beta)H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假未拒绝H0正确决策(1–)第Ⅱ类错误()拒绝H0第Ⅰ类错误()正确决策(1-)假设检验就好像一场审判过程统计检验过程错误和错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小影响错误的因素1.总体参数的真值随着假设的总体参数的减少而增大2.显著性水平当减少时增大3.总体标准差当增大时增大4.样本容量n当n减少时增大显著性水平(significantlevel)1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为(alpha)常用的值有0.01,0.05,0.104.由研究者事先确定假设检验中的小概率原理什么小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定检验统计量与拒绝域1.根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量2.对样本估计量的标准化结果原假设H0为真点估计量的抽样分布检验统计量(teststatistic)点估计量的抽样标准差假设值—点估计量标准化检验统计量3.标准化的检验统计量显著性水平和拒绝域(双侧检验)抽样分布0临界值临界值/2/2样本统计量拒绝H0拒绝H01-置信水平显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域(双侧检验)0临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平显著性水平和拒绝域(单侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平显著性水平和拒绝域(左侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量显著性水平和拒绝域(左侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平显著性水平和拒绝域(右侧检验)0临界值样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量显著性水平和拒绝域(右侧检验)0临界值样本统计量抽样分布1-置信水平拒绝H0决策规则1.给定显著性水平,查表得出相应的临界值z或z/2,t或t/22.将检验统计量的值与水平的临界值进行比较3.作出决策双侧检验:I统计量I临界值,拒绝H0左侧检验:统计量-临界值,拒绝H0右侧检验:统计量临界值,拒绝H0利用P值进行决策什么是P值?(P-value)1.在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率双侧检验为分布中两侧面积的总和2.反映实际观测到的数据与原假设H0之间不一致的程度3.被称为观察到的(或实测的)显著性水平4.决策规则:若p值,拒绝H0双侧检验的P值/2/2Z拒绝H0拒绝H00临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值左侧检验的P值0临界值样本统计量拒绝H0抽样分布1-置信水平计算出的样本统计量P值右侧检验的P值0临界值拒绝H0抽样分布1-置信水平计算出的样本统计量P值假设检验步骤的总结1.陈述原假设和备择假设2.从所研究的总体中抽出一个随机样本3.确定一个适当的检验统计量,并利用样本数据算出其具体数值4.确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5.将统计量的值与临界值进行比较,作出决策统计量的值落在拒绝域,拒绝H0,否则不拒绝H0也可以直接利用P值作出决策5.2一个总体参数的检验一、总体均值的检验二、总体比率的检验三、总体方差的检验一个总体参数的检验z检验(单尾和双尾)t检验(单尾和双尾)z检验(单尾和双尾)2检验(单尾和双尾)均值一个总体比率方差总体均值的检验总体均值的检验(作出判断)是否已知小样本容量n大是否已知否t检验nsxt0否z检验nsxz0是z检验nxz0是z检验nxz0总体均值的检验(大样本)总体均值的检验(大样本)1.假定条件正态总体或非正态总体大样本(n30)2.使用z检验统计量2已知:2未知:)1,0(~0Nnxz)1,0(~0Nnsxz总体均值的检验(2已知)(例题分析)【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?双侧检验绿色健康饮品绿色健康饮品255255总体均值的检验(2已知)(例题分析)H0:=255H1:255=0.05n=40临界值(c):检验统计量:z01.96-1.960.025拒绝H0拒绝H00.025决策:结论:不拒绝H0样本提供的证据表明:该天生产的饮料符合标准要求01.14052558.2550nxz总体均值的检验(z检验)(P值的计算与应用)第1步:进入Excel表格界面,直接点击“f(x)”(粘贴函数)第2步:在函数分类中点击“统计”,并在函数名的菜单下选择“NORMSDIST”,然后确定第3步:将z的绝对值1.01录入,得到的函数值为0.843752345P值=2(1-0.843752345)=0.312495P值远远大于,故不拒绝H0总体均值的检验(2未知)(例题分析)【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(=0.01)左侧检验50个零件尺寸的误差数据(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86总体均值的检验(2未知)(例题分析)H0:1.35H1:1.35=0.01n=50临界值(c):检验统计量:拒绝H0新机床加工的零件尺寸的平均误差与旧机床相比有显著降低决策:结论:6061.250365749.035.13152.1z-2.33z0拒绝H00.01总体均值的检验(z检验)(P值的计算与应用)第1步:进入Excel表格界面,直接点击“f(x)”(粘贴函数)第2步:在函数分类中点击“统计”,并在函数名的菜单下选择“ZTEST”,然后确定第3步:在所出现的对话框Array框中,输入原始数据所在区域;在X后输入参数的某一假定值(这里为1.35);在Sigma后输入已知的总体标准差(若未总体标准差未知则可忽略不填,系统将自动使用样本标准差代替)第4步:用1减去得到的函数值0.995421023即为P值P值=1-0.995421023=0.004579P值=0.01,拒绝H0用Excel计算P值总体均值的检验(z检验)(P值的图示)0-2
本文标题:第5章 假设检验
链接地址:https://www.777doc.com/doc-3206710 .html