您好,欢迎访问三七文档
8-1作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)第8章假设检验作者:中国人民大学统计学院贾俊平8-2作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)第8章假设检验8.1假设检验的基本问题8.2一个总体参数的检验8.3两个总体参数的检验8.4检验问题的进一步说明8-3作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)学习目标1.了解假设检验的基本思想2.掌握假设检验的步骤3.对实际问题作假设检验4.利用置信区间进行假设检验5.利用P-值进行假设检验8-4作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)8.1假设检验的基本问题8.1.1假设问题的提出8.1.2假设的表达式8.1.3两类错误8.1.4假设检验的流程8.1.5利用P值进行决策8.1.6单侧检验8-5作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)假设问题的提出8-6作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)什么是假设?(hypothesis)对总体参数的的数值所作的一种陈述总体参数包括总体均值、比例、方差等分析之前必需陈述8-7作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)什么是假设检验?(hypothesistesting)1.事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立2.有参数假设检验和非参数假设检验3.采用逻辑上的反证法,依据统计上的小概率原理8-8作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)提出原假设和备择假设什么是原假设?(nullhypothesis)1.待检验的假设,又称“0假设”2.研究者想收集证据予以反对的假设3.总是有等号,或4.表示为H0H0:某一数值指定为=号,即或例如,H0:3190(克)8-9作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)什么是备择假设?(alternativehypothesis)1.与原假设对立的假设,也称“研究假设”2.研究者想收集证据予以支持的假设总是有不等号:,或3.表示为H1H1:某一数值,或某一数值例如,H1:3910(克),或3910(克)提出原假设和备择假设8-10作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)假设检验中的两类错误(决策风险)8-11作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)假设检验中的两类错误1.第一类错误(弃真错误)原假设为真时拒绝原假设会产生一系列后果第一类错误的概率为被称为显著性水平2.第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为(Beta)8-12作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)假设检验的流程提出假设确定适当的检验统计量规定显著性水平计算检验统计量的值作出统计决策8-13作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)什么是检验统计量?1.用于假设检验决策的统计量2.选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知3.检验统计量的基本形式为确定适当的检验统计量nXZ08-14作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)规定显著性水平(significantlevel)什么是显著性水平?1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为(alpha)常用的值有0.01,0.05,0.104.由研究者事先确定8-15作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)作出统计决策1.计算检验的统计量2.根据给定的显著性水平,查表得出相应的临界值z或z/2,t或t/23.将检验统计量的值与水平的临界值进行比较4.得出拒绝或不拒绝原假设的结论8-16作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)利用P值进行决策8-17作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)什么是P值?(P-value)1.是一个概率值2.如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积3.被称为观察到的(或实测的)显著性水平H0能被拒绝的最小值8-18作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)双侧检验的P值/2/2Z拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值8-19作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)左侧检验的P值H0值临界值样本统计量拒绝域抽样分布1-置信水平计算出的样本统计量P值8-20作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)右侧检验的P值H0值临界值拒绝域抽样分布1-置信水平计算出的样本统计量P值8-21作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)利用P值进行检验(决策准则)1.单侧检验若p-值,不拒绝H0若p-值,拒绝H02.双侧检验若p-值/2,不拒绝H0若p-值/2,拒绝H08-22作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)双侧检验和单侧检验8-23作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)双侧检验与单侧检验(假设的形式)假设研究的问题双侧检验左侧检验右侧检验H0=000H1≠0008-24作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)双侧检验(原假设与备择假设的确定)1.属于决策中的假设检验2.不论是拒绝H0还是不拒绝H0,都必需采取相应的行动措施3.例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立4.建立的原假设与备择假设应为H0:10H1:108-25作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)双侧检验(显著性水平与拒绝域)抽样分布H0值临界值临界值/2/2样本统计量拒绝域拒绝域1-置信水平8-26作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)单侧检验(显著性水平与拒绝域)H0值临界值样本统计量拒绝域抽样分布1-置信水平8-27作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)8.2一个总体参数的检验8.2.1检验统计量的确定8.2.2总体均值的检验8.2.3总体比例的检验8.2.4总体方差的检验8-28作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)一个总体参数的检验Z检验(单尾和双尾)t检验(单尾和双尾)Z检验(单尾和双尾)2检验(单尾和双尾)均值一个总体比例方差8-29作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)总体均值检验8-30作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)总体均值的检验(检验统计量)总体是否已知?用样本标准差S代替t检验nSXt0小样本量n否是z检验nXZ0z检验nSXZ0大8-31作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)总体均值的检验(2已知或2未知大样本)1.假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n30)2.使用Z-统计量2已知:2未知:)1,0(~0NnXZ)1,0(~0NnSXZ8-32作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)2已知均值的检验(例题分析)【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05)双侧检验8-33作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)2已知均值的检验(例题分析)H0:=0.081H1:0.081=0.05n=200临界值(s):检验统计量:Z01.96-1.96.025拒绝H0拒绝H0.025决策:结论:在=0.05的水平上拒绝H0有证据表明新机床加工的零件的椭圆度与以前有显著差异83.2200025.0081.0076.00nxz8-34作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)2已知均值的检验(P值的计算与应用)第1步:进入Excel表格界面,选择“插入”下拉菜单第2步:选择“函数”点击第3步:在函数分类中点击“统计”,在函数名的菜单下选择字符“NORMSDIST”然后确定第4步:将Z的绝对值2.83录入,得到的函数值为0.997672537P值=2(1-0.997672537)=0.004654P值远远小于/2,故拒绝H08-35作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)2已知均值的检验(小样本例题分析)【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N~(1020,1002)。现从最近生产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(=0.05)单侧检验8-36作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)2已知均值的检验(小样本例题分析)H0:1020H1:1020=0.05n=16临界值(s):检验统计量:在=0.05的水平上拒绝H0有证据表明这批灯泡的使用寿命有显著提高决策:结论:4.216100102010800nxzZ0拒绝域0.051.6458-37作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)2未知大样本均值的检验(例题分析)【例】某电子元件批量生产的质量标准为平均使用寿命1200小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了100件作为样本,测得平均使用寿命1245小时,标准差300小时。能否说该厂生产的电子元件质量显著地高于规定标准?(=0.05)单侧检验8-38作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)2未知大样本均值的检验(例题分析)H0:1200H1:1200=0.05n=100临界值(s):检验统计量:在=0.05的水平上不拒绝H0不能认为该厂生产的元件寿命显著地高于1200小时决策:结论:5.1100300120012450nxzZ0拒绝域0.051.6458-39作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)总体均值的检验(2未知小样本)1.假定条件总体为正态分布2未知,且小样本2.使用t统计量)1(~0ntnSXt8-40作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)2未知小样本均值的检验(例题分析)【例】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。双侧检验8-41作者:贾俊平,中国人民大学统计学院统计
本文标题:统计学 假设检验
链接地址:https://www.777doc.com/doc-3738903 .html