您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 第六章 假设检验(Hypothesis test)
平均数的差异性t检验主讲人:朱丹2假设检验对总体参数、分布形式、相互关系等提出假设,然后利用样本数据来判断该假设论述的合理性。你相信他们的说法吗?你要如何去证明这些说法是正确或是错误?为检验此论述,进行随机抽样调查,以样本数据检验此假设是否成立。•假设来西藏旅游的外国旅客平均消费支出8000元。•有人提出拉萨市民人均月收入是2500元。•有人提出西藏大学学生的平均IQ测验分数是110。3假设检验产生假设检验的原因大致有两个:当对总体参数的真实性感到怀疑,需要通过样本来考察其正确与否时,往往借助于假设检验做出判断(决策)。当对变量间存在某种关系的证据(平均值之差、方差之比等)怀疑时,也会要求进行假设检验。4第六章假设检验第一节假设检验原理第二节单一总体均值的假设检验第三节两个总体均值差的假设检验第四节总体比例与方差的假设检验第五节SPSS在假设检验中的应用5第一节假设检验原理一、建立假设二、接受域和拒绝域三、两类错误四、假设检验的步骤五、p值(p-value)六、正确表述统计决策结果Back6一、建立假设原假设/虚无假设(nullhypothesis):H0研究者要收集证据予以反对的假设。将研究结果无效的说法作为原假设。设定总体参数等于某一数值。认为两个或两个以上总体参数相等。H0:μ=2500ORH0:μ≥2500(收入)H0:μ1=μ2(1会计,2企管,统计学成绩)“等号”始终在H0。7一、建立假设例如:你对某品牌洗涤剂的产品标签中声称:“平均净含量不低于500克”,感到质疑。你想要证实“平均净含量不足500克”。即你想要推翻的是μ≥500克,要证实μ<500克。此时,H0:μ≥500例如:你研究认为员工满意度和性别有关,你想要以样本数据来支持你的论点。此时,H0:员工满意度和性别无关8一、建立假设备择假设(alternativehypothesis):H1研究者要收集证据予以支持的假设。将研究结果有效的假设作为备择假设。与原假设对立,是要研究的问题。强调差异或方向性。例如,某品牌洗涤剂的产品,H1:μ<500例如,H1:员工满意度和性别有关9一、建立假设H0和H1是互斥的,主要有三种情况:双侧或双尾假设检验(two-tailedtest)H0:μ=2500,H1:μ≠2500单侧或单尾假设检验(one-tailedtest)右侧假设检验:H0:μ≤2500,H1:μ>2500左侧假设检验:H1:μ≥2500,H1:μ<2500双侧检验或单侧检验,根据H1来定。10例如:灯泡厂商在给用户提供一批灯泡时声称,该批灯泡的平均使用寿命是1600hr。为验证厂商的说法,需要用样本数据进行检验。提出假设:H0:μ=1600;H1:μ≠1600如果样本数据很接近1600hr,则可以接受H0;如果样本数据离1600hr很远,就会拒绝H0,接受H1。如果有人对用户说:灯泡的平均使用寿命低于1600hr。此时,用户要研究的是μ是否会小于1600hr。提出假设:H0:μ=1600;H1:μ<160011思考题:想要检验女性职员平均体重是否大于55公斤,如何提出原假设和备择假设?H0:μ=55;H1:μ55或H0:μ≦55;H1:μ55Back12二、接受域和拒绝域假设设定之后,我们需要一个判别标准,判断拒绝或接受H0。利用“小概率原理”,指发生概率很小的随机事件,在一次试验中几乎是不可能发生的。如果发生了,就可以拒绝提出的原假设。例如:有一个厂商声称其产品的合格品率很高,可以达到99%,则从一批产品(100件)中随机抽取1件,该件是次品的概率就非常小,只有1%。如果厂商的宣称是真的,随机抽取1件是次品的情况几乎是不可能发生的。如果这种情况发生了,我们就有理由怀疑原来的假设是否成立,这时我们可以推翻原来的假设。当然,推论也可能犯错误,确实有1件次品,刚好1次被抽到,这种错误概率是1%(显著水平)。13二、接受域和拒绝域以统计量(称检验统计量,teststatistic)的抽样分布为基础,给定小概率α,判断样本数据是否接受H0。检验统计量所有可能取值分两为部分,可以拒绝H0的检验统计量取值的集合称拒绝域。反之,称接受域,不拒绝H0。划分的数值称临界值。接受域的区间概率1-α,拒绝域的区间概率α。如何定义接受域和拒绝域?14双侧假设检验的拒绝域定义:2z2z•在抽样分布两端各α/2位置上确定拒绝域边界的临界值。××H0:μ=μ0;H1:μ≠μ0•只要μ>μ0或μ<μ0,二者之一成立,就可以否定H0。•它有两个拒绝域,两个临界值,每个拒绝域的概率α/2。临界值2z拒绝域:2002ZZZorZ样本数据计算出来的统计量Z0落在拒绝域,则拒绝H0。15单侧假设检验的拒绝域定义:•在抽样分布某一端的α位置上确定拒绝域边界的临界值。•单侧检验有一个拒绝域,一个临界值,拒绝域的概率α。右侧检验拒绝域:ZZ0z临界值×右侧假设检验拒绝域在右边,左侧假设检验拒绝域在左边。左侧检验拒绝域:Z0Z右侧检验图Back16三、两类错误以样本统计量推论总体参数,因为样本数据具随机性,存在判断正确和错误的四种概率:为真为假接受(正确判断)(取伪错误)拒绝(弃真错误)(正确判断)判断实际0H0H10H10H弃真错误又称第I类错误(TypeIerror)。取伪错误又称第II类错误(TypeIIerror)。假设检验时,希望正确判断并减少犯错误的概率。通过控制α(显著性水平,levelofsignificance)减少犯错,此种检验称显著性检验。Back17三、两类错误弃真错误如前例,厂商声称产品合格率是99%。100件中确实只有1件次品。进行抽样时,刚好1次被抽到次品,这种错误称弃真错误(第Ⅰ类错误),错误概率是1%(α)。取伪错误厂商声称产品合格率是99%,实际上仅有90%,表示100件中有10件次品。为了检验厂商宣称是否真实,我们随机抽取20件产品,结果都是合格品,于是我们推断厂商宣称是真实的。犯第二类错误,错误概率β。Back18四、假设检验的步骤Step1:提出原假设H0和备择假设H1例如:H0:μ=μ0;H1:μ≠μ0Step2:确定显著性水平α是决策中的风险。主观确定。α一般取0.05或0.01。19四、假设检验的步骤Step3:选择检验统计量(TestStatistic)假设检验也是从抽样分布出发,借由样本数据计算检验统计量的数值进行推断。确定H0为真时,检验统计量服从的抽样分布。1,0~0NnXZ•例如:总体服从正态分布,且σ已知,则构造检验统计量Z,在H0为真的情况下,有可以确定临界值,构造拒绝域和接受域。20四、假设检验的步骤Step4:计算检验统计量的数值根据样本数据计算检验统计量的数值。Step5:建立决策准则,进行判断根据α值和抽样分布,确定临界值。将检验统计量的数值与临界值相比较,做出是否拒绝H0的判断。或以检验统计量计算p值,确定是否拒绝H0。Back21五、p值(p-value)p值:H0为真时,由样本数据给出的犯第Ⅰ类错误的概率的精确数值(观察到的显著性水平)。统计软件给出检验统计量的数值时,一般都给出该检验统计量数值的p值。以p值进行假设检验:p值α,接受H0p值α,拒绝H0Back-1.961.96(临界值)p值/2计算的检验统计量数值α/2α/21-αp值/2以Zobs表示Z统计量的观测值:双侧检验時p值=P(|Z|≥Zobs)右侧检验时p值=P(Z≥Zobs)22六、正确表述统计决策结果统计决策得出:拒绝或不拒绝H0。“不拒绝H0”不等同于“接受H0”“不拒绝H0”只是说明根据现有样本不能认为H0有问题,但重新抽取一个样本就有可能推翻H0。如果说成“接受H0”,就等于认为H0在任何条件下都是成立的。没能拒绝H0,只是表示现有样本提供的证据还不足以拒绝它而已。故常用“拒绝H0”或“不拒绝H0”的表述方式。Back23第二节单一总体均值的假设检验西藏外国旅客平均旅游消费支出5000元?经管学院毕业生平均起薪为每月2500元?女性消费者每年在化妆品的平均支出3500元?2010级统计学平均成绩为70分?单一总体,关于定量数据的检验。24第二节单一总体均值的假设检验1.大样本2.小样本的正态总体,σ已知3.小样本的正态总体,σ未知假设检验步骤相同,主要区别在于选择适当的检验统计量,以利确定临界值和定义拒绝域。Back251.大样本检验统计量:1,0~NnXZ1,0~NnSXZ(σ已知)(σ未知)【例】26例题(★★★)对大批学生进行词汇记忆考查,得到总体均值μ=65,标准差σ=10。现抽取样本容量n=100的样本,对其进行记忆技巧培训后,得到样本均值X=69。试问:该培训是否能够提高词汇记忆任务的成绩。(α=0.05)27解:4100106569Z)1,0(~NnXZ64.1405.0ZZH0:μ=65;H1:μ65α=0.05,因为n=100为大样本,X=69,σ=10在H0为真的情况下,构造检验统计量:由样本数据计算检验统计量的数值:决策规则(如图),如果ZZ0.05拒绝H0因为检验统计量Z的数值落在拒绝域,所以拒绝H0。证据显示,参加培训后可以提高词汇记忆任务的成绩。Back64.105.0z282.小样本的正态总体,σ已知检验统计量:1,0~NnXZ【例】29例题()SAT测验分数遵从μ=500,σ=100的正态分布。一位老师办辅导班,希望能够提高学生的SAT分数。随机抽取16个学生参加他的辅导班,其参加测验后得到的平均分数X=554。试问:参加这个辅导班对学生的SAT分数有影响吗?(1)以α=0.05为检验标准,进行检验。(2)以α=0.01为检验标准,结论有变化吗?30(1)解:16.216100500554Z)1,0(~NnXZ64.1Z16.205.0ZH0:μ=500;H1:μ500在H0为真的情况下,构造检验统计量:由样本数据计算检验统计量的数值:决策规则(如图),如果ZZ0.05拒绝H0因为检验统计量Z的数值落在拒绝域,所以拒绝H0。证据显示,参加辅导班对学生的SAT分数有显著影响。64.105.0zα=0.05,正态总体,小样本n=16,X=554,σ=10031(2)解:16.216100500554Z)1,0(~NnXZ33.216.201.0ZZH0:μ=500;H1:μ500在H0为真的情况下,构造检验统计量:由样本数据计算检验统计量的数值:决策规则(如图),如果ZZ0.01拒绝H0因为检验统计量Z的数值落在接受域,所以不拒绝H0。证据显示,参加辅导班对学生的SAT分数没有影响。Back33.201.0zα=0.01,正态总体,小样本n=16,X=554,σ=100323.小样本的正态总体,σ未知检验统计量:1~ntnSXt【例】33例题:一位研究者编制问卷来评定抑郁水平,并对相同数量的正常人进行了测量,得到均值μ=55,且分数呈正态。测验中,高分表示抑郁程度高。为确定测验是否对那些有抑郁的个体有足够的敏感性,随机抽取一个抑郁症病人样本n=21,对其进行测试。得到一组数据如下:59,60,60,67,65,90,89,73,74,81,71,71,83,83,88,83,84,86,85,78,79病人在这一测验上的分数与正常人显著不同吗?(α=0.01)34解:92.92199.95562.76t845.292.920005.0ttH0:μ=55;H1:μ≠55α=0.01,正态总体,n=21为小样本,σ未知,以S估计在H0为真的情况下,构造检验统计量:由样本数据计算检验统计量的数值:双侧检验决策规则:tt0.005(21-1)或t-t0.005(21-1)
本文标题:第六章 假设检验(Hypothesis test)
链接地址:https://www.777doc.com/doc-3651407 .html