您好,欢迎访问三七文档
第八章假设检验通过样本统计量得出的差异作出一般性结论,判断总体参数之间是否存在差异,这种推论过程称做假设检验。假设检验是推论统计中最重要的内容。假设检验的任务:就是事先对总体参数或总体分布作出一个假设,然后利用样本信息来判断原假设是否合理,从而决定是否接受原假设。本章主要内容:第一节假设检验的基本思想第二节假设检验的几个基本概念第三节假设检验的步骤第四节假设检验的方向性第五节假设检验中的两类错误第一节假设检验的基本思想•这是一个关于某药物对老鼠的迷路学习是否有效果的调查。设想有一个老鼠的总体,在一定的时间内,300次的迷路实验中,老鼠们正确无误地达到目的地的平均次数是145次,标准差是25,即μ=145,σ=25。从这个总体中随机地选出50只老鼠,给它们注射某药物后进行迷路实验。在相同时间内的300次迷路实验中,这50只老鼠正确无误地达到目的地的平均次数是152次,记为,显然样本平均比总体平均要多出7次。这个差异是随机抽样的误差引起的(原假设或虚无假设),还是药物效果引起的(备择假设)?152X甲药我认为这种新药的疗效比原有的药物更有效!统计学家意见H0:μ=145(原假设、零假设、虚无假设)药物学家意见H1:μ≠145(备择假设、研究假设、对立假设)我们已知:μ=145,σ=25,,样本方差未知。,根据标准化公式:查表p=0.47615,落入拒绝域,是小概率事件,我们可以判断:拒绝原假设H0,接受药物学家认为药物有效的假设H1。152X536.35025nX98.1536.37σ145152σμXn/Xz总体假设检验的过程抽取随机样本均值x=60我认为人的平均寿命是50岁提出假设拒绝假设别无选择!作出决策假设检验就是利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的过程,称为假设检验。假设检验是统计推论的重要组成部分。它可以帮助我们解释数据分析的结果,防止主观判断的错误。如法官判定一个人是否犯罪,首先是假定他“无罪”(H0),然后通过侦察寻找证据,如果掌握的证据充分,则拒绝“无罪”的假定(H0),判嫌疑人有罪;否则只能暂且认为“无罪”的假定(H0)成立。第二节假设检验的几个基本概念假设检验一般有两个相互对立的假设。1.原假设(nullhypothesis)H0:或称为零假设、虚无假设等。就是关于当前样本所属的总体与假设总体无区别的假设。2.备择假设(alternativehypothesis)H1(或称对立假设):是与原假设相互排斥的假设。假设检验就是要判断原假设H0是否正确,来决定接受还是拒绝H0。若接受H0,则拒绝H1,若拒绝H0,则接受H1。即H0为真,则H1为假;反之,H0为假,则H1为真。•3.检验统计量(teststatistic)-----用于检验的统计量。例如:检验统计量把它变动的值域分成不相交的两部分:接受域和拒绝域。如果样本的观测值进入拒绝域就拒绝原假设,进入接受域则接受原假设。图8-1z分布与拒绝域XXzσμnXt/s'μ4.小概率事件:样本统计量的值(随机事件)在其分布上出现的概率小于事先规定的水平,这个随机事件被称为小概率事件。假设检验的基本思想是概率性质的反证法。为了检验虚无假设,首先假定虚无假设为真,如果导致违反逻辑或违背人们常识和经验的不合理现象出现,则表明“虚无假设为真”的假定是不正确的,也就不能接受虚无假设。反证法是统计推论的一个重要特点。5.显著性水平:原假设为真时拒绝原假设的概率,也可以说是在统计推断时,可能犯错误的概率,用α表示,常设α=0.05,α=0.01。α值越小,越难拒绝原假设,推断的可靠性越大。α值越大,越容易拒绝原假设,推断的可靠性越小。6.显著性概率p值:原假设为真时,等于或大于观察值(绝对值)t0的概率。通常记为。若p值小于α,则拒绝原假设,反之接受原假设。,拒绝H0,接受H1,差别有统计学意义P,不拒绝H0,差别无统计学意义P)|||(00HttPp第三节假设检验的步骤1.建立原假设H0和备择假设H1(通常将想检验事件的逆事件作为原假设)。2.选取一个合适的检验统计量。3.事先决定显著性水平α,并找到分位点,从而决定拒绝域范围。4.如果z或t落在拒绝域,则拒绝H0的原假设,反之,则接受H0。例1某市高中入学考试数学平均分为68分,标准差为8.6.其中某所中学参加此次考试的46名学生的平均分为63.问此次考试该校数学平均分数是否与全市的平均分数有显著差异.①原假设H0:μ=68备择假设H1:μ≠68②计算统计量③已知显著性水平α=0.05,分位点④-3.94-1.96,z值落入拒绝域,检验结果是拒绝原假设,即该校数学平均分与全市的平均分有显著差异.94.346/6.86863/μσμnXXzX96.1z例2通常小学五年级学生做某个社会心理测验时,平均错误个数为25,标准差是4.3个。心理学者在研究领导行为与该心理测验的关系时随机抽出有明显领导行为的36名五年级学生实施该测验。结果发现这群学生的平均答错个数为23.5。试问领导行为明显的学生在这个社会心理测验中确实不同于普通学生吗?α=0.05解:①假设领导行为明显的学生与普通学生无差异H0:μ=25备择假设H1:μ25②计算统计量③已知显著性水平α=0.05,分位点,④-2.09-1.65,z值落入拒绝域,检验结果是拒绝原假设,即拒绝领导行为明显的学生在这个社会心理测验上的反应与普通学生反应无差异的假设。即有领导行为明显的学生在这个社会心理测验中错误个数要低于普通学生。09.236/3.4255.23/μσμnXXzX65.1z例2某学生听写英文单词5次,平均写对单词39个,无偏标准差为5个,假设这个学生的真正掌握单词是35个,试检验H0:μ=35,H1:μ35(显著性水平α=0.05)图8-2z统计量的左侧检验与拒绝域图8-3t统计量的右侧检验与拒绝域解:①假设该学生掌握单词数量H0:μ=35备择假设H1:μ35②选取统计量。由于总体方差未知,要用t统计量~t(n-1)分布。③已知显著性水平α=0.05,查表分位点,④1.7882.132,t值落入接受域,不能拒绝原假设,也就是说即使该学生连续默写5次,平均默对39个单词的情况下,也不能轻易否认他的真实水平是写对35个单词。nsxt/'0788.15/53539/'0nsxt132.2)4(95.0t第四节假设检验的方向性双侧检验:在检验统计量分布的两侧设置拒绝域的检验方式称为双侧检验。单侧检验:只在检验统计量分布的一侧设置拒绝域的检验方式称为单侧检验要根据检验的目的来选取单侧还是双侧检验:(1)如果只需要知道参数是否等于某个值θ=θ0,用双侧检验。H0:θ=θ0,H1:θ≠θ0只强调差异而不强调方向性的检验用双侧检验。(2)如果要预测参数是否大于或小于某个理论值或经验值时用单侧检验。H0:θ=θ0,H1:θθ0或H1:θθ0例3:已知,试检验H0:μ=40,H1:μ≠40解:①原假设H0:μ=40,备择假设H1:μ≠40。是双侧检验②选取统计量。由于总体方差已知,要用z统计量③已知显著性水平α=0.05,查表分位点,④1.3331.96,z值落入接受域,不能拒绝原假设。05.0,100,15,38nx333.15.12100/154038/0nxz96.12/1z例4一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?双侧检验绿色健康饮品绿色健康饮品255255总体均值的检验(2已知)H0:=255H1:255=0.05n=40检验统计量:z01.96-1.960.025拒绝H0拒绝H00.025决策:结论:不拒绝H0样本提供的证据显示“该天生产的饮料符合标准要求”。01.14052558.2550nxz总结假设检验基本步骤(1):总结假设检验基本步骤(1):总结假设检验基本步骤(2):总结假设检验基本步骤(3):确定显著性水平αα=0.05,α=0.01查表,确定分位点比较检验统计量和分位点值的大小总结假设检验基本步骤(4):检验统计量分位点值时,接受H0,拒绝H1,差异无统计学意义检验统计量分位点值时,拒绝H0,接受H1,差异有统计学意义。补充资料:教育统计软件包中用p值与显著性水平进行比较。,拒绝H0,接受H1,差别有统计学意义P,不拒绝H0,差别无统计学意义P第五节假设检验中的两类错误对于总体参数的假设检验,有可能犯两类错误:第一类错误:当H0为真时,而样本的观察值落入拒绝域,按给定的法则应当拒绝H0,这类错误为第一类错误,即型错误。第二类错误:当H0为假(不正确)时,但却接受了H0,这类错误为第二类错误,即型错误。表8-1两类错误H0为真H0为假接受H0正确型错误拒绝H0型错误正确图8-4犯第一类错误()与第二类错误()概率示意图H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假未拒绝H0正确决策(1–a)第Ⅱ类错误(b)拒绝H0第Ⅰ类错误(a)正确决策(1-b)假设检验就好像一场审判过程统计检验过程与间的关系与间的关系就象跷跷板,小,就大,大,就小;错误和错误的关系你要同时减少两类错误的惟一办法是增加样本容量!和的关系就像翘翘板,小就大,大就小概率(1)称为检验力,(1)越大越好。对于一般的假设检验,定为0.05(或0.01),的大小取决于H1,通常情况下,比较总体间有无差异我们并不知道,即H1不明确,值的大小无法确定。也就是说,对于一般的假设检验,我们并不知道犯Ⅱ型错误的概率有多大。采取以下做法;①尽量提高显著性水平值,=0.05较之=0.01为好。②增加样本量,降低与,使得检验力(1)变大。③尽量使H0分布和H1分布的平均离得开些。④单侧检验优于双侧检验。作业1某小学历届毕业生汉语拼音测验平均分数为66分,标准差为11.7。现以同样的试题测验应届毕业生(假定应届与历届毕业生条件基本相同),并从中随机抽取18份试卷,算得平均分为69分,问该校应届与历届毕业生汉语拼音测验成绩是否一样?解:①原假设H0:μ=66,备择假设H1:μ≠66(双侧检验)。或H1:μ66(单侧检验)②选取统计量。由于总体方差已知,要用z统计量③已知显著性水平α=0.05,查表分位点,(双侧)(单侧检验)④1.091.96,z值落入接受域,不能拒绝原假设。该校应届与历届毕业生汉语拼音成绩无显著性差异。(建议用双侧检验)09.118/7.116669/nXZ96.12/1z65.1z作业2某区初三英语统一测验平均分数为65,该区某校20份试卷的分数为72,76,68,78,62,59,64,85,70,75,61,74,87,83,54,76,56,66,68,62。问该校初三英语平均分数与全区是否一样?解:①H0:μ=65H1:μ≠65②选取统计量。由于总体方差未知,要用t统计量,服从~t(n-1)分布。③已知显著性水平α=0.05,查表分位点t(19)0.05=2.093,④2.0932.266,t值落入拒绝域,说明该校初三英语平均分数与全区平均分数有本质区别(有差异)。266.220/474.9658.69/'474.9',8.69nSXtSX作业3某年高考某市数学平均分为60,现从参加此次考试的文科学生中,随
本文标题:教育统计学8
链接地址:https://www.777doc.com/doc-3849280 .html