您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 第四章-总体均数的估计和假设检验
25第四章总体均数的估计和假设检验一、教学大纲要求(一)掌握内容1.抽样误差、可信区间的概念及计算;2.总体均数估计的方法;3.两组资料均数比较的方法,理解并记忆应用这些方法的前提条件;4.假设检验的基本原理、有关概念(如I、II类错误)及注意事项。(二)熟悉内容两样本方差齐性检验。(三)了解内容1.t分布的图形与特征;2.总体方差不等时的两样本均数的比较;3.等效检验。二、教学内容精要(一)基本概念1.抽样误差抽样研究中,样本统计量与总体参数间的差别称为抽样误差(samplingerror)。统计上用标准误(standarderror,SE)来衡量抽样误差的大小。不同的统计量,标准误的表示方法不同,如均数的标准误用XS表示,率的标准误用SP表示,回归系数的标准误用Sb表示等等。均数的标准误与标准差的区别见表4-1。表4-1均数的标准误与标准差的区别均数的标准误标准差意义反映X的抽样误差大小反映一组数据的离散情况记法X(样本估计值XS)(样本估计值S)计算X=nXS=nS=nX2)(S=1)(2nXX控制方法增大样本含量可减小标准误。个体差异或自然变异,不能通过统计方法来控制。2.可信区间(1)定义、涵义:即按预先给定的概率确定的包含未知总体参数的可能范围。该范26围称为总体参数的可信区间(confidenceinterval,CI)。它的确切含义是:CI是随机的,总体参数是固定的,所以,CI包含总体参数的可能性是1-。不能理解为CI是固定随机的,总体参数是随机固定的,总体参数落在CI范围内可能性为1-。当0.05时,称为95%可信区间,记作95%CI。当0.01时,称为99%可信区间,记作99%CI。(2)可信区间估计的优劣:一定要同时从可信度(即1-的大小)与区间的宽度两方面来衡量。(二)t分布与正态分布t分布与标准正态分布相比有以下特点:①都是单峰、对称分布;②t分布峰值较低,而尾部较高;③随自由度增大,t分布趋近与标准正态分布;当时,t分布的极限分布是标准正态分布。(三)总体均数的估计参数估计有点估计和区间估计两种方式。总体均数的估计,见表4-2。表4-2总体均数的估计点估计区间估计意义直接用样本统计量代替总体参数。用统计量X和xS确定一个有概率意义的区间,以该区间具有较大的可信度包含总体均数。估计方法以X作为估计值①小样本(xStX,2/,xStX,2/)②大样本(xSuX2/,xSuX2/)③两总体均数差值的可信区间(21,2/21xxStXX,21,2/21xxStXX)(四)两均数差别的比较1.样本均数和总体均数比较的t检验前提:服从正态分布0H:0;1H:0XSXt0,1n(4-1)2.配对设计的t检验前提:差值服从正态分布0H:0d;1H:0dddSdt,1n(4-2)3.成组设计的两样本均数比较的t检验前提:两组数据均服从正态分布;两组总体方差相等0H:21;1H:212121XXSXXt,221nn(4-3)其中,21XXS=21211nnSc,211212222112nnSnSnSc(4-4)21XXS表示两样本均数差值的标准误。274.单样本u检验前提:当样本较大(如n50)或总体0已知时nSXu/0(n较大时)(4-5)nXu/00(0已知时)(4-6)5.大样本均数比较的u检验前提:样本足够大成组设计的两样本均数比较可用:222121xxSSXXu(4-7)6.要推断组间没有差别或差别很小,应采用等效检验(squivalencetest)。(五)假设检验的步骤及有关概念1.基本思想:把握“小概率事件在一次抽样试验中是几乎不可能发生”的原理。2.步骤:①建立假设、选用单侧或双侧检验、确定检验水准;②选用适当检验方法,计算统计量;③确定P值并作出推断结论。3.I类错误:0H为真(实际无差别),假设检验结果拒绝0H,接受1H(推论有差别)所犯的错误称为I类错误(typeIerror),I类错误的概率记作。II类错误:1H为真(实际有差别),假设检验结果拒绝1H,接受0H(推论无差别)所犯的错误称为II类错误(typeIIerror),II类错误的概率记作。4.1-称为检验效能,过去称把握度(poweroftest),即两总体确有差别,按水准能发现该差别的能力。三、典型试题分析(一)单项选择题1.当样本含量增大时,以下说法正确的是()A.标准差会变小B.样均数标准误会变小C.均数标准误会变大D.标准差会变大答案:B[评析]本题考点:这道题是考察均数标准误的概念。从均数标准误的定义讲,它反映的是均数抽样误差的大小,那么样本含量越大,抽样误差应该越小。从均数标准误的计算公式nSSx/来看,也应是n越大,xS越小。2.区间X2.58xS的含义是()A.99%的总体均数在此范围内B.样本均数的99%可信区间C.99%的样本均数在此范围内D.总体均数的99%可信区间答案:D[评析]本题考点:可信区间的含义。28可信区间的确切含义指的是:总体参数是固定的,可信区间包含了总体参数的可能性是1,而不是总体参数落在CI范围的可能性为1。本题B、D均指样本均数,首先排除。A说总体均数在此范围内,显然与可信区间的含义相悖。因此答案为D。(二)是非题1.进行两均数差别的假设检验时,当P≤0.05时,则拒绝0H;当P0.05时,则接受0H,认为两总体均数无差别。[评析]答案:错误。当P≤0.05,拒绝0H时,我们是依据这一小概率来下结论的。而当P0.05时,我们对两总体均数无差别这一结论无任何概率保证,因此不能贸然下无差别的结论。正确的说法是,按所取检验水准,接受1H的统计证据不足。2.通常单侧检验较双侧检验更为灵敏,更易检验出差别,应此宜广泛使用。[评析]答案:错误。根据专业知识推断两个总体是否有差别时,是甲高于乙,还是乙高于甲,当两种可能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或者研究者仅关心其中一种可能时,可选用单侧。一般来讲,双侧检验较为稳妥。单侧检验,应以专业知识为依据,它充分利用了另一侧的不可能性,故检出率高,但应慎用。3.只要增加样本含量到足够大,就可以避免I和II型错误。[评析]答案:错误。因为通过假设检验推断出的结论具有概率性,因此出现错误判断的可能性就一定存在,无论用任何方法也不能消除这一可能。但是,我们可以使错误判断的可能性尽量地小,比如样本含量越大,犯I和II类错误的可能性越小。(三)简答题1.简述可信区间在假设检验问题中的作用。[评析]可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。可信区间只能在预先规定的概率即检验水准的前提下进行计算,而假设检验能够获得一较为确切的概率P值。故将二者结合起来,才是对假设检验问题的完整分析。2.某医生就4-3资料,对比用胎盘浸液钩端螺旋体菌苗对328名农民接种前、后血清抗体的变化。表4-3328名农民血清抗体滴度及统计量抗体滴度的倒数XSxs02040801603206401280免疫前人数21127192425193076.1111.76.17免疫后人数216577675542523411.9470.525.90t=(411.91-76.10)/2217.690.25=12.6,按14查t界值表P0.01,说明接种后血清抗体有增长。问该医生在整理资料和分析资料过程中有何不妥?答:①资料整理不当,未整理成配对资料;②统计描述指标使用不当,对于滴度的倒数不宜用算术均数、标准差,有“0”出现,也不宜算几何均数。比较免疫前后抗体滴度的倒数,应计算中位数和四分位数间距;③不宜用t检验。可将抗体滴度的倒数经对数或平方根转换后,做配对t检验(ν=327)。(四)计算题1.某医院用新药与常规药物治疗婴幼儿贫血,将20名贫血患儿随机等分两组,分别29接受两种药物治疗,测得血红蛋白增加量(g/L)见表4-4。问新药与常规药的疗效有无差别?表4-4两种药物治疗婴幼儿贫血结果治疗药物血红蛋白增加量(g/L)新药组24362514263423201519常规药组14182015222421252723解:本题属成组设计资料。210:H211:H05.02121xxSXXt,221nnt=019.16485.27.2,18P0.05因此,根据现有资料尚不能认为新药与常规药的疗效有差别。2.将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前后的血沉(mm/h)见表4-5。问:(1)甲、乙两药是否均有效?(2)甲、乙两药疗效是否有别?表4-5甲、乙两药治疗某病情况序号12345678910甲药治疗前30332631302728282529治疗后26292330302422252323序号11121314151617181920乙药治疗前29302933282630313030治疗后26232523232528222724(1)解:对甲、乙两药治疗数据分别采用配对t检验,得甲药:t=dSd/3.2/0.611=5.237乙药:t=dSd/5.0/0.9428=5.303v=9,P0.001,按=0.05水准,拒绝H0,接受H1,故可认为甲乙两药治疗前后均有差别。(2)解:由表中资料分别求得治疗前后差值,再做两组比较。t=2121ddSdd=-1.602,v=18,得0.2P0.1,按=0.05水准,不拒绝H0,尚不能认为甲、乙两药疗效有差别。3.测得某地90名正常成年女性红细胞数(104/mm3)的均值418、标准差为29。试求:(1)该地95%的正常成年女性红细胞数所在的范围;(2)该地正常成年女性红细胞数总体均数的95%可信区间。解:(1)用正态分布法估计正常值范围。因红细胞过多或过少均为异常,故此参考值范围应是双侧范围。30上限:X+1.96S=418+1.9629=474.84(104/mm3)下限:X-1.96S=418-1.9629=361.16(104/mm3)。即(361.16,474.84)(104/mm3)。(2)由于n=9050,故可近似为正态分布。上限:X+1.96XS=418+1.9629/90=423.99(104/mm3)下限:X-1.96XS=418-1.9629/90=412.01(104/mm3)。即(412.01,423.99)(104/mm3)。四、习题(一)单项选择题1.标准误的英文缩写为:A.SB.SEC.XSD.SD2.通常可采用以下那种方法来减小抽样误差:A.减小样本标准差B.减小样本含量C.扩大样本含量D.以上都不对3.配对设计的目的:A.提高测量精度B.操作方便C.为了可以使用t检验D.提高组间可比性4.以下关于参数估计的说法正确的是:A.区间估计优于点估计B.样本含量越大,参数估计准确的可能性越大C.样本含量越大,参数估计越精确D.对于一个参数只能有一个估计值5.关于假设检验,下列那一项说法是正确的A.单侧检验优于双侧检验B.采用配对t检验还是成组t检验是由实验设计方法决定的C.检验结果若P值大于0.05,则接受H0犯错误的可能性很小D.用u检验进行两样本总体均数比较时,要求方差齐性6.两样本比较时,分别取以下检验水准,下列何者所取第二类错误最小A.=0.05B.=0.01C.=0.10D.=0.207.统计推断的内容是A.用样本指标推断总体指标B.检验统计上的“假设”C.A、B均不是D.A、B均是8.当两总体方差不齐时,以下哪种方法不适用于两样本总体均数比较A.t检验B.t’检验C.u检验(假设是大样本时)D.F检验9.甲、乙两人分别从随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得1X,21S,2X,22S,则理论上31A.1X=2X,21
本文标题:第四章-总体均数的估计和假设检验
链接地址:https://www.777doc.com/doc-4154144 .html