您好,欢迎访问三七文档
第四章可信区间一、概念二、均数的可信区间三、率的可信区间四、可信区间的正确应用可信区间的概念1、点估计(pointestimation)2、区间估计(intervalestimation):按一定的概率或可信度(1-)用一个区间估计总体参数所在范围,这个范围称作可信度为1-的可信区间(confidenceinterval,CI),又称置信区间。这种估计方法称为区间估计。=0.0595%可信区间=0.0199%可信区间3、可信区间的两个要素第一个要素是可靠性,反映为可信度1-的大小;第二个要素是精确性,常用可信区间的长度CU-CL衡量。sx,back1均数的可信区间1总体均数的可信区间(,)例4.1随机抽取12名口腔癌患者,检测其发锌含量,得=253.05g/g,=27.18g/g,求发锌含量总体均数95%的可信区间。本例自由度=12-1=11,经查表得t0.05,11=2.201,则L=U=即口腔癌患者发锌含量总体均数的95%可信区间为:193.23~321.87(g/g)。2两均数之差的区间估计XstX,XstX,XXs)/(23.19318.27201.205.25311,05.0ggstXX)/(87.31218.27201.205.25311,05.0ggstXX1111........xxxxxstxstxPstxstPtsxtPtttP.t.t01111........xxxxxstxstxPstxstPtsxtPtttPback32两均数之差的区间估计设两样本之样本含量、均数和方差分别为:n1,n2和s12,s22,根据数理统计结果:服从自由度为=n1+n2-2的t分布。其中:称为均数之差的标准误。sC2称为合并方差,是两样本方差的加权平均:可得1-2的可信区间:21)()(2121XXsXXt2121121nnsscXX21XXs2)1()1212222112nnsnsnsc(21212121)2,(21)2,(21)()(XXnnXXnnstXXstXX,例4.3某医生研究转铁蛋白对病毒性肝炎诊断的临床意义,测得12名正常人和15名病毒性肝炎患者血清转铁蛋白含量(g/dl),结果如下,试估计正常人和患者的转铁蛋白含量均数之差的95%可信区间。正常人(X1)265.4271.5284.6291.3254.8275.9281.7268.6(n1=12)264.4273.2270.8260.5病毒性肝炎患者(X2)235.9215.4251.8224.7228.3231.1253.0221.7(n2=15)218.8233.8230.9240.7256.9260.7224.4根据资料算得:s12=10.382s22=14.39289.2711X21.2352X3679.1632151239.141438.1011222cs95.41511213679.1631121221nnsscXX(271.89-235.21)±2.060×4.95=26.48~46.88(g/dl)back1率的可信区间1率的抽样误差及标准误2总体率的区间估计3两总体率之差1-2的区间估计nppsp)1(back1总体率的区间估计(1)正态近似法当样本例数n足够大,且样本率p和(1-p)都不太小时,即np和n(1-p)均大于5时,样本率p的抽样分布近似正态分布。例4.4从某地人群中随机抽取144人,检查乙型肝炎表面抗原携带状况,阳性率为9.20%,求该地人群的乙型肝炎表面抗原阳性率的95%可信区间。本例n=144,p=9.20%,可用近似正态法计算可信区间。先计算:95%可信限为:9.20%±1.96×2.41%,4.48%~13.92%。psup%41.20241.0144/)092.01(092.0ps(2)精确概率法当样本例数n较小时,特别是当p接近0或1时,不能用前述的正态近似法,而应根据二项分布的原理确定总体率的可信区间。设n个个体中阳性数为r,样本率为p=r/n,则100(1-)%的可信区间为(L,U):)(2),1(2;2/2),1(2;2//)(11)1(rnrUrrnLFrnrrFrnrr当r=0时,当r=n时,nULFn2,2;2//110,12,2;2/UnLFnn,对例4.5资料用精确概率法计算HIV阳性率的95%可信区间。F0.025;58,2=39.482,F0.025;4,56=3.024,%76.17024.3/2822%09.0482.392911UL,back7两总体率之差1-2的区间估计如果n1p1,n1(1-p1),n2p2,n2(1-p2)均大于5,则正态近似的方法可用于求总体率之差的可信区间:96.1)(,96.1)(21212121ppppsppspp222111)1()1(21nppnppsppback7可信区间的正确应用1、正确理解可信区间的涵义2、单侧可信区间3、区间和的区别4、可信区间与容许区间的区别Xu05.0XstX,05.0XstX,05.0suX05.0back195%可信区间的涵义是:如果重复100次抽样,每次样本含量均为n,每个样本均按构建可信区间,则在此100个可信区间内,理论上有95个包含总体均数,而有5个不包含总体均数。-2-1012图4.1100个来自N(0,1)的样本所估计的可信区间示意back11实际工作中,有时仅可信区间的下限或上限有意义。例如,某药物的平均有效期最短是多少?某药物的不良反应发生率最大是多少?例如,临床上观察120例使用某生物制剂的患者,其皮疹发生率2/120=1.67%,则该生物制剂的皮疹发生率的95%可信上限为:即该生物制剂的皮疹发生率最大为5.2%。%2.51371.2/)2120(1212/)(11)(2),1(2;rnrUFrnrrback11区间是以为中心的区间,表示从已知的均数为标差为的正态分布总体中抽样,每100个样本含量为n的样本均数中,理论上有95个被包含在该区间内。从逻辑推理上看,是用演绎法解释了样本均数的抽样误差。区间是以样本均数为中心的区间,用以估计总体均数所在范围。若用同样方法估计100次,理论上将有95个可区间包含总体均数。从逻辑推理上看,是用归纳法解释了样本均数的抽样误差。Xu05.0XstX,05.0back11(1)可信区间用于估计总体参数,总体参数只有一个;而容许区间用于估计变量值的分布范围,变量值可能很多甚至无限,95%容许区间的涵义是指有95%的变量值在该范围内。(2)可信区间所基于的t分布是统计量的抽样分布,一般均可通用;而容许区间所基于的正态分布是变量值的分布,只有当分布接近正态分布时方适用。两者有着本质的区别。XstX,05.0suX05.0XstX,05.0suX05.0back11back14
本文标题:第四章-可信区间
链接地址:https://www.777doc.com/doc-4229401 .html