您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第八章 分类变量资料的统计推断
1第八章分类变量资料的统计推断2统计推断用样本信息推论总体特征的过程。包括:参数估计:运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。3主要内容一、率(或构成比)的抽样误差和标准误二、总体率(或构成比)的估计:点估计、区间估计三、总体率(或构成比)的假设检验1.率(或构成比)的u检验2.x2检验4第一节率(或构成比)的抽样误差和总体率的估计均数的标准差和标准误(复习)。抽样误差产生的原因、概念标准误的计算公式与样本量的关系:成反比。nppSp1np15例题0252.03686250.016250.01nppSp答:该地5岁儿童龋齿患病率标准误为2.52%6二、总体率(或构成比)的估计点估计:将样本率直接作为总体率的估计值.区间估计(对照总体均数的区间估计)按一定的概率,以样本信息估计总统率所在的范围。方法有:1、正态近似法2、查表法71、正态近似法2、查表法N足够大,且np和n(1-p)均大于5pSupN较小,如小于50时,特别是p接近0或1时8例题见上例6744.0~5756.00252.096.16250.0pSup9第二节总体率(或构成比)的假设检验当两个样本率不同时,有两种可能:1.P1,P2所代表的总体率相同,由于抽样误差的存在,造成的不同,这种差别在统计上叫差别无统计学意义。2.P1,P2所代表的总体率不同,即两个样本来不同的总体,其差别有统计学意义。现在就是要用统计学的方法进行判断到底属于那种情况。适用条件:已知:n较大、nP5,n(1-P)510样本率(或构成比)与总体率(或构成比)比较的u检验目的:公式:npu000111例:建立假设:H0:π=π0H1:ππ0α=0.05单侧选择检验方法,计算统计量确定P值得出结论4727.24601326.011326.01326.00935.00935.046043up12两样本率比较的u检验条件:公式:21212121111nnxxpnnppppuccc例13第三节x2检验一、概述二、四格表资料三、配对资料四、行列表资料五、行列表的分割六、四格表的确切概率法14Chi-squaretestχ是一种假设检验的方法,当样本量不大,或几个率进行比较时可用x2检验。某医生想观察一种新药对流感的预防效果,进行了如下的研究,问此药是否有效?组别发病人数未发病人数观察例数发病率(%)实验组148610014对照组309012025合计4417622020一、概述15x2检验的基本公式x2=(A-T)2/TA:表示实际频数,即实际观察到的例数。T:理论频数,即如果假设检验成立,应该观察到的例数。:求和符号自由度:=(R-1)×(C-1)R行数row,C列数column注意:是格子数,而不是例数。16基本原理x2=(A-T)2/T如果假设检验成立,A与T不应该相差太大。理论上可以证明(A-T)2/T服从x2分布,计算出x2值后,查表判断这么大的x2是否为小概率事件,以判断建设检验是否成立。17二、四格表资料的x2检验什么是四格表资料?凡是两个率或构成比资料都可以看做四格表资料。举例。组别发病人数未发病人数观察例数发病率(%)实验组148610014对照组309012025合计44176220201486309018组别阳性阴性合计1aba+b2cdc+d合计a+cb+da+b+c+d四格表的一般形式理论频数与自由度的计算:A是实际频数,T是根据假设检验来确定的,当H0成立时,计算出的格子中的数。每个格子中的理论频数计算公式为:NR所在的行合计,NC所在的列合计,代入公式中求x2值。(求上例的4个T值)nnnTCRRCν=(行-1)(列-1)19求例题的理论值组别发病人数未发病人数观察例数发病率(%)实验组14(20)86(80)10014对照组30(24)90(96)12025合计4417622020202204410011T20四格表资料的专用公式该公式从基本公式推导而来,结果相同。计算较为简单。适用条件:N40且T5当不满足时用校正公式。x2=(|A-T|-0.5)2/T或x2=(|ad-bc|-n/2)2xN(a+b)(c+d)(a+c)(b+d)见62页。dcbadbcanbcadX2221dcbadbcanbcadX22TTAX225.0dcbadbcannbcadX222!!!!!!!!!ndcbadbcadcbaP四格表资料专用公式:n≥40且某一理论数1≤T5时的连续性校正公式:n40或T1时Fisher确切概率法公式:22例题上例:问此药是否有效。第一步:建立假设H0:1=2=20%H1:1‡2第二步:确定显著性水平=0.05第三步:计算统计量:n=20040,每格的T值大于5,可选用公式??(计算过程)第四步:确定P值第五步:判断结果基本公式:X2=4.125专用公式:X2=4.12523三、配对计数资料的x2检验什么是配对资料?两种方法检测RF比较ITALTA合计+-+31(a)12(b)43-1(c)11(d)12合计32235524例:问两种方法检测效果是否不同第一步:建立假设H0:B=C=b+c/2H1:B‡C第二步:确定显著性水平=0.05第三步:计算统计量:b+c40时,基本公式:x2=(A-T)2/T,专用公式:x2=(b-c)2/b+cb+c40时,校正公式:x2=(|A-T|-0.5)2/Tx2=(lb-cl-1)2/b+c自由度:=(2-1)×(2-1)=1第四步:确定P值第五步:判断结果25四、行x列表的x2检验四格表是指只有2行2列,当行数或列数超过2时,统称为行×列表。行×列表的x2检验是对多个样本率(或构成比)的检验。基本公式:x2=(A-T)2/T专用公式:自由度:=(R-1)×(C-1)适用条件:表中不宜有1/5以上格子的理论频数小于5,或有一个格子的理论频数小于1。例题见课本:122CRnnAnX26四、注意事项1、计量资料的注意事项同样适用(见下张幻灯片)2、公式的适用条件n、T3、多组率经x2检验有显著性时,只能说明不全相同,但不能确定哪两个不同。需要进一步证明时,用行x列表的x2分割法。2728行列表资料注意事项1、表中不宜有1/5以上格子的理论频数小于5,或有一个格子的理论频数小于1。2、多组率经x2检验有显著性时,只能说明不全相同,但不能确定哪两个不同。需要进一步证明时,用行x列表的x2分割法。29五、行列表的分割多个实验组间的两两比较多个实验组与同一对照组的比较30(一)多个实验组间的两两比较经过行列表检验有统计学意义的多个实验组率的资料,若想了解差别究竟在哪两组间,需要作两两比较,在比较时如用原来的检验水准进行四格表检验,则会使第一类错误的概率扩大,因此必须重新规定检验水准。有观点认为新的检验水准应为:31N'211'kkNNN2'211'kkNN推荐使用32例题见课本P80组有效无效合计有效率%西药组514810051.00中药组35458043.75中西医结合59157479.73合计14510925457.093种方案治疗肝炎的疗效经行列表检验有统计学意义。33K=3,N=3017.0305.0'N列出3个两两比较的四格表并分别以0.017作为检验水准进行四格表的检验,判断p值作出结论。34(二)多个实验组与同一对照组的比较检验水准用:112''kk推荐使用例题见课本p83方法同前35六、四格表的确切概率法当n40或T1时,用Fisher确切概率法直接计算概率。Fisher’sexacttest计算公式:!!!!!!!!!ndcbadbcadcbaP36小结一、率(或构成比)的抽样误差和标准误二、总体率(或构成比)的估计:点估计、区间估计三、总体率(或构成比)的假设检验1.率(或构成比)的u检验2.x2检验四、假设检验的注意事项
本文标题:第八章 分类变量资料的统计推断
链接地址:https://www.777doc.com/doc-3389530 .html