您好,欢迎访问三七文档
第19章样本含量估计朱彩蓉华西公共卫生学院卫生统计学教研室抽样的目的由样本信息推断总体信息样本的代表性抽样时的可行性样本含量估计的原则足够的检验效能下的最小样本含量既能满足医学科研的统计学要求又能最大限度控制研究成本和研究风险,提高研究效率样本含量估计的不同情况总体参数的估计常见于调查设计用样本信息(XS、p)估计总体特征(、)影响因素分析或预测用样本信息完成总体间的比较相关(或回归)分析总体参数估计中样本含量的估计拟调查某地区人群血红蛋白含量(g/L),已知中国人血红蛋白含量为(120±30)g/L,要求允许误差不超过5g/L(即=5)。取=0.05,问需要调查多少患者?从总体均数为120g/L的总体中进行抽样样本均数在115~125g/L之间的概率为1-0.0500.10.20.30.41-/2/2-+x2~(,)XN2~(,)XXN22XZZn2/2Zn单纯随机、有放回抽样例19.1拟调查某地区人群血红蛋白含量(g/L),已知中国人血红蛋白含量为(120±30)g/L,要求允许误差不超过5g/L。取=0.05,问需要调查多少患者?05.0/20.05/21.96ZZ30521.9630138.31395n估计条件正态分布、有放回抽样情况下估计误差总体标准差(用来计算标准误)可信度(概率保证程度)1-,一般取95%,即=0.05正态分布、无放回抽样情况下(尤其当有限总体时)**11XXXNnnNN1cnnnN估计总体率时样本含量的估计正态分布、有放回抽样情况下估计误差总体标准差可信度(概率保证程度)1-(1))1(22/22/ZZn整群抽样样本含量的估计正态分布、有放回整群抽样情况下估计误差群标准差S群可信度(概率保证程度)1-2/2ZSg群对于定性资料,当总体为无限总体时对于定性资料,当总体为有限总体时对于定量资料,无论总体是否有限22=(/)()/(1)iiNNppKS22(1/)(/)()/(1)iikKNNppKS22=(/)()/(1)iiNNxxKS22(1/)(/)()/(1)iikKNNppKS22=(/)()/(1)iiNNxxKS22=(/)()/(1)iiNNppKS22(1/)(/)()/(1)iikKNNppKS22=(/)()/(1)iiNNxxKS分层抽样的样本含量估计N:总体样本含量Ni:各层(子总体)样本含量Pi:各层(子总体)概率估计值Wi:各层(子总体)样本含量在总样本含量中所占比例22/2222/2(1)(1)iiiiiiiZNPPWnNZNPP等距抽样样本含量估计相当于分层较多(总体分为同等大小的m个层)而每层抽取一个调查单位的分层抽样其抽样误差可由分层抽样的误差公式近似计算假设检验中样本含量的估计已知某地成年男性的血红蛋白含量(13515)g/L,拟在当地煤矿工人中对成年男性进行抽样调查,研究煤矿工人的血红蛋白量水平与当地一般成年男性无差异。根据专业医学知识,当血红蛋白含量相差10g/L以内时,认为二者无差异。取=0.05,=0.10,问应检查多少煤矿工人?若两人群实际有差异,也发现了这种差异的最小样本例数设血红蛋白服从正态分布+●●●●/2检验效能1-22xZZn()()xZZn2()nZnZ22()ZZnX~N(,2)X~N(,x2)估计条件正态分布,不同总体间方差齐I型错误概率,一般取0.05(注意单双侧)II型错误概率,一般取0.1或0.2总体间差距总体标准差单样本均数的比较单样本设计均数比较的样本含量估计(双侧)2/2()ZZn例19.3已知某地成年男性的血红蛋白含量(135±15)g/L,拟在当地煤矿工人中对成年男性进行抽样调查,研究煤矿工人的血红蛋白量水平与当地一般成年男性无差异。根据专业医学知识,当血红蛋白含量相差10g/L以内时,认为二者无差异。取=0.05,=0.10,问应检查多少煤矿工人?10/20.05/2=1.96ZZ0.10=1.282ZZ152(1)(1.961.282)1523.62410n独立样本比较的样本含量估计独立样本均数差的分布2/2()ZZn212121211~(,())XXNnn211~(,)XN222~(,)XN11nnQ22nnQ211121212~(,)QQXXNn2/21112ZZnQQ独立样本比较的样本含量估计当两样本含量不等时当两样本含量相等时2/21112ZZnQQ2/24ZZn样本比例(samplefraction)n=n1+n2,Q1=n1/n,Q2=n2/n当两组例数相等时,Q1+Q2=0.5+0.5=1根据设计需要可以调整比例如:Q1+Q2=0.6+0.4或Q1+Q2=0.3+0.7等。例19.4某人欲比较A药与B药对改善贫血的作用,据以往经验,A药可增加红细胞11012/L,B药可增加红细胞21012/L。若=1.81012/L,取=0.05,=0.10,每组例数相等,问需要多少病例?若A药组样本含量占整个样本含量的60%,每组各需多少病例?21nn121.810/L1212=(21)10/L=110/L/20.05/2=1.96ZZ2(1.960.842)1.8250.9511842.020.0ZZ若要求A药组样本占整个样本含量的60%,即10.6Q2110.4QQ211(1.960.842)1.8(0.60.4)106.01N配对设计均数比较样本含量估计2/2()dZZn例19.5已知依地酸二钠钙可使铅中毒患者的血红蛋白升高(30±10)g/L,依据经验,规定治疗后患者血红蛋白升高值5g/L以上治疗有效。为验证该药疗效,作单侧检验,取=0.05,=0.10,问需纳入多少病例?645.105.0ZZ842.020.0ZZ10d0.05=0.10=52(1.6451.282)1034.3355n定性资料的样本含量估计单样本设计的率比较样本含量估计2/2(1)ZZn例19.6已知常规疗法治疗湿疹的有效率为45%,现采取新式疗法治疗湿疹,估计治疗有效率可达55%,取=0.05,=0.10,问需要干预多少人?0.450.550.450.10/20.05/2=1.96ZZ0.10=1.282ZZ21.961.2820.45(10.45)260.12610.10n独立样本率比较样本含量估计两组样本比例相等两组样本比例不相等2/224()(1)ZZn21111/212111222(1)()(1)(1)ZQQZQQn2/224()(1)ZZn21111/212111222(1)()(1)(1)ZQQZQQn例19.7要研究菜农钩虫感染率是否与粮农不同,估计菜农和粮农的感染率分别为20%及10%,取=0.05,=0.10,问样本例数相等时各需调查多少人?如果要求菜农组样本量占总样本的60%,菜农组和粮农组各需调查多少人?样本例数相等时/20.05/2=1.96ZZ05.010.00.10=1.282ZZ120%210%12=(+)/2=15%1210%=0.10.2681.0)15.01(15.0282.196.122221)(nn要求菜农组样本含量占60%,则粮农组样本含量占40%,0.20.60.10.40.16211111.960.16(10.16)(0.60.4)1.2820.2(10.2)0.60.1(10.1)0.40.20.1N559.6560配对设计的率比较样本含量估计212/21222aZZn22121,,cacbab例19.8拟比较甲、乙两种快速检验试纸对乙肝表面抗原的检出情况,初步估计甲法的阳性检出率为96%,乙法的阳性检出率为90%,两种方法一致的阳性检出率为88%。问需要检测多少乙肝患者的血样?甲方法+–合计+0.88n0.02n0.90n乙方法–0.08n0.02n0.10n合计0.96n0.04nn10.020.0220.90bnabn20.080.0830.96cnacn120.0220.0830.05322表19.3乙肝表面抗原快速检验试纸试验05.010.0/20.05/2Z1.96Z0.101.282ZZ21.9620.0531.28220.0220.083/0.053255.32560.0830.022n相关系数检验的样本含量估计2/2431ln1ZZn直线相关的样本含量估计211111ln()~(ln(),)21213rNrnrr骣++÷ç÷ç÷÷ç--桫-例19.9估计长期大量饮酒与胃癌之间的相关系数=0.5,取双侧=0.05,=0.10,问需多少样本例数?/20.05/2Z1.96Z0.101.282ZZ21.961.2824337.83810.5ln()10.5n小结基本公式总体信息的获得方式查阅文献预实验专业意义或经验2/2Zn2/2()ZZn使用公式计算得到的样本含量为有效样本含量(最小样本含量)调查设计中缺失值、无效访问等前瞻性研究中对象的退出、失访、意外死亡、剔除等样本含量调整习惯在样本含量公式估计值基础上增加20%多组情况下样本含量的估计以其中总体间差异()最小的两组估计每组样本含量作为其余每组的样本含量检验效能的估计何时需要估计检验效能假设检验中P,不拒绝H0总体间实际无差异检验效能不足(犯II型错误)检验效能的估计方法2/2()ZZn/2nZZ查标准正态分布表,得到1-的估计值查表注意事项当Z0时,检验效能一定大于0.5应使用-Z值查标准正态分布曲线下的面积(附表2)得到值,检验效能为(1-)。当Z0时,检验效能一定小于0.5直接使用Z值查标准正态分布曲线下的面积得到的概率值即为检验效能(1-)。估计检验效能的意义当检验效能低于75%时,则认为结论不可靠样本例数过少应增加样本例数重新研究单样本均数比较的检验效能/2nZZ例19.11已知某地9岁儿童身高为(135.82±6.13)cm。从该地农村随机抽取了30名9岁儿童,测得其
本文标题:样本含量估计
链接地址:https://www.777doc.com/doc-4553063 .html