您好,欢迎访问三七文档
1第十章分类变量资料的统计分析§1分类变量资料的统计描述2分类变量资料:按某种属性分类,清点各类的个数。绝对数:是各类结果的合计频数,反应总量和规模。如某地的人口数、发病人数、死亡人数等。相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标。概述3一、常用相对数相对数率(rate)构成比(proportion)相对比(ratio)4定义:计算公式:率=某段时间内发生某现象的观察单位数该段时间可能发生该现象的观察单位数×k频率指标,表示某现象发生的频率或强度。率(rate)5例(补充)某研究组调查了城镇25岁以上男性居民的吸烟情况,北方城镇调查了1450人,其中976人经常吸烟,南方城镇调查了1806人,有1052人经常吸烟,分别计算吸烟率。北方为:南方为:%31.67%1001450976%25.58%10018061052率(rate)6定义:计算公式:构成指标,表示某一事物内部各组成部分所占的比重或分布,常以百分数表示。构成比(proportion)%100单位数总和事物内部各部分的观察察单位数事物内部某一部分的观构成比=7表10-12001年某地中小学学生HBsAg检出率及构成比学生检查人数阳性人数检出率(%)阳性构成比(%)小学生66060.915.41初中生1115494.3944.14高中生1563563.5850.45合计33381113.33100.00构成比(proportion)8定义:计算公式:相对比=甲指标乙指标(或×100%)对比指标,表示两个有联系的指标之比,常以倍数或百分数表示。(必须有专业意义)相对比(ratio)9例10-2某地2003-2005年不同性别新生儿数见下表,试计算该地不同性别新生儿性别比。相对比(ratio)年份新生儿数男性女性性别比20039091948636422831.15200410967158908507631.16200512551366814586991.15表10-2某地2003-2005年新生儿性别比二、应用相对数时的注意事项1.计算相对数的分母一般不宜过小;2.分析时不能以构成比代替率;3.观察单位数不等的几个率,不能直接相加求其平均率;4.在比较相对数时应注意可比性;5.对样本率(或构成比)的比较应随机抽样,并做假设检验。11某地通报2007年12月法定报告传染病疫情:共有9人死于传染病,其中,死于狂犬病者占22.22%,死于肺结核者占33.33%,死于病毒性肝炎者占33.33%,死于流行性出血热者占11.11%。【问题】(1)通报的各种传染病的死亡情况是什么指标?(2)这种表示是否合适?实例分析(补充)13表10-12001年某地中小学学生HBsAg检出率及构成比学生检查人数阳性人数检出率(%)阳性构成比(%)小学生66060.915.41初中生1115494.3944.14高中生1563563.5850.45合计33381113.33100.00实例分析HBsAg平均检出率=(111/3338)100%=3.33%141.观察对象同质:如研究两种毒物的致畸率比较时,不能一组用小鼠,一组用大鼠;2.研究方法相同,观察时间一致:如比较两地某种疾病的患病率,对患病与否的诊断一致,两组的调查应同期进行。3.其他对观察结果有影响的因素在所比较的两个群体中构成是否相同。资料的可比性15三、率的标准化(一)率的标准化的意义与基本思想两组率进行比较时,如果影响两组资料比较结果的其他因素(年龄、性别)构成不同,并足以影响结论时,则不能直接比较两组的总率。可以按此影响因素的构成分组比较(分性别、年龄组比)或对构成进行标准化(计算标准化率)。率的标准化的基本思想是将两组资料的构成统一按某个标准进行校正,以消除内部构成不同对总率的影响。16把原率资料按影响因素的标准构成调整后算得的率,称为标准化率(standerdizedrate)亦称为调整率。(二)标准化率的计算计算标准化率的步骤:1.方法选择:直接法和间接法2.标准选择:①选取包含比较各组的大范围人口构成;②两组合并的人口构成;③其中任一组的人口构成。3.标化率的计算三、率的标准化171.直接法:当已知所比较资料各组的实际率Pi,用标准人口数或标准人口构成对率进行标化。'iiNppN(1)已知标准组年龄别人口数时(2)已知标准组年龄别人口构成比时iipNNp)('三、率的标准化例10-3根据表10-3的资料,计算甲、乙两社区的高血压标准化患病率。表10-3某市甲、乙两社区20岁以上居民高血压患病率(%)比较甲社区乙社区年龄人数年龄构成患者数患病率人数年龄构成患者数患病率20~6630.19817210.868760.281010311.7635~8520.254618321.488130.260818622.8850~8130.243028234.697710.247428536.9665~10180.304354453.446570.210836856.01合计33461.0000108132.3131171.000094230.22甲社区乙社区年龄标准人口Ni实际患病率pi1预期患病数Nipi1实际患病率pi2预期患病数Nipi220~153910.8616711.7618135~166521.4835822.8838150~158434.6954936.9658565~167553.4489556.01938合计6463―1969(1iiNp)―2085(2iiNp)表10-4甲、乙两社区20岁以上居民高血压标准化患病率(直接法)甲标化患病率:1969100%30.47%6463P甲乙标化患病率:2085100%32.26%6463p乙202.间接法:iiPnrPp'标准化率已知事件发生总数及年龄别人口数,但不知各年龄组的实际率。r为被标化组的实际发生数,ni为被标化组的年龄别人口数,P为标准组的总率,Pi为标准组第i年龄组的率,r/ΣniPi为标准化比。三、率的标准化21准化死亡比SMR(standardmortalityratio)iirSMRnP实际死亡人数预期死亡人数当SMR1,被标化组的死亡率高于标准组的死亡率;当SMR1,被标化组的死亡率低于标准组的死亡率22例10-4观察某地吸烟者与不吸烟者肺癌死亡情况,观察期内吸烟者中有431人死与肺癌,不吸烟者中有210人死与肺癌,吸烟者与不吸烟者各年龄组观察人数如下表,试计算吸烟者与不吸烟者的标化死亡率。23吸烟者不吸烟者年龄组标准肺癌死亡率Pi观察人年数ni1预期死亡人数ni1Pi观察人年数ni2预期死亡人数ni2Pi35~7.04497053.5018937013.3345~25.704263310.9610476226.9255~108.252811730.446004365.0065~263.941062428.042754072.6975~451.87613727.731453265.67合计34.60137216100.67396247243.61表10-6两组肺癌死亡率(1/10万)的标化(间接法)24(4)两样本标准化率是样本值,存在抽样误差,若欲得出标化组和被标化组的总率是否相等的结论,还应作假设检验。3.标准化法使用注意事项(1)标准化法采用统一标准人口年龄构成。(2)由于选用的标准不同,所计算的标准化率也不相同。(3)如果比较组的各年龄别发生率或死亡率存在交叉时,则不宜进行标化,应分年龄段进行比较。三、率的标准化25小结1.常用的三个相对数的定义2.应用相对数时的注意事项3.率的标准化的应用条件及计算26§2分类变量资料的统计推断李红美讲师苏州大学医学部放射医学与公共卫生学院流行病与卫生统计教研室E-mail:lihongmei@suda.edu.cn第十章分类变量资料的统计分析27一、率的抽样分布从某个二项分类总体中随机抽取一定含量的样本,其样本阳性数及阳性率的分布服从二项分布,即阳性数或阳性率的分布概率等于二项式展开后的各项。若总体阳性率为,样本含量为n,阳性数为X,则样本中出现X个阳性事件的概率为:XnXnXnXnXP)1()!(!!)(28率的抽样分布具有以下特征:1.为离散型分布;2.当=0.5,呈对称分布;3.当n不断增大时,二项式分布逐渐逼近正态分布。一、率的抽样分布2900.050.10.150.20.250.30.350.401234n=5=0.33000.050.10.150.20.250.3123456789n=10=0.33100.050.10.150.20.251234567891011121314151617181920n=20=0.332二、率的抽样误差和标准误在抽样研究中,由抽样引起的样本率和总体率及各样本率之间的差异称为率的抽样误差(samplingerrorofrate)。率的抽样误差用率的标准误表示,其计算公式为:(1)pn(1)pppsn33例10-6为了解某地结核菌素试验阳性情况,某医疗机构在该地人群中随机检测了1773人,结核菌素试验阳性有682人,阳性率为38.47%,试计算其标准误。0.3847(10.3847)0.01161773ps34三、总体率的置信区间估计与总体均数的估计一样,总体率的估计也包括点值估计和区间估计。率的区间估计是一定置信度下,估计总体率所在范围。有两种常用方法:正态近似法和查表法。35(一)正态近似法当n足够大时,样本率p或1-p均不太小时,按正态分布的理论来估计总体率的置信区间(CI)。计算公式:/2ppus例10-6中该地人群中结核菌素试验阳性阳性率的95%和99%的置信区间:38.47%1.961.16%36.20%~40.74%95%CI:38.47%2.581.16%35.84%~41.46%99%CI:36例题(补充)某医院对39名前列腺患者实施开放手术治疗,术后有合并症者2人,试估计该手术合并症发生概率的95%置信区间。(二)查表法当n较小时,如n50,按照二项分布的原理估计率的置信区间。查表得到总体率95%CI:1%~17%。37四、两样本率比较的u检验(一)样本率与总体率的比较n较大,和1-均不太小,n和n(1-)均大于5,近似正态分布,用u检验。nppup)1(38例10-7一般情况下,直肠癌围手术期并发症发生率为30%,现某医院手术治疗了385例直肠癌患者,围手术期出现并发症有100例,并发症发生率为26%,问该院直肠癌患者围手术期并发症发生率与一般情况比较有无差异。39基本步骤1.建立检验假设H0:=0H1:0=0.052.计算u值3.确定P值,判断结果713.1385)3.01(3.026.03.0u本例u=1.7131.96,P0.05,按=0.05的水准不拒绝H0,差异无统计学意义。40四、两样本率比较的u检验(二)两样本率的比较条件:n1p1、n1(1-p1)、n2p2、n2(1-p2)均大于5公式:)11)(1(21212121nnppppSppuccpp2121nnXXpc41例10-8为了解某地小学生蛔虫感染率的城乡差别,抽样调查了该地小学生22792人,其中城镇小学生8207人,粪检蛔虫卵阳性数为701人,蛔虫感染率为8.54%,乡村小学生14585人,粪检蛔虫卵阳性数为2167人,蛔虫感染率为14.86%,试比较该地小学生蛔虫感染率城乡之间有无差异。42基本步骤1.建立检验假设H0:1=2H1:12=0.0543基本步骤2.计算u值1258.01458582072167701cp)14585182071)(1258.01(1258.021pps739.130046.01486.00854.0u44本例u=1.7131.96,P0.05,按=0.05的水准不拒绝H0,差异无统
本文标题:计算标准化率
链接地址:https://www.777doc.com/doc-3125294 .html