您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 综合/其它 > 医学统计学-定性资料的统计描述
第三章:定性资料的统计描述引子:定性变量定时变量研究方法统计描述统计推断变量医学统计学统计学两分类多分类【举例】某年甲乙两地发生麻疹流行,甲地发病人数为300人,乙地发病人数为250人,甲地发病人数比乙地多50人,能否据此认为甲地麻疹发病比乙地严重呢?.目的:比较甲、乙两地麻疹的发病情况。问题1.甲地麻疹发病比乙地严重吗?问题2.该怎样表示两地麻疹发病强度?绝对数相对数分类资料的统计描述常用相对数往往先统计具有某种属性的个体数,进而用相对数来描述和比较这类变量。相对数(Relativenumber)的概念:是两个具有内在联系的指标之比。包括频率(FrequencyorProportion)强度(Intensity)相对比(Relativeratio)第一节三种相对数定性资料频率分布表/图特点:能描述一个全面的分布特征,即把所有各种可能性的机会都给描述出来。相对数指标特点:从某个侧面来描述定性变量,尽管不一定能全面的描写某分布,但有助于统计描述和推断。相对数指标频率分布表/图分布特征频率型指标强度型指标相对比指标一、频率与频率分布表3-1某课题组为研究白细胞减少症与工作环境的关系,用随机抽样的方法对某市企业的四个工种共1114名工人进行了调查。依白细胞减少症的诊断标准判断调查对象是否为患者。(1)按工种描述调查对象和患者的频率分布情况:苯作业塑料作业化学药物放射药物34.9%13.8%27.9%23.4%45.3%14.1%20.3%20.3%调查对象所作工种的频率分布图白细胞减少症患者所作工种的频率分布图各百分比相当于各工种频数出现的频率,这些频率加起来是100%;多种工种的情形就有多种频率,这些频率就构成了一个频率分布,描述两个不同人群各种工种的分布或说构成情况。.(2)按“是否患白细胞减少症”描述频率分布情况:患白细胞减少症的频率占:64/1114=5.7%不患此病的频率占:1-5.7%=94.3%所以对这样一个二项分类来说,用一个5.7%就能描述整个资料的频率分布。(3)按“某工种调查对象中是否患白细胞减少症”这一特征来描述频率分布情况:二分类资料,对苯作业389个工人中,白细胞减少症的患病的频率占7.5%,不患的占92.5%。一、频率(Frequency):指某现象发生的频率,或表示事物内部某个组成成发所占的比重或分布。k单位总数可能发生某现象的观察数发生某现象的观察单位频率频率的特征:分子是分母的一部分;无量纲,在0~1之间取值。计算公式:麻疹患者300人甲地30000人二、强度(intensity):强度是流行病学、统计学术语,指单位时间内某现象发生的频率。K时间单位数可能发生某事件的观察数某事件发生的观察单位强度分母含有时间,指单位时间内的频率;其统计学本质为频率强度,即概率强度的近似值。计算公式:特点:“人时”:人×观察时间(年、月)举例:10个人观察1年单位“人年”10人年1个人观察10年有3个人,第1个人观察10年第2个人观察5年第3个人观察1年16人年相当于16个人观察了1年∴观察人时的总和=单位时间×折合的观察人数1个人观察1年1人年K时间单位数可能发生某事件的观察数某事件发生的观察单位人时发病率K单位时间折合的观察单位数数某事件发生的观察单位≈单位时间内新发病例的概率式中的K为比例基数,可以为100%、1000‰、10000/万、100000/10万等。例3-2某企业2003年有2839名职工,该企业每年都对职工进行体检,这一年新发生高血压病人5例,试求2003年的高血压发病率:答:即:2003年的高血压发病率为1.76人/1000人年。据此推测2003年观察人群发生高血压的概率是1.76‰。1000/1000HBP观察时间可能发生高血压的人数新发生高血压人数人年发病率人年人年人人1000/76.11000/1000128395【举例】:在某医院院内感染调查中,5031个病人共观察了127859人日(人均25.4日,也相当于127859人各观察1日),其中有596人在医院发生感染,试求其院内感染率?100%×127859人×1日596人院内感染率K观察人数总和新发病例数×0.47人/100人日答:即每天医院内发生院内感染的频率是0.47人/100人日,据此推测平均每天100人中有0.47个患者将在医院内发生感染。三、相对比(relativeratio):是两个有关联的指标A与B,实际应用中简称比(ratio),说明二者的对比水平。%100BA相对比计算公式:意义:表示相对于B的一个单位,A有多少个单位,或A为B的若干倍或百分之几。1.A和B是绝对数,也可是相对数、平均数。2.A和B可是同性质的指标,也可是不同性质的指标,即其量纲可以相同,也可以不同。3.但A和B应互不包含。人中调查中使用的男女性别比例比。某病年龄组发病率之比。甲乙两地亩产量之比医院管理中“医护人员与病床数”之比注意:【举例】【举例】某市1977~1979年肺癌死亡率城区为19.39/10万,郊区为9.99/10万,比较二者的严重程度。答:即城区肺癌死亡率为郊区的1.94倍。R=19.39/9.99=1.94应用相对数时应注意的问题:(一)防止概念混淆不少指标命名混乱,某某率满天飞!有的某某率实际上只是相对比!更多的指标笼统的称为“率”,但分不清究竟是频率,还是强度。故实践中遇到相对比的指标,应认真思考其定义,辩别其性质,切不可顾名思义。(二)频率型指标的解释要紧扣总体和属性工种(1)调查对象患者例数频率(%)例数频率(%)(2)(3)(4)(5)苯作业38934.92945.3塑料作业31127.91320.3化学药物26023.41320.3放射作业15413.8914.1合计1114100.064100.0表3-1不同工种调查对象和白细胞减少症患者的频率分布(三)计算相对数的分母应有足够量。例一:甲医院治疗100例患者,其中40例有效。甲医院有效率是40%例二:乙医院治疗5例患者,其中2例有效。乙医院有效是2/5,其疗效有待于进步观察故资料总例数过少,则计算所得相对数的偏差会比较大,这种情况下直接报告原始数据更为可取。(四)正确的合并估计举例:甲医院治疗患者100例,40例有效。乙医院治疗同类患者90例,30例有效,计算两院的总有效率。答:分别计算甲、乙两院的有效率,相加后除2:就分别将分子(分母)相加作为合并估计的分子(分母)有效率=21100409030(+)正确合并:100+9040+30有效率==36.8%(五)相对数间的比较要具有可比性观察对象、研究方法(检验手段、抽样方法)、观察时间等;观察对象的内部构成;非同期资料对比时应注意客观条件的变化注意以下几个方面:(六)对相对数的统计推断:统计学研究特点:抽样研究:研究的是样本,目的对总体作出推断得到的是频率,要对概率作出推断。从样本估计总体相对数,需进行参数估计和假设检验对频率分布进行统计推断比较成熟对强度指标进行统计推断不容易对相对比进行统计推断非常困难理论和技术第四节粗率的标准化法【分析】:病型甲疗法乙疗法病例治愈数治愈率(%)病例治愈数治愈率(%)普通型30018060.01006565.0重型1003535.030012541.7合计40021553.840019047.5例3-3:比较甲、乙两个疗法的治愈率该病的严重情况对治愈率有直接的影响,但在两组的分布明显不同。比较两疗法的治愈率,从合计率看甲法优于乙法。因为两组该病轻重病型构成不同,所以粗治愈率不能直接拿来比较。【分析】:【例2】:比较某地有一个钢铁厂,一个棉纺厂,两厂人数、规模近似,体检时发现,棉纺厂的胆囊炎患者明显地高于钢铁厂,这能否说明棉纺厂的胆囊炎患病情况比钢铁厂严重?不能性别构成是影响胆囊炎患病的因素,女性易患胆囊炎。两厂性别构成不同,棉纺厂女性所占比例明显高于钢铁厂,所以不能得出该结论。“率的标准化”的意义和基本思想如需比较,须采用统一标准构成消除该因素的内部构成不同对粗率的影响后,用标准化后的统一标准化率再进行比较。当年龄、性别、工龄、病情等因素在两组的内部构成不同并有可能影响到粗率的情况时,则粗死亡率、发病率、粗治愈率不能直接进行比较。率的标准化一、基本概念:率的标准化法(standardization):产用一定技术手段,消除待比较两组率的在人口构成上的差异,从而推算出统一人口构成的合计率,这一过程,叫率的标准化法。标准化率(standardizedrate)或调整率(adjustmentrate):消除了内部构成差异后计算得出的合计率称为标准化率。常需标化的指标:人口死亡率、病死率、发病率等常见的混杂因素:年龄、性别、病情等二、标准化率的计算:直接法和间接法(一)直接法适用条件:已知各组粗率,即实际年龄别死亡率①②②③P’甲=380/800×100%=47.5%P’乙=427/800×100%=53.4%④③(二)间接法适用条件:各组粗率未知,仅知两比较组⑴患病/死亡总人数,⑵各组调查人口的构成情况。①②②③③④年龄组别标准患病率预期患病人数之和实际患病人数之和标准患病率标准化患病率’P%0.403533351.42’%6.443053221.42’农村城市,PP计算各组的间接标化率P’。标化死亡比(standardmortalityratio,SMR):实际死亡总数和期望死亡总数的相对比,其意义是被标化人群和标准组人群死亡率的比较。'pSMR×标准死亡总率SMR>1说明被标化人群的死亡率大于标准组SMR<1说明被标化人群的死亡率小于标准组小结:标化死亡率的直接法和间接法三、应用标准化法时的注意事项1.标准化法的应用范围很广“一个重要的分类变量”:病情、年龄、性别、职业等“某事件的发生率”:治愈率、患病率、发病率、死亡率等3.由于选择的标准不同,算出的标准化率也不同,比较的结果也未必相同,因而报告结果时必须说明所选用的“标准”及理由。2.标化后的标准化率已不再反映当地的实际水平,它只是表示相互比较的资料间的相对水平。4.两样本的标准化率是样本值,存在抽样误差。要比较时,当样本含量较小时,还应作假设检验。小结⒈定性资料的变量形式有多分类和两分类。可通过频率表描述全面的分布特征,用相对数从所侧重的方面描述某属性的特征,通常描述某一类别的频数在总频数中占的比重。指标公式意义频率事物内部某组成成分所占的比重和分布,或某现象发生的频率。强度单位时间内某现象发生的频率相对比两个有关联的指标之比⒉常用的相对数有三类:频率型、强度型和相对比型。相对数的发生取决于其分子和分母的意义,不同相对数其指标的定义和结果解释是不同的。k单位总数可能发生某现象的观察数发生某现象的观察单位频率K时间单位数可能发生某事件的观察数某事件发生的观察单位强度%100BA相对比3.标准化的目的是消除重要因素的构成不同对粗率比较的影响,关键在于选择统一的“标准”。标准化后的率已不反映当地的实际水平,它只相互比较的资料间的相对水平。4.动态数列分析是借助一系按顺序排列的统计指标如绝对增长量、发展速度、增长速度及平均发展速度等说明事物在时间上的变化和发展趋势。【学习要求】掌握常用的三类相对数指标的定义、意义;相对数应用的注意事项。掌握标准化法的基本思想,直接法的计算和间接法中SMR的意义,及标准化法的注意事项。了解动态数列及其指标的意义。案例讨论1.某单位于1993年对1191全体职工进行冠心病普查,按年龄、职业分组统计如下。作者认为:该单位干部、工人的冠心病发病率均随年龄增加而下降,你同意上述分析吗?为什么?频率型指标——强度型指标[选择题]1、某医院某年住院病人中胃癌患者占5%,则:A.5%是强度指标B.5%是频率指标C.5%是相对比指标D.5%是绝对数E.5%说明胃癌在人群中的严重性2.计算麻疹疫苗接种后血清检查的阳转率,分母为。A.麻疹易感人群
本文标题:医学统计学-定性资料的统计描述
链接地址:https://www.777doc.com/doc-5017102 .html