您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 综合/其它 > 第五章 定性资料的统计描述
第五章定性资料的统计描述统计描述和推断的基本内容统计描述统计推断应用计量资料频数分布集中趋势离散趋势统计图表抽样误差、标准误t,u检验秩和检验方差分析正常值范围可信区间计数资料相对数及其标准化统计图表二项分Poisson分布u2检验秩和检验疾病统计人口统计寿命表相关与回归rb统计图表t检验方差分析分类变量资料的频数表分类变量资料是将观察单位按属性或类别分组计数所得的资料,往往表现为互不相容的类别或属性。各类别及其相应的观察单位数构成频数表。分类变量资料的频数表主要内容一、相对数的概念及计算二、相对数使用应注意的问题三、动态数列及其分析指标(简介)四、率的标准化为什么引入相对数在临床研究的统计资料中,除了前述的计量资料外,还有阴性和阳性、有效和无效、治愈和未治愈、死亡与未死亡及各种疾病的分类等。例如某病用A法治疗100人,有效80人;B法治疗150人,有效100人。若仅用绝对数80人和100人比较会得到B法比A法好的错误结论。在比较两法的疗效,使计数资料具有可比性,将原始的两个资料(绝对数)之比所得指标统称为相对数(relativenumber)。相对数种类率(rate)构成比(proportion)相对比(relativeratio)率(rate)概念:是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,用以说明某种现象发生的频率大小或强度。常以百分率(%)、千分率(‰)、万分率(/万)、十万分率(/10万)等表示。计算公式:注意:比例基数“K”通常依据习惯而定,治愈率、感染率用百分率,出生率、死亡率用千分率,某些疾病的死亡率用十万分率。各率相互独立,其之和不为1(如是则属巧合)。K单位总数可能发生某现象的观察总数发生某现象的观察单位率率(rate)选择K的要点:根据习惯用法以便于比较,如治愈率、某病病死率、人工流产率等用百分率;出生率、婴儿死亡率等用千分率;恶性肿瘤死亡率用十万分率;使算得的率至少保留1~2位整数。常用的频率指标发病率(incidencerate):指在一定期间内、一定人群中某病新病例出现的频率。用来说明居民在一定时期内某病的发病水平。分子是一定期间内的新发病人数,若在观察期间内一个人多次患病时,则应多次计为新发病例数,如流感等。分母中所规定的暴露人口是指可能会发生该病的人群,对那些不可能患该病的人,如传染病的非易感者,已接种疫苗的有效者,不应计入分母内。但实际工作中不易做到,故分母多用同期平均人口数。k同时期暴露人口数病新病例数一定期间内某人群中某发病率常用的频率指标患病率(prevalencerate):也称现患率,指某特定时间内总人口中,曾患有某病(包括新和旧病例)所占的比例。按观察时间不同分为期间患病率和时点患病率。k该时点人口数患某病新旧病例数某一时点一定人群中现时点患病率k同期的平均人口数现患某病的新旧病例数某观察期间一定人群中期间患病率死亡率(mortalityrate):表示在一定期间内,在一定人群中,死于某病(或死于所有原因)的频率。是测量人群死亡危险最常用的指标。用于衡量某一时期、一个地区人群的死亡危险性大小。常以年为单位。死亡率可按病种、年龄、性别、职业等分类计算死亡专率,用于探讨病因和评价防治措施。k同期平均人口数死亡总数因某病某期间内死亡率)(常用的频率指标病名平均人口数人数死亡率(1/10万)高血压1726654023.2冠心病172665116.4恼卒中172665253146.5风心病1726653822.0某地某年四种常见心血管病死亡率常用的频率指标病死率(fatalityrate):表示一定时期内(通常为1年),患某病的全部病人中因该病死亡者的比例。病死率表示确诊疾病的死亡概率,可表明疾病的严重程度,也可反映医疗水平和诊断能力,通常多用于急性传染病,较少用于慢性病。用病死率作为评价不同医院的医疗水平时,要注意可比性。%100同期患某病的病人数数某时期内因某病死亡人病死率构成比(Proportion)概念:也叫构成指标,是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,用以说明某一事物内部各组成部分所占的比重或分布。通常以100%为比例基数,以百分比表示。计算公式:某一组成部分的观察单位数/同一事物各组成部分的观察单位总数100%例如:疾病和死亡顺位等注意:各组成部分的构成比之和为100%,某一部分比重增大,则其它部分相应减少。科室(1)病人数(2)病死人数(3)死亡构成(%)(4)病死率(‰)(5)内科外科肿瘤科妇产科皮肤科眼科小儿科3506501203005645100253020500130.8637.0424.696.17001.2471.4346.15166.6716.670010.00合计162181100.0049.97例5.1某医院某月各科室住院病人数及死亡人数例5.2某地1992年护理人员学历构成学历人数构成比(%)本科990.14大专12481.74中专5352172.65无学历1876325.47合计73667100.00相对比概念:相对比是两个有关联指标之比,用以描述两者的对比水平,例如:性别比、CV、相对危险度(RR)等。常用R表示。计算公式:注意:1.A、B可以相同,也可以不同。2.A、B可以是绝对数,也可以是相对数3.A大于B用倍数表示,A小于B时用百分数表示ARB=指标指标相对比的种类1.两类个体例数之比如我国1982年人口普查的男性人口数为519433369,女性人口数为488741919人,求人口数的男女比例。R=519433369/488741919=1.063人口数的男女比为1.063:1。ARB=类发生的例数类发生的例数相对比的种类2.两个率之比某地某年龄组男性吸烟和非吸烟的冠心病死亡资料下表所示,试分析其相对危害度。12PRP=分组死亡数观察人年数死亡率(1/10万人年)吸烟组10443248240.5非吸烟组1210673112.4相对比的种类RR=240.5/112.4=2.139说明男性吸烟的冠心病死亡率是不吸烟的死亡率的2.139倍。这种指标在流行病学研究中称为相对危险度(relativerisk简写为RR)。相对危险度表示暴露组与非暴露组发病率(或死亡率)的比值。反映了暴露与疾病发生的关联强度。常用于队列研究。相对比的种类3.两个相对比之比临床医生欲探索某病的病因,在以医院病例为基础作病例对照研究时,一般不能计算出RR,但可以计算出疾病组暴露比数与对照组暴露比数之比,称之为比数比或优势比(oddsratio简写为OR)服用反应停与肢体缺陷关系病例对照研究服用反应停畸型儿组对照组合计使用未使用34(a)16(c)2(b)88(d)36104合计5090140//acadORbdbc===疾病组的暴露比数对照组的暴露比数本例348893.5216OR´==´相对比是相对数的最简单形式,常用于动态数列的分析。动态数列是按时间顺序排列起来的一系列统计指标(包括绝对数、相对数和平均数),用来说明某事物在时间上的变化和发展趋势。(详见有关统计学书籍)。表某地1990-1998年床位发展动态绝对增长量发展速度%增长速度%年份(1)指标符号(2)年末床位数(3)累计(4)逐年(5)定基比(6)环比(7)定基比(8)环比(9)1990a05420------1991a15608188188103.4103.43.43.41992a25766346158106.4102.96.42.91993a35886466120108.6102.18.62.11994a45991571105110.5101.710.51.71995a56284864293115.9104.915.94.91996a666091189325121.9105.221.95.21997a769551535346128.3105.328.35.31998a873521932397135.6105.735.65.7相对数使用应注意的问题不要把构成比与率相混淆使用相对数时,分母不宜过小要注意资料的可比性(同质)要注意使用率的标准化比较两个样本率或构成比时,应考虑存在抽样误差,对于样本之间的差异应作统计学检验问题一某工厂在“职工健康状况报告中”写到:“在946名工人中,患慢性病的有274人,其中女性219人,占80%,男性55人,占20%。所以女性易患慢性病”,你认为是否正确?为什么?问题二在进行某遗传病的研究中,一研究人员发现,在该病患者中,有90%是第一个孩子,由此可见该病的遗传与出生顺序有关---更容易遗传给第一个孩子。这个结论是否正确,为什么?率的标准化率的标准化(standardization)是为了在比较两个不同人群的患病率、发病率、死亡率等资料时,消除其内部构成(如年龄、性别、工龄、病程长短等)的影响。如年龄会影响死亡率,年龄越大,死亡率可能越大;病情越重,越难治愈,治愈率就越低。表甲、乙两地各年龄组人口数及肝癌死亡率甲地乙地年龄组(1)人口数(2)人口构成%(3)死亡人数(4)死亡率‰(5)人口数(6)人口构成%(7)死亡人数(8)死亡率‰(9)0~15292068.551350.8811170474.661030.9220~2494211.18411.642094014.00351.6740~2463911.04662.68109637.33302.7460205999.23602.9159984.01244.00合计2231001.003021.351496051.001921.28某省疾病预防控制中心抽样调查了甲乙两地不同年龄肝癌死亡率标准化直接法的计算步骤1.选取标准构成。标准构成选取方法有三种:(1)另外选取一个包含比较各组(如各地区)的有代表性的、较稳定的、数量较大的构成为标准。如世界的、全国的、全省的数据为标准构成。(2)取比较各组的各层例数的合计为标准构成。(3)从比较的各组(如各地区)中任选其一的构成作为标准构成。标准化直接法的计算步骤2.在标准构成下,以原分层率计算各组的预期发生数。3.计算标准化率。表用甲乙两地合并的“标准人口数”计算标准化死亡率‰甲地乙地年龄组(1)标准人口数(2)原死亡率‰(3)预期死亡数(4)=(2)×(3)原死亡率‰(5)预期死亡数(6)=(2)×(5)0~2646240.882330.9224320~458821.64751.677740~356022.68952.749860265972.91774.00106合计3727051.354801.28524‰411‰1000372705524.乙地标准化死亡率‰291‰1000372705480.甲地标准化死亡率注意事项标准化的目的在于消除混杂因素对结果的影响,使计算的标准化总率具有可比性;标准化率并不表示某地实际水平,只能表明对比资料间的相对水平,且同一资料用不同“标准”标化,所得标化率不同,但是对比时的分析结论通常不变;注意事项对于存在混杂因素的两个总率进行比较时,若不进行标准化,也可通过比较两组的各年龄别发病(死亡)率,得出正确结论;资料分析时,若各组分率大小交叉出现,则不宜采用标准化法处理,应采用分层分析等平衡混杂因素的影响;比较样本标准化率时,因同样存在抽样误差,尚需进行假设检验。率的标准误由于抽样引起的样本率之间及样本率与总体率之间的误差,称为率的抽样误差。这个误差的大小我们用率的标准误来描述,用σp表示。式中π为总体率,n为样本例数。()1pnpps-=率的标准误由于在实际中,总体率π往往未知,我们常用样本率P来近似代替总体率π,则上述公式变为:式中Sp称为样本率的标准误,P为样本率,n为样本例数。()1pPPSn-=实例计算为了解某药的疗效,对100名患者治疗的结果进行调查,结果为80人有效,有效率为80%。则样本率的抽样误差为:%404.0100)80.0
本文标题:第五章 定性资料的统计描述
链接地址:https://www.777doc.com/doc-4438117 .html