您好,欢迎访问三七文档
第三章分类变量的统计描述分类变量的频数分布及其统计指标标准化法及其应用动态数列及其应用主要内容:第三章分类变量的统计描述第一节分类变量的频数分布及其统计指标表3-1某单位高血压患病情况年龄(岁)(1)检查人数(2)患病人数(3)患者构成比%(4)患病率%(5)20~200014033.37.040~150018042.912.050-6050010023.820.0合计4000420100.010.5分类变量的频数分布表3-1吸毒与非吸毒人群职业构成对比分析吸毒组非吸毒组职业人数(n)构成比(%)人数(n)构成比(%)学生41.29236.44无业18359.035014.01个体5417.42277.56工人5317.1012535.01司机30.9720.56其它134.1913036.42合计310100.00357100.00第一节分类变量的频数分布及其统计指标一、常用的相对数指标比率速率比三种类型:第一节分类变量的频数分布及其统计指标频表示事物内部某个组成部分所占的比重,包括:频率指标和构成比指标。K单位总数可能发生某现象的观察数发生某现象的观察单位频率二、常用的相对数指标分子是分母的一部分;无量纲,在0~1范围内取值;K是比例基数,可取100%,1000‰、10万/10万等,根据习惯用法来决定。第一节分类变量的频数分布及其统计指标1.比率100%观察单位总数同一事物各组成部分的位数某一组成部分的观察单构成比问:结合例3.1谈谈构成比与频率的区别。二、常用的相对数指标第一节分类变量的频数分布及其统计指标1.比率表3-1某单位高血压患病情况420100180140患病人数(3)100.023.842.933.3患者构成比%(4)10.520.012.07.0患病率%(5)4000合计50050-60150040~200020~检查人数(2)年龄(岁)(1)中国累积报告的HIV感染者按性别分布图1985—2001.6不详1.5%女16.9%男81.6%二、常用的相对数指标第一节定性变量的分布特征1.比率例3-1某医生研究了慢性阻塞性肺病(COPD)病人的吸烟情况,自1998~2000年收治COPD病人356人,其中231人有三十年及以上的经常吸烟史(日平均1支以上),在本院其它科室收治的同年龄组段的非COPD病人(无其它呼吸系统疾患)479人,其中有三十年及以上的经常吸烟史的183人,试计算并比较两组病人的吸烟率。表3-2COPD病人与非病人的吸烟情况资料有吸烟史无吸烟史合计吸烟率COPD病人23112535664.89%非病人18329647938.02%合计41442183549.58%速率表示单位时间内某现象发生的频率。如人时发病率的分子是新发生的事件数,分母是人时数(观察人数乘以时间)的总和,多用于大人群长时间随访的资料。K时间)单位数可能发生某事件的观察(数某事件发生的观察单位速率二、常用的相对数指标2.速率:第一节定性变量的分布特征K观察年数)每个观察单位数(病例数观察期间内某疾病新发人年发病率二、常用的相对数指标2.速率:第一节定性变量的分布特征K均人口数同年内能发生某病的平该年新发某病的病例数发病率例在某医院的院内感染调查中,5031个病人共观察了127859人日(例均25.4日),其中有596人在医院发生感染,求医院感染率。医院感染率=596/127859=0.0047人/人日意味着平均每天有0.47%的病人将在医院获得感染。第一节定性变量的分布特征二、常用的相对数指标2.速率:上海常住人口出生婴儿性别比约为107:100;深圳市出生人口男女性别比例为120.8∶100;北京流动人口在京出生的性别比例高达128∶100;重庆现在的男女比例为140∶100,海南、广东等省出生的性别比例竟然高达130:100以上;全国出生人口性别比为117。二、常用的相对数指标第一节定性变量的分布特征3.比二、常用的相对数指标最常见:体质指数(BMI)、男女性别比等相对比=A/B第一节定性变量的分布特征3.比比是指任何两个相关联的变量A与B之比。A和B可以是绝对数、相对数和平均数,A和B的量纲可以不同,也可相同,但A和B互不包含.→防止概念混淆→计算相对数时分母应有足够数量→正确地合并估计频率(或强度)型指标→相对数间的比较要具备可比性:观察的对象是否同质,研究的方法(如检测手段、抽样方法)是否相同,观察的时间是否一致等;被比较的总体是否具有可比性。→对相对数的统计推断合计40~50~60~70~≥80年龄组⑴30.52100.00448146812.1429.2545.6165.1086.3615.1828.7930.1321.654.2468129135971956044129614922患病率(%)⑸=(3)/(2)患者年龄构成比(%)⑷白内障例数⑶受检人数⑵率与构成比的误用应用相对数应注意的事项:第一节定性变量的分布特征应用相对数应注意的事项:二、常用的相对数指标应用相对数应注意的事项:例:某县的3个乡上报了1994年的肠道传染病统计料,结果如下:甲乡人口数是91960,肠道传染病的发病人数为1122例,乙乡人口数是76740,肠道传染病的发病人数为1499例,丙乡人口数是108930,肠道传染病的发病人数为866例。请回答:1.那个乡的肠道传染病发病率高?2.3个乡肠道传染病的平均发病率是多少?应用相对数应注意的事项:表10-2两校学生吸烟率比较医科大学工业大学组别在校学生数吸烟人数吸烟率(%)在校学生数吸烟人数吸烟率(%)男生100010010.0090004505.00女9000901.00100050.50合计100001901.90100004554.55例观察比较两学校在校学生的吸烟率,结果见下表表3.2甲、乙两厂同工种工人某病的患病率甲厂乙厂工龄(年)人数患病人数患病率(%)人数患病人数患病率(%)<3400123.010022.0≥31001818.04004010.0合计500306.0500428.4例如表3-2两种疗法的治愈率比较。一、标准化法的基本思想第二节标准化法及其应用要正确比较两厂的合计患病率,必须先将两组工人的工龄构成按照统一标准进行校正,然后计算出校正后的标准化患病率再进行比较。这种用统一的内部构成,然后计算标准化率的方法,称为标准化法。一、标准化法的基本思想第二节标准化法及其应用标准化法的基本思想是:采用某影响因素的统一标准构成,对内部构成不同的各人群率进行调整,以消除人口构成不同对人群总率的影响,使标准化率具有可比性。一、标准化法的基本思想常用计算方法:直接法间接法第二节标准化法及其应用二、标准化率的计算若已知年龄别死亡率,可采用直接法;根据已有资料的条件,采用不同的方法计算标准化率若只有总死亡数和年龄别人口数而缺乏年龄别死亡率时,或各年龄组人口数较小,年龄别死亡率不稳定时,宜用间接法。如:对死亡率的年龄构成标准化第二节标准化法及其应用1.两组资料中任选一组资料的人口数(或人口构成)作为两者的“共同标准”。这种方法适用于直接法。2.两组资料各部分人口之和组成的人口数(或人口构成)作为两者的“共同标准”。这种方法适用于直接法。3.另外选用一个通用的或便于比较的标准作为两者的“共同标准”,如采用全国、全省或全地区的数据作为标准。选择标准构成的方法通常有三种:第二节标准化法及其应用二、标准化率的计算计算标准化率的步骤:1.根据对比资料所具备的条件选用直接法或间接法。2.选定标准构成。3.选择公式计算标准化率第二节标准化法及其应用二、标准化率的计算表5-4甲、乙两种疗法治疗某病的治愈率比较甲疗法乙疗法病型病人数治愈数治愈率(%)病人数治愈数治愈率(%)普通型30018060.01006565.0重型1003535.030012541.7合计40021553.840019047.5第二节标准化法及其应用表5-5按式(5-10)用直接法计算标准化治愈率(%)甲疗法乙疗法病型(1)标准治疗人数(Ni)(2)原治愈率预期治愈数(pi)(Nipi)(3)(4)=(2)(3)原治愈率预期治愈数(pi)(Nipi)(5)(6)=(2)(5)普通型40060.024065.0260重型40035.014041.7167合计800(N)53.838047.5427第二节标准化法及其应用2.间接标准化法例5-6经研究表明,女性原发性骨质疏松随年龄增长患病率增高。1998年某省在城市和农村分别抽样调查了50岁以上的老年妇女776例和789例,这些人中患有原发性骨质疏松症者城市为322例,农村为335例,总患病率分别为41.5%和42.5%。由于本次调查的城乡老年妇女年龄构成不同,如表5-7第2栏和第5栏,需对两个总患病率进行标准化后方可比较。第二节标准化法及其应用表5-71998年某省城乡女性原发性骨质疏松症患病率比较城市农村年龄组(岁)(1)调查人数(2)患病人数(3)患病率(%)(4)调查人数(5)患病人数(6)患病率(%)(7)50~354……241……60~251……315……70~130……175……80及以上41……58……合计77632241.578933542.5第二节标准化法及其应用表5-8按式(5-12)用间接法计算标准化患病率(%)城市农村年龄组(岁)(1)标准患病率iP(2)人口数in(3)预期患病人数iinP(4)=(2)(3)人口数in(5)预期患病人数iinP(6)=(2)(5)50~21.3354752415160~46.125111631514570~65.51308517511580及以上71.741295842合计42.1776305789353第二节标准化法及其应用1.标准化法只适用于某因素两组内部构成不同,并有可能影响两组总率比较的情况。2.标准化率已不再反映当地的实际水平,它只表示相互比较的几组资料间的相对水平。3.两样本标准化率为样本值,若了解两样本标准化率之间的差别是否有统计学意义,应进行假设检验。三、应用标准化时的注意事项第二节标准化法及其应用表3-9某大学1992-2002年本科专业招生动态变化年份(1)符号(2)学生人数(3)绝对增长量发展速度%增长速度%累计逐年(4)(5)定基比环比(6)(7)定基比环比(8)(9)1992a04200--100.0100.0--1993a14500300300107.1107.17.17.11994a24800600300114.3106.714.36.71995a34900700100116.7102.116.72.11996a45150950250122.6105.122.65.11997a553201120170126.7103.326.73.31998a655101310190131.2103.631.23.61998a757801580270137.6104.937.64.92000a859501750170141.7102.941.72.92001a96000180050142.9100.842.90.82002a1062002000200147.6103.347.63.3第三节动态数列及其分析指标第三节动态数列及其分析指标动态数列:一系列按时间顺序排列起来的统计指标,用以说明事物在时间上的变化和发展趋势。定基比环比第三节动态数列及其分析指标主要指标:一、绝对变化量二、发展速度三、增长速度四、平均发展速度与平均增长速度绝对增长量是说明事物在一定时期增长的绝对值。可分为:累积变化量:即报告年的指标与某一固定年(基期水平)指标之差,逐年变化量:即报告年的指标与前一年指标之差,第三节动态数列及其分析指标一、绝对变化量:发展速度:表示报告期指标的水平相当于基期水平的百分之多少或若干倍;第三节动态数列及其分析指标二、发展速度•环比发展速度=0aan1nnaa计算公式:•定基发展速度
本文标题:分类变量的统计描述
链接地址:https://www.777doc.com/doc-3714925 .html