您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 初中教育 > 7第六章 分类变量资料的统计描述
第六章分类变量资料的统计描述分类变量资料是按研究对象的性质、类别或等级分组,清点各组观察单位的数目得到的资料。绝对数(absolutenumber)绝对数又称总量指标。是指某现象实际发生的绝对水平,表示被描述对象的规模。是制定工作计划、总结工作和进行科学研究时不可缺少的基本数据。如某病的病人数、治愈人数、死亡人数等。相对数(relativenumber)相对数表示两个有联系的指标之比。从数量上反映两个相互关联现象之间的对比关系或联系强度,有助于分析和阐明研究现象的规律性。表示事物出现的程度;将绝对数指标转换成基数相同的相对数指标(如每千人发病人数、每百例患者病死人数等),便于相互比较。第一节相对数的种类常用的相对数有:率(rate)构成比(constituentratio)相对比(relativeratio)一、率(rate)(一)概念:也称强度相对数,是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比。用以说明某种现象发生的频率、强度和普遍程度。(二)计算公式K单位总数可能发生该现象的观察单位数某现象实际发生的观察率=(三)医学上常用的率发病率、患病率、感染率、死亡率、病死率、治愈率、有效率、生存率等。1.发病率表示在一定期间内一定人群中发生某病新病例的频率。(1)发病时间:出现客观指标或确诊的日期。(2)分子为病例数。(3)时间单位一般为一年。(4)分母是指可能发生该病的人群,但实际工作中常以平均人口数代之。K同期暴露人口数生某病的新病例数一定期间内某人群中发发病率=2.患病率也叫现患率。指某特定时间内现有某病病例数与同期人口数之比。按观察时间的不同分为时点患病率和期间患病率,以前者常用。K该时点人口数患某病新旧病例数某一时点一定人群中现时点患病率=K同期平均人口数某病新旧病例数某时期一定人群中现患期间患病率=(1)期间患病率等于某期间开始时的患病率加上该期间的发病率。(2)在人口相对稳定时,某病的发病率升高,则患病率也升高;病程延长,患病率也升高;疾病恢复快或死亡快,则患病率降低。(3)患病率常用于表示病程较长的慢性病的发生或流行情况。如糖尿病、肺结核等。例题某医院2003年在某城区随机调查60岁以上老年人858例,体检发现高血压病人282例。该城区60岁以上老年人高血压患病率为(282/858)×100%=32.87%。3.死亡率(deathrate)死亡率表示在一定期间(一般为一年)的一定人群中,死亡的频率。K同期平均人口数亡总数某期间(或因某病)死死亡率=(1)分子为死亡总数算出的率叫粗死亡率;分子为因某病死亡的总数算出的率称某病死亡率。(2)常以年为时间单位,分母可用年中人口数或年初与年终人口数的平均值。(3)用于衡量某一时期一个地区人群的死亡危险性大小。动态观察可反映某地不同时期人群健康状况和卫生保健水平。4.病死率(fatalityrate)病死率表示一定时期内(通常为一年),患某病的全部病人中因该病而死亡的频率。受疾病严重程度、早期诊断水平和医院治疗水平的影响。%100同期患某病的病人数数某时期内因某病死亡人病死率=(1)反映疾病的严重程度和医疗水平。(2)多用于急性传染病。5.生存率指在患某病的人或接受某种治疗的病人中,随访满n年(通常为1、3、5年)仍存活的病人数所占的比例。(1)反映疾病的严重程度。(2)常用于评价肿瘤,心血管病等慢性病的远程疗效。%100年的病例数随访满年仍存活的病例数随访满生存率=nn二、构成比(constituentratio)(一)构成比也叫构成指标,是指事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总和之比。用以说明某一事物内部各组成部分所占的比重或分布;也可以比较2个以上相同性质的事物各自比重的变化情况。(二)计算公式构成比=(三)特点1.各组成部分的构成比之和为100%。2.某一部分比重增大,则其它部分相应减少。%100察单位总数同一事物各组成部分观的观察单位数事物内部某一组成部分133例崩漏患者中医辩证分型情况证型例数百分比(%)肾虚型4130.83肝虚型129.02肝郁型3123.31血虚型4936.84合计133100.00某中医院2002年与2003年各科病床构成比科别2002年2003年病床数(%)病床数(%)内科10033.3320050.00外科10033.3310025.00传染科10033.3410025.00合计300100.00400100.00三、相对比(relativeratio)(一)相对比也称比例相对数。是指两个有联系的指标之比。说明两指标的比例关系,以倍数或百分数表示。(二)计算公式相对比=A/B(或×100%)式中A、B分别表示两个总量指标。A、B可以相同,也可以不同,可以是绝对数、相对数,也可以是平均数。例题某市1990年12岁以下儿童乙肝病毒携带率为2.72%,2000年乙肝病毒携带率为0.52%,计算相对比。相对比=2.72%/0.52%=5.23或相对比=(0.52%/2.72%)×100%=19.12%提示该市1990年12岁以下儿童乙肝病毒携带率为2000年的5.23倍,或2000年12岁以下儿童乙肝病毒携带率为1990年的19.12%。第二节应用相对数的注意事项1.正确区分率和构成比。构成比是对已有的观察结果分类。率则是在未知观察结果的情况下先确定观察对象的范围,再将观察对象按某种性质或特征分组,统计各组的阳性数,然后计算出各组的频率。某年某地白内障患者患病情况年龄人数病例比(%)率(%)40~5606815.1812.1450~44112928.7929.2560~29613530.1345.6170~1499721.6565.1080~22194.2586.36合计1468448100.0030.522.计算相对数时分母不能太小一般地说,样本含量较大,计算的相对数可靠性也较高。当观察例数<10例,会使相对数波动较大,最好用绝对数表示。在进行动物实验时,由于通过周密设计可以严格控制实验条件,每组用10只动物得出的结果也能计算相对数。3.正确计算合计率对分组资料计算合计率(或称平均率)时,不能简单地由各组率相加或平均求得,而应用合计的实际数字进行计算。若P1=x1/n1,P2=x2/n2,P3=x3/n3。P=(x1+x2+x3)/(n1+n2+n3)(正确)。P=(P1+P2+P3)/3(错误)例题用某疗法治疗肝炎,甲医院治疗150例,治愈30例,治愈率为20%;乙医院治疗100例,治愈30例,治愈率为30%。两个医院合计治愈率应该是[(30+30)/(150+100)]×100%=24%。若计算为20%+30%=50%或(20%+30%)/2=25%,则是错的。4.注意资料的可比性在比较相对数时,除了要对比的因素(如不同的药物)外,其余的影响因素应尽可能相同或相近。如研究方法相同、研究对象同质、观察时间相等;若分组遵循随机的原则;不同地区比较时,民族、年龄、性别构成相等,周围环境、风俗习惯和经济条件一致或相近;对比不同时期资料应注意诊断标准一致、医疗条件相同。若要比较的两组以上资料内部构成不同,需要采用率的标准化法。5.样本率(或构成比)的比较应进行差别的假设检验由于抽样误差的存在,不能仅凭样本率(或构成比)数字表面相差大小下结论,应进行差别的显著性检验。第三节率的标准化率的标准化法即采用统一标准计算各率的标准化率,使各率具有可比性,目的是在比较总率时消除混杂因素(即内部构成不同)的影响。表6-4某病两种疗法的治愈率(%)的比较西医疗法组中西医结合疗法组病型病例数治愈数治愈率(%)病例数治愈数治愈率(%)普通型1005050402255重型40102520630暴发性204201002222合计1606440160503201.选取标准选择具有代表性的、较稳定的数量较大的资料为标准。如全世界、全国或本地区范围较大人群作为标准最好。实践中常用标化组的合计作为标准。2.根据现有数据计算标准化率表6-5某病两种疗法标化治愈率计算表西医疗法组中西医结合疗法组病型标准组人数原治愈率(%)预期治愈数原治愈率(%)预期治愈数普通型14050705577重型6025153018暴发性12020242226合计32040109321210结果西医疗法组标化治愈率:P=(109/320)×100%=34.1%中西医结合疗法组标化治愈率:P=(121/320)×100%=37.8%标化后,显示西医疗法的治愈率比中西医结合疗法低。第七章总体率的估计一、率的标准误(standarderrorofrate)率的标准误即样本率的标准差,它不但反映样本率间的离散程度,也反映样本率与相应总体率间的差异,因而说明了率的抽样误差大小,其统计符号为,式中π为总体阳性率,1-π为总体阴性率,n为样本例数。np1=估计标准误实际工作中,π往往未知,常以p代替,得出的标准误称估计标准误。式中p为样本阳性率,1-p为样本阴性率,n为样本例数。nppsp1=例题用某方药治疗慢性肝炎160例,有效率为86.25%,求其标准误。本例n=160,p=0.8625,1-p=1-0.8625=0.1375,027.01601375.08625.0==ps二、总体率的估计(一)点估计:是以样本频率或样本率加减标准误的方式(p±sp)给出总体概率的点估计值。例题某医院辨证治疗银屑病100例,临床治愈32例,治愈率为32.0%,总治愈率为32.0%或32.0%±5.0%。(二)区间估计常用样本频率及其标准误估计总体概率的CI。根据样本含量和样本频率p的大小,可采用正态近似法和查表法计算总体概率的CI。1.正态近似法当样本含量n>50,且样本频率不接近0和1时,如np与n(1-p)均大于5,样本频率的抽样分析近似满足正态分布,可用正态近似法。总体概率1-α的CI为:p±uαsp例题某医师用自拟中药方治疗高血压患者107例,有效69例,有效率为64.49%。试估计该中药方总体有效率95%的CI。本例:n=107>50,p=0.6449,u0.05=1.96,sp==0.046395%CI=0.6449±1.96×0.0463=(0.5542,0.7356),故自拟中药方治疗高血压有效率的95%CI为(55.42%,73.56%)。1076449.016449.02.查表法当样本含量n≤50,且样本频率接近0或1时,率的抽样分布服从二项分布,因计算π的可信区间比较繁琐,可用查表法。根据“附表3百分率的可信区间”直接用样本含量n及阳性数x查表,即得总体率95%或99%的CI。例题某医院辨证治疗硬皮病(皮痹)25例,临床治愈13例,治愈率为52%。试估计其总体率及95%CI。本例:n=25,x=13,查百分率的可信区间表,得:95%CI=(31,72)。中医药辨证治疗皮痹治愈率的点估计为52%,其95%CI为31%~72%。注意附表3的值仅列出x≤n/2的数,若x>n/2时则无法直接查得。可用反推法,以(n-x)的值(阴性数)查表,然后以100减去查得的数值即为所求的CI。例题某医院用中药治疗脑血管梗塞患者40例,其中33例治疗有效,有效率为82.5%。试估计其总体率95%的CI。本例n=40,x=33>40/2,故以=40-33=7查附表3得:95%CI=(8,33)。将其上、下限分别用100相减,得:100-8=92,100-33=67,反推结果为:95%CI=(67,92)。该中药治疗脑血管梗塞有效率的95%CI为(67%,92%)。
本文标题:7第六章 分类变量资料的统计描述
链接地址:https://www.777doc.com/doc-3403417 .html