您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 综合/其它 > (05755)卫生统计学第一章
第一章绪论第一节卫生统计学的内容及其应用在公共卫生实践以及营养健康科学研究中,卫生统计学(healthstatistics)作为一种认识事物数量特征的重要工具,已越来越被人们所接受。例如:将实际工作中的原始数据转变成有价值的信息,需要统计;作流行病学调查,研究各种危险因素与疾病的关系,也需要统计;阅读医学杂志评价别人的研究结果,需要懂统计;进行两组样本数据的比较或两组动物实验结果的比较时,需用统计。总之,在临床医学、预防医学和公共卫生各个方面的科学研究以及防治工作计划的拟定和成果评价中,只要作数量分析都要用到统计。卫生统计学是运用数理的基本原理和方法对预防医学和公共卫生领域中的科学研究进行设计,以及研究资料的收集、整理和分析的一门应用科学。具体地讲,是将按照设计方案收集上来的数据进行整理分析、透过众多偶然的、次要的因素阐明事物客观存在的规律性,辨别事物间在数量上的差别是否仅是偶然现象、从而得出比较正确的结论。卫生统计学的基本内容包括三个方面:(1)卫生统计学的理论和方法,包括研究设计和数据分析中的统计理论和方法。(2)健康统计,包括医学人口统计、疾病统计和生长发育统计等。(3)卫生服务统计,包括卫生资源、医疗卫生报务的需示求和利用、医学保健制度和管理等的统计问题。根据教学目的需要,本教材主要包括卫生统计第一个方面的内容,重点介绍了统计描述的常用指标、统计推断的参数估计和假设检验、以及实验设计和调查设计的一般原则。卫生统计学在实际应用中也被狭义地分为设计和数据分析两部分。第一部分是设计,通常分为实验设计和调查设计。例如:某研究者为了了解螺旋藻的保健功能对患有糖尿病的小鼠做降血糖实验。按初始血糖浓度20只小鼠随机分为两组,一组为空白对照,另一组给螺旋藻,然后观察血糖浓度是否有变化。为了得到这个实验结果,首先要做研究设计。这种研究设计,即研究对象受了某种干预(或处理)后获得的数据属于研究设计。调查研究一般是指为了对某个特定人群的现状做调查而进行的研究设计。例如:“2005某地区小学生营养膳食调查”属于现况调查研究,研究者通过研究知道这个地区的小学生的饮食结构是否合理,饮食习惯是否良好?如何获得这些数据并整理成最终结果,需要调查设计过程中考虑。无论是实验设计还是调查设计都包括统计学设计,两者在统计学设计上不尽相同。有关见容将在第九章介绍。第二部分是数据分析,即对那些按照不同研究设计收集上来的数据进行分析,主要内容是进行统计描述和统计推断。例如:计算每组10只小鼠的平均血糖值,或者计算200名小学生不良饮食习惯的发生率,这些都属于统计描述的内容。如果有两个样本数据要比较,它们的样本均数或样本率,就要做样本检验,例如两组小鼠使用螺旋藻后的平均血糖变化值有“t”检验。或者比较男女两组学生不良习惯有“检验,这些都属于统计推断的内容。在本教材的第二章和第四章主要介绍统计描述中统计指标的计算和统计指标的表达形式。第五章和第八章将介绍统计推断的估计和假设检验。第二节统计资料的类型统计资料一般分为三大类:即计量资料、计数资料和等级资料。不同类型的资料选用不同的统计指标和统计分析方法,根据分析需要,各类资料可进行相互转化。一。计量资料(quantitativedata)用度量衡的方法测定一个观察单位的某项研究指标量的大小,所得到的数据(即测量值)称为计量资料。计量资料通常是有度量衡单位的,属于连续资料。例如:调查某地12岁男孩的身体发育状况。这时,每个男孩就是一个观察单位,身高(cm)、体重(kg)、血压(mmHg或kPa)均可作为观察指标。测定每个男孩的这三项指标量的大小、体重值和血压值为计量资料。描述计量资料常用的统计指标有平均数、标准差(见第二章)。根据资料的总体分布类型不同,应选用不同的统计方法(见第六章)。二。计数资料(categoricaldata)将全体观察单位按照某种性质或类别进行分组,然后分别清点各组中的例数,这样的数据称为计数资料,也称为分类资料。计数资料一般没有度量衡单位,是一种间断性的资料。例如:对某卫生机构工作人力资源调查,这里私每个工作人员被看作一个观察单位,将全体工作人员按技术人员和非技术人员分为两组,清点每组中的人数,所得资料为计数资料,也称二分类资料。又如:将这个例子的工作人员再重新分为医护人员、非医护技术人员和管理人员3组,清点每组标有率、构成比等(见第三章)统计分析方法主要有“检验(见第七章)。三。等级资料(ordinaldata)将全体观察单位按照某种性质不同的程度分为若干组,分别清点各组中观察单位的个数,这种数据称为等级资料。等级资料是介于计量资料和计数资料之间的一种有序分类资料,一般没有度量衡单位,也是一种间断性的资料。例如:为了观察黄莲素对细菌性痢疾的疗效,以菌痢患者作为观察单位,按疗效的不同程度,将接受治疗的菌痢患者按治愈、显效、有效、无效四组,分别计算各疗效组的菌痢人数,这类资料在疗效分组上有定量的性质(按程度排列)但不精确在清点人数上又有定性的特征,因此属于等级资料也称半定量资料或有序分类资料。等级资料的统计指标也可用构成比表示。(见第三章)统计方法可以用序分类资料的秩和检验。(见第七章)。四。数据转换根据分析的需要,计量资料、计数资料和等级资料之间经常要做转换。1.定量数据的性质化转换:例如:观察得到100名婴儿出生体重(g)这是计量资料,可以计算他们出生时的平均出生体重(克);如果想分析有少婴儿属于低出生体重、多少婴儿是正常出生体重,可以将这100名婴儿的出生体重分为2500克(低出生体重),≥2500克(出生体重)两组,这时就成了两分类的计数资料。如果分组再细些,将出生体重2500克(低出生体重),2500∽3999克(正常出生体重),≥4000克(高出生体重)。这时计量资料就成了等级计量资料。2.定性数据的数量化转化:很多情况下,数据需要计算机处理,为了便于计算机的识别和运算。对定性数据可以赋值进行数量化转换,例如:性别是属于计算资料的两分类量,可将男女分别取值于1和2,1和2之间没有量的差别。只是一种数据代码,如果文化程度是按文盲、小学、中学、高中、大学及以上分组,此变量属于等级资料,可分别取值为0、1、2、3、4,取值为0、1、2、3、4不仅仅是一种数字代码,而且也有量的差别。第三节统计学基本概念一、总体与总体研究(populationandpopulationstudy)总体是根据研究目的确定同质观察单位的全体,更确切地说是同质所有观察单位的集合。这里的观察单位亦称个体。是统计研究中最基本的单位。它可以是一个人、一个家庭、一个地区、一个样品等。无论何种研究都要先确定观察单位。只有观察单位明确,才能确定观察范围。例如:调查某地2004年所有20岁健康男大学生的身高,某地20岁健康男大学生就是一个观察单位,所有20岁健康男生的身高值就构成了一个总体。又如了解某市三级甲等医院的病床数,该市三级甲等医院就是一个观察单位,该市某年三级甲等医院所有病床数就构成了一个总体,这里的总体明确了一定时间、一定空间的有效观察单位,称为有限总体。有限总体中的每个个体都做观察就叫做总体研究。有时总体是抽象的,如观察用某药物治疗过敏性哮喘病人,但没有治疗时间、治疗地点的限制,观察单位就是无限的该总体称无限总体,而无限总体是无法作总体研究的。二、变量与变量值(Variableandvalueofvariable)观察单位或(个体)的某种属性标志称为变量,对变量进行测量或观察的值称为变量值(或测量值、观察值)如调查某市某年三级甲等医院的病床数,病床就是变量,而每个三级甲等医院的病床数就是变量值。又如调查某地成年人的高血压患病情况,调查问卷中的年龄、性别、文化程度、体重、血压等项就是变量。这些变量中的年龄、体重、血压属于计量资料或称数值变量;性别和职业均属于计数资料或者分类变量,再细分,性别可以看成二分类变量,职业为多分类变量或者称无序分类变量。文化程度属于等级资料或者称有序分类变量,而测量每一个未成年人的具体年龄、职业、文化程度、体重、血压值就是变量值。三、同质与变异(homogeneityandVariation)研究对象具有相同的背景、条件、属性称同质。同一性质的事物,其个体观察值(变量值)之间的差异,在统计学上称为变异。统计学所研究的对象是以同质为基础,并具有变异的事物或现象。例如;调查某地2004年所有20岁健康男大学生的身高,它的同质基础是同一地区、同一年份、同为20岁健康男大学生;这些20岁健康男大学生的身高值有的相同,有的不尽相同,存在差异,这种身高值之间的差异。又如,研究某种新药治疗胃溃疡的效果,所有研究对象都必须是确诊为胃溃疡的病人,而且病情相同,不可包括疑似病人或根本不是胃溃疡的病人。在这种同质的基础上观察治疗效果,有的人治愈,有的人未愈,这种差异就是变异。四.样本与随机抽象(sampleandrandomsampling)从总体中随机抽取有代表的一部分个体,其测量值(或观察值)的集合称为样本。所谓随机抽样,就是总体中每个个体都有均等机会被抽取,抽到谁具有一定的偶然性。随机抽样的方法很多:有单纯随机抽样、整群抽样、系统抽样等(见第九章)。例如,要了解某地2004年所有20岁健康男大学生,分别测其身高值。这120名20岁健康男大学生的身高值就是样本。五.抽样研究(samplingstudy)对从研究的总体中随机抽取有代表性的一部分个体构成的样本进行研究称为抽样研究。抽样研究的目的是通过用样本资料计算的指标去推论总体。由于总体较大,要收集所有观察单位的数据既费时、费力还容易产生误差;对于无限总体,又不可观察到每一个个体,所以医学研究的资料多数是通过抽样研究去获得。如欲了解某地2004年20岁健康男大学生的平均身高。该地2004年所有20岁健康男大学生的身高值是一个总体。但是我们不可能,而且也没必要把每个20岁健康男大学生都找到测其身高值。因此可以从总体中随机抽取一定数量的20岁健康男大学生身高值作为样本(例如样本量为120),并计算样本的平均身高()X。如果这个样本均数是有代表性的,而且是可靠的,即可用该样本的平均同身高()X推论该地2004年20岁健康男大学生的平均身高(µ)。六、参数与统计量(parameterandstatistic)参数是指总体指标。如总体均数(µ),总体率()、总体标准差(σ)等。统计量是指样本指标。如样本平均数()X、样本率(P)、样本标准差(S)等。如某地2002年全部正常成处男子的平均红细胞数(µ)即为总体参数和,而从该总体中随机抽取的144名正常成年男子平均红细胞数()X为样本统计量。一般情况下,参数是未知的,需用统计量去估计。用统计计量推论参数的方法,统计学上称参数估计(例如,总体均数的区间估计见第五章)和参数检验(例如,t检验见第六章)。七、统计描述与统计推断(staitstcaldescriptionandstatisticalinference)用统计图表或计算统计指标的方法表达一个特定群体(这人群体可以是一个总体也可以是一个样本)的某种现象或特征,称统计描述;根据样本资料的特性对总体的特性做估计或推论的方法称统计推断。常用方法是参数估计和假设检验。需要注意:随机抽样得到的样本资料即要作统计描述,也要做统计推断;而总体资料只作统计描述,无需作统计推断。例如,用某地2004年120名健康男大学生的身高值绘制直方图表示频数分布的类型,或计算身高的平均数表示平均水平的方法即为统计描述,用120名20岁健康男大学生的身高的平均值去估计该地2004年所有20岁健康男大学生的身高平均值的方法为统计推断,又如:比较两个县某年的婴儿死亡情况,资料分别来自该年全县的婴儿死亡和出生登记(忽略漏报因素)。此时可计算的两个县的婴儿死亡率,直接比较他们的死亡水平,而不必作假设检验,因为资料是来自某年某县的常规报表,不是抽样调查得到的样本。八、误差(error)任何周密设计的科学研究,都不可能没有误差。医学科学研究中的误差通常指测量值与真值之差,其中包括系统误差和随机
本文标题:(05755)卫生统计学第一章
链接地址:https://www.777doc.com/doc-3110461 .html