您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 医学统计学——变量的分类与统计资料的类型
医学统计学MedicalStatistics医学统计学讲授内容第一章绪论第二章计量资料的统计描述第三章总体均数的估计与假设检验第四章多个样本均数比较的方差分析第五章计数资料的统计描述第六章几种离散型变量的分布及其应用第七章检验第八章秩转换的非参数检验第九章双变量回归与相关第十章统计表与统计图2第十一章多因素试验资料的方差分析第十二章重复测量设计资料的方差分析第十五章多元线性回归分析第十六章logistic回归分析第十七章生存分析第十八章判别分析第十九章聚类分析第二十三章常用综合评价方法第二十四章量表研制与量表资料的统计分析方法“非常痛心地看到,因为数据分析的缺陷和错误,那么多好的生物研究工作面临着被葬送的危险”。--F.Yates,M.J.R.Healy统计知识的运用撰写论文:报告自己观察或实验的研究结果。阅读论文:吸收新知识,了解学术进展。为什么要学医学统计学?60年代到80年代,国外医学杂志调查表明:20%~72%的论文有统计错误。1984年对《中华医学杂志》、《中华内科杂志》、《中华外科杂志》、《中华妇产科杂志》、《中华儿科杂志》595篇论文的调查结果为:相对数误用占11.2%,抽样方法误用占15.9%,统计图表误用占11.7%1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数据分析方法误用达55.7%。2001年《中华预防医学杂志》:中华医学会系列杂志误用约54%(1995)。1996年,有机构对申报科技成果的4586篇科研论文分析,统计方法使用率为76%。医学论文中统计运用错误,除了影响论文的科学性,还可能导致严重的伦理学问题。为什么要学医学统计学?英国统计学家R.A.Fisher(1890-1962)对遗传学家Mendel(1822-1884)杂交试验结果的评价:Mendel的豌豆杂交试验:父本母本第一代YGYG第二代Y/YY/GG/YG/G杂交试验结果:绿色种子的频率2001/8023期望值=80230.25=2006,标准差=39Prop(2001.5~2011.5)=0.11,结合Mendel历次报告的其它实验结果,每次都有如此好的吻合的概率约10万分之4。为什么要学医学统计学?绪论Introduction讲授内容:一、医学统计学的意义二、统计学中的几个基本概念三、统计资料的类型四、医学统计工作的基本步骤五、学习医学统计学应注意的问题一、医学统计学的意义•1.统计学(statistics):应用数学的原理与方法,研究数据的搜集、整理与分析的科学,对不确定性数据作出科学的推断。2.医学统计学(statisticsofmedicine):统计学的原理与方法应用于医学科研与实践。一、医学统计学的意义3.统计学方法的特点:(1)用数量反映质量1)体格检查(量血压、脉搏…)→个体健康质量2)考试分数→个体学习质量3)期望寿命——反映人群健康状况的指标4)婴儿死亡率——反映卫生服务质量的指标………….一、医学统计学的意义•(2)用群体归纳个体•请同学们回答:•2002年长沙市7岁男孩有多高?•1)7岁男孩身高有高有矮•2)n=100,平均身高=119.5cm•95%的长沙市7岁男孩的身高在110.20cm~129.20cm之间二、统计学中的几个基本概念1、研究单位(观察单位、unit)和变量(variable)、变量值(valueofvariable)(1)、研究单位(unit):研究中的个体(individual),是根据研究目的确定的。二、统计学中的几个基本概念例如:研究7岁男孩身高的正常值范围一个人研究大学生视力一只眼睛研究水污染情况一毫升水研究细胞变性一个细胞研究肝癌的地区分布一个地区二、统计学中的几个基本概念(2)变量(variable):研究单位的研究特征。例如:研究7岁男孩身高的正常值范围变量:身高(3)变量值(valueofvariable)二、统计学中的几个基本概念变量值(valueofvariable):变量的观察结果。例如:研究7岁男孩身高变量值:测得的身高值(120.2cm,118.6cm,121.8cm,…)研究某人群性别构成变量值:男、女。二、统计学中的几个基本概念•2、同质(homogeneity)和变异(variation)•(1)、同质(homogeneity):根据研究目的给研究单位确定的相同性质。•研究长沙市2004年7岁男孩身高的正常值范围?•同质:同长沙市、同7岁、同男孩、同无影响身高的疾病。二、统计学中的几个基本概念•(2)、变异(variation)•变异(variation):同质研究单位中变量值间的差异。•例如:1)长沙市2004年7岁男孩身高有高有矮•2)相同的药方治疗相同的疾病的病人,疗效有好有坏二、统计学中的几个基本概念•3、总体(population)和样本(sample)•(1)、总体(population):是根据研究目的确定的同质研究单位的全体。更确切地说是同质研究单位某种变量值的集合。•例如:调查某地2002年正常成年男子的红细胞数的正常值范围二、统计学中的几个基本概念•研究单位:一个人•变量:红细胞数•同质:同某地、同2002年、同成年男子、同正常。总体:1)某地所有的正常成年男子2)某地所有的正常成年男子的红细胞数二、统计学中的几个基本概念•1)有限总体(finitepopulation):研究单位数是有限的•例如:调查某地2002年正常成年男子的红细胞数的正常值范围•2)无限总体(infinitepopulation):研究单位数是无限的•例如:高血压患者←无时间、空间限制。二、统计学中的几个基本概念(2)样本(sample):是总体中抽取的有代表性的一部分。注意:随机抽样(无主观性)样本含量(samplesize):样本中包含的研究单位数。例如:某药治疗高血压患者30名样本含量(n)为30二、统计学中的几个基本概念•4、参数(parameter)和统计量(statistic)•(1)参数(parameter):根据总体个体值统计计算出来的描述总体的特征量。•一般用希腊字母表示•(2)、统计量(statistic):根据样本个体值统计计算出来的描述样本的特征量。•一般用拉丁字母表示二、统计学中的几个基本概念•总体参数一般是不知道的•统计学抽样研究的目的就是:•样本统计量→总体参数二、统计学中的几个基本概念•5、系统误差(systematicerror)、非系统误差(nonsystematicerror)、抽样误差(samplingerror)•误差(error)是指实际观察值与观察真值之差、样本指标与总体指标之差。二、统计学中的几个基本概念•(1)、系统误差(systematicerror):由于仪器未校正、测量者感官的某种障碍、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值两侧,而是有方向性、系统性或周期性地偏离真值。•例如:测量血糖,有斑氏法和葡萄糖氧化法,斑氏法的测量结果偏高←易受体内还原性物质的影响。二、统计学中的几个基本概念这类误差可以通过实验设计和技术措施来消除或使之减少。观察性研究由于组间不可比性产生的系统误差称为偏倚(bias),如吸烟组的平均年龄大于吸烟组,两组死亡率的差异包含年龄偏倚。二、统计学中的几个基本概念•(2)、非系统误差(nonsystematicerror)•由于研究者偶然失误而造成的误差。•例如:仪器失灵、抄错数据、点错小数点、写错单位等,亦称过失误差(grosserror)•这类误差应当通过认真检查核对予以清除,否则将会影响研究结果的准确性。二、统计学中的几个基本概念•(3)、抽样误差(samplingerror):由于抽样所造成的样本统计量与总体参数的差别。•例如:=120.0cmn=100•N=5万→=118.6cm•特点:1)不可避免性•2)有统计规律性X二、统计学中的几个基本概念•产生原因:•个体差异(生物变异)二、统计学中的几个基本概念•6、频率(relativefrequency)、概率(probability)、小概率事件.(1)、频率(relativefreguency):一次随机试验有几种可能结果,在重复进行试验时,个别结果看来是偶然发生的,但当重复试验次数相当多时,将显现某种规律性。例如,投掷一枚硬币,结果不外乎出现“正面”与“反面”两种,现在,我们看一掷币模拟试验:二、统计学中的几个基本概念•实验者投掷次数出现“正面”次数频率•HuPingcheng111.0000•HuPingcheng200.0000•HuPingcheng320.6667•HuPingcheng430.7500•HuPingcheng530.6000•HuPingcheng620.4000•HuPingcheng740.5714•Buffon404020480.5069•K.Pearson1200060190.5016•K.Pearson24000120120.5005二、统计学中的几个基本概念可见,在相同条件下重复试验,试验结果为“正面”或“反面”虽不能事先断定,但我们知道试验的所有可能结果只有两种。在重复多次后,出现“正面”或“反面”这个结果的比例称之为频率。二、统计学中的几个基本概念.(2)、概率(probability)概率是度量随机事件发生可能性大小的一个数值。设在相同条件下,独立地重复n次试验,随机事件A出现次,则称为随机事件A出现的频率。当n逐渐增大时,频率趋向于一个常数,则称该常数为随机事件A的概率,可记为P(A),简记为。0≤P(A)≤1ffnfn二、统计学中的几个基本概念0<P(A)<1随机事件P(A)=1必然事件P(A)=0不可能事件。二、统计学中的几个基本概念频率是就样本而言的,而概率从总体的意义上说的,m/n是概率p(A)的估计值。试验次数越多,估计越可靠。二、统计学中的几个基本概念(3)小概率事件:统计分析中的很多结论都基于一定置信程度下的概率推断,习惯上将称为小概率事件,我们认为小概率事件在一次试验中不可能发生。()0.05()0.01PAPA或二、统计学中的几个基本概念•湖南风采:•中奖概率大约为:1/671万•交通事故:•发生概率为:1/20万三、统计资料的类型变量与统计资料的分类方法1.概述2.数值变量(numericalvariable)和计量资料(measurementdata)3.无序分类变量(unorderedcategoriesvariable)和计数资料(enumerationdata)4.有序分类变量(ordinalcategoriesvariable)和等级资料(rankeddata)三、统计资料的类型1.概述数值变量………………………………..构成计量资料分类变量无序分类变量……………...构成计数资料有序分类变量……………...构成等级资料•变量三、统计资料的类型2.数值变量与计量资料1).数值变量(numericalvariable):变量值是定量的,表现为数值大小,一般有度量衡单位。如:身高(cm)、体重(kg)、血压(pa)、坐高/身高。2).计量资料(measurementdata):由一群个体的数值变量值构成的资料,即一群变量值。如:长沙市99年7岁男孩身高值(120.2cm,118.6cm,121.8cm…)三、统计资料的类型3.无序分类变量与计数资料1).无序分类变量(unorderedcategoriesvariable):变量值是定性的,有类别。特点:类别是客观存在的,各类无秩序,可任意排列;类与类之间界限清楚,(理论上)不会错判。如:性别:男、女。血型:O、A、B、AB。2).计数资料(enumerationdata):一群个体按无序分类变量的类别清点每类有多少个个体,即分类个体数。如:卫生统计学教研室教师性别构成:男:6,女:7。某人群血型构成:O:20A:35B:30AB:10三、统计资料的类型4.有序分类变量与等级资料1).有序分类变量(ordinalcategoriesvaria
本文标题:医学统计学——变量的分类与统计资料的类型
链接地址:https://www.777doc.com/doc-4511376 .html