您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 冶金工业 > 2014_02统计学的几个基本概念.
第一章绪论研究生教学用书《医学统计学(第三版)》第一节统计学的几个基本概念一、总体与样本1.总体(population)(1)实体总体特定范围内所有同质(homogeneity)观察单位的集合。有限总体(finitepopulation)可获得抽样框架(samplingframe)无限总体(infinitepopulation)不能获得抽样框架实际总体(N)还是抽象总体(?)样本(n)抽样(2)数据总体特定范围内所有同质观察单位测量值的集合。X1=性别,X2=年龄,X3=身高,X4=体重,X5=体重指数,X6=收缩压,X7=舒张压,……同性别、同年龄身高值的集合同性别、同年龄体重值的集合……2.样本(sample)(1)实体样本实际得到的观察单位随机样本随机抽样获得的样本非随机样本(2)样本数据样本测量值。X1=性别,X2=年龄,X3=身高,X4=体重,X5=体重指数,X6=收缩压,X7=舒张压,……同性别、同年龄身高值的实际测量值同性别、同年龄体重值的实际测量值……3.变量实体总体或样本的测量值,也称为变量(variable)。最简单的情况是单变量。样本均数(RBC,F)总体均数(RBC,F)抽样4.总体参数(parameter)表示总体特征的统计指标,如总体均数、总体率。5.统计量(statistic)样本特征的统计指标,如样本均数、样本率。推论统计:用样本数据特征推论总体数据特征。如何评价样本对总体的代表性?(1)是否是随机样本?(2)是否有足够的观察例数?6.抽样误差(samplingerror)样本均数=总体均数?样本均数是随机变量,总体均数是常数。同质总体中,随机样本统计量与总体参数的差异,称为抽样误差。在抽样误差存在的情况下,如何保证“样本推论总体”的结论是正确的?二、变量与资料病历号医疗费用年龄身高性别费别治疗死亡(元)(岁)(cm)效果OBSX1X2X3X4X5X6X71249243177.011112266540171.212103449557180.722104323151171.011105256756169.512216200553174.913107192661174.813208658053175.821109197335175.4121010221850170.41210……1.计量资料(measurementdata,Scale)定量观察结果,通常有度量衡单位。绝大多数情况下是连续性变量,但也可以是间断性变量,如某市每天因交通事故死亡的人数X1。OBS(日)X1(人数/日)12203149553112病历号医疗费用年龄身高性别费别治疗死亡(元)(岁)(cm)效果OBSX1X2X3X4X5X6X71249243177.011112266540171.212103449557180.722104323151171.011105256756169.512216200553174.913107192661174.813208658053175.821109197335175.4121010221850170.41210……性别:1=男2=女,费别:1=自费2=医保3=公费,治疗效果:1=治愈2=好转3=无效,存活:0=存活1=死亡2.计数资料(enumerationdata,Nominal)定性观察结果,二分类或多分类。统计时经常清点绝对数(countdata)。(1)二分类:两类间相互对立,互不相容。(2)多分类:如观察某人群的血型分布,以人为观察单位,结果可分为A型、B型、AB型与O型,为互不相容的四个类别。3.等级资料(rankeddata,Ordinal)半定性或半定量的观察结果。观察结果之间有大小等级和程度的差别,但不能精确比较。统计时经常清点绝对数。ordinalcategoricaldatacategoricaldata死亡11A型33无效23B型54有效70AB型42治愈99O型604.资料转换定量定量(记分)半定量(多分类)二分类三、误差观察结果=真值+系统误差+随机误差1.随机误差:影响因素众多,大小变化无规律。无方向性。2.系统误差受确定因素影响,大小变化有方向性。3.非系统误差(过失误差)研究者偶然失误而造成的误差。四、频率与概率1.频率(relativefrequency)一个随机试验“阳性”结果发生率.实验者投掷次数出现(f)频率n“正面”次数Buffon404020480.5069K.Pearson1200060190.5016K.Pearson24000120120.5005在相同条件下,独立地重复n次试验,随机事件A出现f次,则称f/n为随机事件A出现的频率。2.概率(probability)概率是描述随机事件发生可能性大小的一个度量。当n逐渐增大时,频率接近一个常数。该常数c称为为随机事件A发生的概率,记为P(A)=c,简记为P=c。1当P≤0.05,称A为小概率事件。小概率事件如果在一次试验中发生,如(连续投掷50次硬币都是“正面”),可能有特殊原因。统计上特别关心一次试验中小概率事件是否发生。统计上估计概率值(P值)主要依据概率分布,如正态分布、t分布等。一、设计二、搜集资料三、整理资料四、分析资料第二节医学统计工作的基本步骤按是否施加干预划分:1.实验性研究,前瞻性研究2.观察性研究,调查研究,现况研究或回顾性研究“因果推论”的研究需要严格的实验设计(experimentdesign),如随机对照试验,即RCT的研究。一、设计RCT设计示意图实验设计的三个基本原则•随机(randomization)•重复(replication)•对照(control)干预日历时间试验完成后再找统计学家,无异于请统计学家为试验进行“尸体解剖”。统计学家只能告诉你试验失败的原因,但为时已晚。——R.A.Fisher实验性研究需要收集一手数据,即前瞻性研究。二、搜集资料观察性研究可以收集报告数据,日常临床工作记录(如病历),或历史数据(回顾性研究)。同质性分组与数据表达三、整理资料同质性分组:性别年龄组病种……数据表达:平均住院日平均费用治愈率死亡率……1.统计描述:计算统计指标,描述差别2.统计推论:试验结果的重复性?3.统计解释:“因果”还是“关联”?四、分析资料第三节统计学发展简史S.D.Poisson(1781~1840),法国数学家的学生J.Gavarret,1840年在巴黎出版了《医学统计学》,是世界上第一部医学统计教科书。1948年,第一个RCT的临床试验(英国)。郭祖超(1912~1999)编著的《医学与生物统计方法》,1948年由正中书局出版,被当时的教育部颁定为“大学用书”,是我国第一部医学统计方法的教材。练习题1.作为硕士研究生,为什么要学习医学统计学?2.下载相关教学课件,获得你的临床观察数据,做描述性统计。
本文标题:2014_02统计学的几个基本概念.
链接地址:https://www.777doc.com/doc-3005775 .html