您好,欢迎访问三七文档
医学统计学总结(基础部分)一、医学统计学基础(一)基本概念同质与变异总体与样本参数与统计量变量与数据类型概率误差1.由变异(variation)衍生出的术语:变量variable方差variance方差分析、变异数分析(ANOVAanalysisofvariance)多反应变量multivariate2.变量:数值变量(顺序变量、连续性变量、定量变量)名义变量(定性变量、无序分类变量)等级变量(有序分类变量)3.资料类型:定量资料/定性资料计数资料/计量资料连续型资料/离散型资料。4.统计步骤:(1)统计设计;(2)搜集资料;(3)整理资料;(4)分析资料(二)统计描述:1.定量资料的统计描述:平均数(均数,中位数,几何均数)指标意义应用场合平均数均数平均水平对称分布,特别是正态分布或近似正态分布资料几何均数平均增(减)倍数对数正态分布资料中位数排序后位次居中的观察值水平偏态分布;分布不明;分布末端无确定值变异度极差(全距)个体差异范围说明传染病,食物中毒等的最短、最长潜伏期等四分位数间距个体变异程度偏态分布、分布不明、分布末端无确定值资料的离散程度方差/标准差个体变异程度描述正态分布或近似正态分布资料的离散程度变异系数相对变异程度比较度量衡单位不同或单位相同但均数相差悬殊的多组资料的变异度2.理解:标准差与标准误的区别与联系3.定性资料的统计描述:相对数(率,构成比,比),一些常用率的应用:发病率与患病率死亡率与病死率、因病死亡率等标准化法动态数列4.统计图表:统计图(线图,半对数线图,直条图,直方图,百分条图,圆图,散点图,统计地图,箱式图)图形适用资料做图方法条图组间数量对比用直条高度表示数量大小直方图定量资料的分布用直条的面积表示各组段的频数或频率百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形,叶片为个体值,叶长为频数5.几个分布正态分布适用资料连续性对称分布表达方式N(μ,σ)分布特点1.以均数为中心,左右对称;2.两个参数:总体均数与标准差;3.正态曲线下面积估计公式一般了解统计应用应用范围广,如参考值范围、统计推断等标准正态适用资料连续性对称分布分布表达方式N(0,1)分布特点1.以0或为中心,左右对称2.总体均数为0,标准差为13.曲线下面积:u界值表估计公式一般了解统计应用应用范围广,如参考值范围、统计推断等二项分布适用资料两分类独立重复资料表达方式B(n,π)分布特点1.概率之和等于1;2.二项分布的图形;3.n∞B正态分布;4.二项分布的均数与标准差估计公式了解会用:最少/最多发生的概率统计应用样本率与总体率的比较两样本率的比较Poisson分布适用资料稀有事件的概率分布二项分布的特例表达方式P(μ)或P(λ)分布特点1.分布图形;2.均数等于标准差;3.n∞Poisson分布正态分布;4.Poisson分布可加性估计公式了解会用:最少/最多发生的概率统计应用样本与总体均数比较两样本均数的比较(三)统计推断:1.抽样误差、标准误2.t分布特点:①以0为中心左右对称的单峰分布;②自由度越小,曲线越扁平,自由度越大曲线越尖峭;③自由度∞,t分布曲线趋近与标准正态分布曲线。3.参数估计:用样本统计量推断总体参数——均数、率①区间估计:置信区间或可信区间②理解:参考值范围与可信区间的区别4.假设检验原理5.假设检验步骤:①建立假设确定检验水准;②计算检验统计量;③确定P值,作出推断结论。6.两型错误:①第一类错误α;②第二类错误β,1-β为检验效能。二、比较分析(一)定量资料1.数据类型:(1)单样本均数——t检验(2)两样本均数(配对设计,完全随机设计)——t检验(3)多样本均数(完全随机设计,区组设计)——方差分析(4)两两比较、多重比较、事后检验——LSD法、Bonferoni法、SNK法……2.前提条件:正态分布,方差齐,数据独立3.不满足前提条件:变量变换、非参数检验SS总SS组间SS组内/ν组间/ν组内=MS组间=MS组内=F方差分析基本思想(二)定性资料1.二项分布与POISSON分布(见上)2.列联表的卡方检验普通四格表应用范围两个率的对比;两个二分类变量关联性分析专用公式Pearsonχ2(略)适用条件n≥40且Tmin≥5当n≥40,但有1≤T5时,校正公式当n40,或T1,或P≈α时,用Fisher精确概率法配对四格表应用范围两种方法检出率是否有差别专用公式McNemar检验(略)适用条件b+c≥40b+c40用校正公式b+c25确切概率法行×列表应用范围多个率,多个构成的差别,两个多分类变量关联性分析专用公式(略)适用条件1≤T5的格子数不宜超过总格子数的1/5,且T1增大样本含量;合理合并;删除理论频数太小的行或列;精确概率法3.注意对于“有序(等级)”行×列表的辨析处理(三)非参数检验1.非参数检验的概念2.非参数检验的优缺点:①适用范围广;②受限条件少;③具有稳健性。对符合参数检验条件的资料,若采用非参数检验会导致检验效能下降。3.非参数检验的分析步骤:(1)编排秩次;(2)求秩和与统计量;(3)确定P值,作出推断。4.秩和检验方法要点及注意事项检验方法方法要点注意事项配对设计差值比较的符号秩检验(Wilcoxon配对法)1.按差值绝对值从小到大编秩;2.任取正的秩和或负的秩和作为检验统计量T;3.T界值表确定P值。当n50,可用u(z)检验。有差值的绝对值相等取其平均秩次。遇差值为“0”删除或取平均秩次。成组设计两样本比较的秩和检验(Wilcoxon两样本法)1.将两组数据由小到大统一编秩2.以样本例数较小者为n1,其秩和为T3.查T界值表确定P值。2.若n110或n2-n110时,使用u检验。编秩中如遇有相同数据应取其平均秩次;.若相同秩次较多时(25%),尤其等级资料分析,需使用校正公式。成组设计多个样本比较的秩和检验(Kruskal-Wallis法)1.先将k组数据由小到大统一编秩,求出各组秩和,计算检验统计量H;2.若组数k=3,每组例数n≤5,查H界值表;3.若k3或最小样本例数大于5,则查卡方界值表编秩时若相同数据取其平均秩次。若相同秩次较多时,需使用校正公式。随机区组设计资料的秩和检验(Friedman法)1.先在每一区组内将数据从小到大编秩,求出各处理组秩和;2.计算检验统计量M;3.根据区组数b与处理组数k,查M界值表或编秩时如有相同数据,取平均秩次。三、关联性分析(一)回归分析重点1.直线回归的概念:回归方程与回归系数2.回归分析的一般步骤(1)散点图:观察是否有线性趋势及是否有异常点;(2)最小二乘法求解回归系数与截距与回归方程;回归方程bXaYˆ回归系数及其统计意义(3)统计推断参数估计:回归系数的置信估计条件均数的容许区间条件均数的置信区间假设检验:回归方程的假设检验——方差分析回归系数的假设检验——t检验拟合效果的假设检验——拟合优度检验(R2)(4)统计应用统计预测:XY统计控制:YX3.假设检验(1)平方和划分——方差分析的基本思想(2)方差分析:回归方程的检验SS总SS回归SS残差/ν回归/ν残差=MS回归=MS残差=F注意区分(3)t检验:回归系数的检验(在简单回归中t2=F)4.决定系数——反映拟合优度的统计量(R2=SS回归/SS总)5.了解前提条件:线性、独立、正态、等方差(LINE)(二)相关分析重点(Pearson相关与Spearman秩相关)1.Pearson相关:适用于双随机变量正态分布资料2.相关系数概念:密切程度与相关方向3.相关系数的取值范围:-1≤r≤14.相关系数的假设检验:t检验与r检验5.Spearman秩相关:数据不服从正态分布;分布型未知;等级资料或有不确定值。6.理解:回归与相关的区别与联系——四同六不同四联系:①理论基础;②符号;③假设检验;④回归解释相关六不同:①资料要求;②应用目的;③指标意义;④计算;⑤取值范围;⑥单位(三)多重回归重点1.多重回归方程与偏回归系数、标准化回归系数的概念2.假设检验(1)方差分析:回归方程的假设检验(2)t检验:偏回归系数的假设检验(3)拟合优度检验:决定系数与调整的决定系数(假设检验等价于方差分析)(4)偏回归平方和:回归系数与模型筛选的假设检验3.模型筛选方法:(1)常用评价准则:调整决定系数、AIC准则、Cp统计量等(2)模型筛选方法:全局择优法与局部择优法(前进法、后退法、逐步法)四、统计设计(一)调查设计/观察性研究设计1.观察性研究设计的意义与特点(1)研究/分析因素是客观存在的;(2)不能用随机分配方法平衡混杂因素的影响。2.观察性研究方法研究范围:普查和非全面调查非全面调查指包括:①重点调查;②典型调查;③抽样调查。据研究时间可分为:①横断面调查:也称现况调查;②纵向研究。3.观察性研究设计的内容:①明确具体的调查目的,选择客观、准确的研究指标;②确定调查对象和观察单位,估计观察单位数;③明确调查方法,选择调查方式;④确定调查项目,设计调查表;⑤明确调查的组织计划。整理分析计划主要考虑:资料核查、数据库设计、录入、检查及资料分组和组织计划等。4.基本的抽样方法:单纯随机抽样系统抽样整群抽样分层抽样。5.估计样本含量时应考虑:(1)容许误差δ;(2)Ⅰ型错误α的大小;(3)变异程度σ。(二)实验研究设计1.特点:①处理因素是由研究者据研究目的设置的;②受试对象接受何种处理与水平由随机分配决定,是一种高效的研究方法。2.实验研究按照受试对象不同分为动物实验和临床试验。3.实验研究的基本要素:包括处理因素、受试对象和实验效应三部分。4.实验设计的基本原则:对照(control)重复(replication)随机化(randomization)5.常见的实验研究设计类型:完全随机设计(completelyrandomdesign)、配对设计、随机区组设计(randomizedblockdesign)、交叉设计(crossoverdesign)、析因设计(factorialdesign)、重复测量设计、正交设计(orthogonaldesign)6.实验研究中估计样本含量应考虑:①检验水准即I型错误的概率(α);单侧或双侧检验。②检验效能1-β;③变异程度(σ)大小;④容许误差δ;(三)临床试验设计1.临床试验以人为受试对象,分治疗型临床试验、预防型临床试验和保健型临床试验。2.新药临床试验是临床试验中最常见的一种,Ⅰ期、Ⅱ期、Ⅲ期和Ⅳ期临床试验设计。五、统计分析策略(参考自宇传化主编《SPSS与统计分析》电子工业出版社)(一)单变量定量资料分析(二)单变量定性资料分析(三)双变量资料分析两独立样本比较除了Wilconxon秩和检验,还常用Mannu-WhitneyU检验。Pearson积差相关分析Spearman秩相关分析简单线性回归秩回归/变量变换曲线回归或非线性回归是否是否正态正态相关分析线性是否回归分析Z检验(u检验)二项分布确切概率法2检验/确切概率/Z检验McNemar配对2检验2检验列联系数分析2检验Wilconxon秩和检验Bowker检验/Kappa检验秩相关/线性趋势检验是否是否多样本率或构成比关联度分组变量有序观察效应有序分类属性相同分类属性不同np且n(1-p)≥5独立样本与总体两样本两样本率和构成比R×C表双向无序单向有序双向有序样本均数与总体均数的t检验非参数秩和检验完全随机设计t检验t’检验Wilconxon秩和检验配对t检验Wilc
本文标题:医学统计学总结
链接地址:https://www.777doc.com/doc-5722112 .html