您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 临床研究中常用统计分析方法及选择
临床科研中常用统计方法及选择2014.6CQMU.PB统计学方法有什么用?合理选择统计方法的四个因素数据资料的描述数据资料的组间比较变量间关系研究主要内容一张关于统计学的图片一、统计学方法有什么用?例子1:一研究者宣布找到一种治疗某病的新药,试验的结果如下:药物例数有效有效率新药604270%安慰剂502550%该新药是否值得推广?几个例子假设检验及临床优效性检验例子2:英国某年全人口统计资料英格兰和威尔士移民年龄分组人口(千人)发病数发病率(10万)人口(千人)发病数发病率(10万)0~1900140674.0262180.85~31001866.03026.715~9400178619.01272721.345~49007350150.02542168.065~200017400870.0548960.0合计2130028128132.121314065.7矛盾:移民组的发病率在各个年龄组均高于英格兰和威尔士组,为什么它的合计发病率反而低?分析中混杂因素的控制胃癌228235143187250…胃炎100153178143200…非胃病98123170100120…例子3:为鉴别胃癌、胃炎、非胃病患者,各测定了50名对象的铜兰蛋白等指标,其中铜兰蛋白的观察结果如下:问:三种人的铜兰蛋白有无不同?能否根据测定的铜兰蛋白数据对患者进行初步诊断?假设检验及判别诊断结局指标:心性死亡预后因素:年龄、性别、高血压病、心梗位置、心梗分级、传导阻滞、溶栓治疗,….,等例子4:研究心肌梗死患者预后的影响因素,以是否发生心性死亡作为观察结果指标,对116名心梗患者的22个可能影响预后的因素进行观察和记录哪些预后因素与发生心性死亡有关系?关系的强度如何?影响因素筛选—回归分析统计学在医学科研中作用统计学是进行医学科研的重要工具满足统计学原则要求是保障医学科研科学性的前提采用恰当的统计学方法是研究结论可靠、可信的前提课题申报、论文撰写均有明确的统计学要求研究设计分析目的资料类型数据特征二、合理选择统计方法的四个因素完全随机设计(成组设计)--最常见,最易实施的实验设计方案--将研究对象随机分配到几个组,然后做实验配对设计(区组设计)--将具有相似特征的研究对象配成对子,然后再将每个对子的对象随机分配到两个组进行实验--常见形式:同源配对(如样品一分为二)异源配对(按性别、体重、年龄配对)自身前后配对(试验前后的对比)(一)研究设计析因设计--同时研究多个实验因素对结果的影响--例如,研究药物剂量(3mg、6mg)及给药方式(口服、肌注)对结果的影响,每种组合均需要做试验(3mg+口服,3mg+肌注,6mg+口服,6mg+肌注),为2×2析因设计重复测量设计--同一对象在不同时间点上进行某个指标的观测,以分析该指标在时间上的变化。--临床上很常见的一类资料(一)研究设计对临床资料进行统计描述◦描述性统计分析方法◦如,均数,中位数,标准差,百分比,频数分布等估计总体参数◦95%可信区间对几组资料进行差异性检验◦假设检验方法◦如,t检验,卡方检验,方差分析,秩和检验等探讨变量之间的关系,或者自变量(影响因素)对应变量(结果变量)的影响大小◦多变量分析方法◦如,线性相关,线性回归,Logistic回归,Cox回归、生存分析等(二)分析目的数值变量资料-计量资料无序分类变量资料-计数资料有序分类变量资料-等级资料(三)资料类型无序分类:指类别或属性间无顺序、程度之分例如,性别(男、女)为二分类血型(A、B、AB、O)为多分类有序分类:指类别间存在着次序,或程度上的差异。例如,治疗效果:无效、好转、显效、治愈实验室检验:–、+、++、+++数值变量:每一个观察对象都有一个数值,且大小差异有意义例如,血红蛋白(g/L),住院天数,产前检查次数,住院费用任何统计方法都有自己的适用条件,只有当某个或某些条件满足时,统计计算公式才成立适用条件可根据数据特征来判断•数据的分布特征(正态、偏态)•方差齐性•理论数大小•样本量大小(四)数据特征编号年龄性别治疗组舒张压心电图疗效NOX1X2X3X4X5X6137男A11.27正常显效245女B12.53正常有效343男A10.93异常有效459女B14.67异常无效………10854男B16.80正常无效108例高血压患者治疗后临床记录三、数据资料的描述通过绘制直方图可以直观了解数据的分布(一)数值变量资料的描述偏态分布近似正态分布变异水平平均水平平均水平偏态分布形状研究中,右偏态分布更常见,如住院时间,住院费用,病程等左偏态分布较少见,如考生成绩有时呈左偏态分布方差齐性◦方差是否齐同(相等)◦粗略判断两组标准差之比在2.5倍以上,就得警惕方差不齐指标名称适用的资料均数(X)正态分布或近似正态分布中位数(M)偏态分布、分布未知、两端无界几何均数(G)对数正态分布、等比资料标准差(s)正态分布或近似正态分布四分位数间距偏态分布、分布未知、两端无界极差(R)观察例数相近的数值变量变异系数(CV)比较几组资料间的变异大小描述数值变量资料的常用指标变异水平平均水平平均水平偏态分布近似正态分布中位数均数标准差P25,P75四分位数间距正态分布或近似正态分布:均数与标准差偏态分布或未知分布中位数与P25、P75(四分位数间距)论文中最常用组合通常需要描述各个类别的频数及频率(百分比)(二)分类变量资料的描述108名高血压患者的疗效疗效频数百分比(%)治愈4642.6显效2926.9有效1816.7无效1513.9二维频数表A、B两组高血压患者疗效比较组别治愈显效有效无效合计A29176456B1712121152研究中通常需要列出二维频数表四、数据资料的组间比较假设检验出发点是:•判断样本之间差异由什么原因造成的样本数据间的差异有两种原因所致•样本来自同一总体,差异因抽样误差所引起•样本来自不同总体,差异因不同总体所引起假设检验以P值大小作为推断依据•P值大,表示差异由抽样误差引起可能性大•P值小,表示差异由抽样误差引起可能性小,即由总体不同引起的可能性大•一般以0.05作为临界值来判断(一)组间比较采用技术----假设检验根据资料类型选择计量资料的假设检验•t检验、F检验(方差分析)、Z检验、秩和检验(Wilcoxon秩和检验、H检验、Friedman检验)等计数资料的假设检验•卡方检验、Z检验等等级资料的假设检验•秩和检验(Wilcoxon秩和检验、H检验、Friedman检验)(二)组间比较常用的假设检验方法比较目的应用条件统计方法样本与总体比较n较大Z检验n大小均可t检验两组资料的比较(完全随机设计)n较大Z检验n较小,正态分布,方差齐t检验n较小,非正态分布,方差不齐Wilcoxon秩和检验t’检验1、常用计量资料的假设检验比较目的应用条件统计方法配对资料的比较n较大(任意分布)配对设计Z检验(配对设计)n较小,差值为正态配对设计的t检验n较小,差值为非正态配对设计的秩和检验多组资料的比较正态分布,方差齐方差分析(完全随机设计)非正态分布,方差不齐秩和检验(H检验)配伍资料的比较正态分布,方差齐配伍设计的方差分析(配伍设计)非正态分布,方差不齐配伍设计的秩和检验(Friedman检验)1、常用计量资料的假设检验(续表)比较目的应用条件统计方法样本率与总体率的比较n较小时二项分布的直接法np5且n(1-p)5二项分布的Z检验两个率或构成比的比较(完全随机设计)np5且n(1-p)5二项分布的Z检验n40且T5卡方检验n40且1T5校正卡方检验n40或T1Fisher精确检验2、常用计数资料假设检验方法比较目的应用条件统计方法配对四格表比较(配对设计)b+c40配对卡方检验np5且n(1-p)5校正配对卡方检验多个率或构成比的比较(完全随机设计)全部格子T5或1T5小于25%卡方检验T1或1T5超过25%Fisher精确检验2、常用计数资料假设检验方法(续表)比较目的统计方法两组比较(完全随机设计)多组比较(完全随机设计)Wilcoxon秩和检验秩和检验(H检验)配伍设计秩和检验(Friedman检验)配对设计符号秩和检验3、常用等级资料假设检验方法实例130只大鼠随机分为A、B、C三组,每组10只,分别给予三种药物,5天后测定某指标值如下表。几个例子资料特点:完全随机设计,计量资料,三组不妥的方法:t检验恰当的方法:方差分析实例236只大鼠随机分为对照组、实验组1、实验组2三组,每组12只,分别给予三种饲料,分别于10天、15天、20天、25天测定大鼠体重,如下表。资料特点:完全随机设计,计量资料,三组,重复测量不妥的方法:每个时间点用t检验或方差分析恰当的方法:重复测量的方差分析实例372只小鼠随机分为3组,每组24只,进行实验,分别于试验后1,3,5,7天处死小鼠6只小鼠,测定大脑中酪氨酸激酶B的表达水平,如下表。资料特点:计量资料,三组,重复测量?析因设计?不妥的方法:每个时间点用t检验,重复测量的方差分析恰当的方法:3×4析因设计方差分析实例4两组手术病人,采用两种不同的镇痛方式(试验组、对照组),于手术后24小时测定血清中的IL-6,结果如下表。资料特点:计量资料,两组,标准差相差比较大(方差不齐)不妥的方法:t检验恰当的方法:t’检验或者Wilcoxon秩和检验实例5两组病人,采用两种药物治疗,治疗疗效如下表。经卡方检验,P=0.0486,差异有统计学意义。因此可以认为试验组的疗效比对照组的疗效好。资料特点:计数资料,两组,例数比较少不妥的方法:卡方检验恰当的方法:Fisher精确检验实例6两组病人,采用两种药物治疗,治疗疗效如下表。经卡方检验,P=0.0570,差异无统计学意义。资料特点:等级资料,两组不妥的方法:卡方检验恰当的方法:Wilcoxon秩和检验临床研究中,经常需要分析某些因素与疾病之间的关系,探讨疾病的危险因素。这些通常会涉及到多变量分析。五、变量间关系研究实例7欲研究治疗某病的改进法(传统药+辅药)与传统法(传统药)在不同剂量下的疗效。将150例研究对象随机分成10组,每组15例;每种剂量及每种疗法下观察15例。结果如下表:资料特点:结果变量:是否有效,二分类(有效、无效)两个影响因素:治疗方法、药物剂量不妥的方法:卡方检验或Fisher精确检验恰当的方法:多因素分析中的Logistic回归分析谢谢!
本文标题:临床研究中常用统计分析方法及选择
链接地址:https://www.777doc.com/doc-4894943 .html