您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据挖掘与识别 > 医学科研中的统计学问题-讲座11016
华中科技大学公共卫生学院尹平Tel:027--83692832E_mail:ping_y2000@163.com医学科研中的统计学问题只要有数据的地方就有统计学统计学设计应贯穿于整个研究之中,是研究“成败”的关键!数据资料的统计分析方法的正确应用是结果科学可靠地保证!常见的统计学设计错误1常见的统计学方法错误2常用的统计分析方法3常见的统计学设计错误1设计类型随机化与对照样本量与检验效能盲法与偏倚配对(伍)设计滥用成组设计问题成组设计非处理因素在组间的作用要求均衡!两独立样本多独立样本通过配对(伍)控制非处理因素,使之在组间的作用保持均衡!配对(伍)设计同源配对(伍)异源配对(伍)重复测量设计与析因设计重复测量设计析因设计多指在给予一种或多种处理后,在多个时间点上对同一个受试对象的效应指标进行重复观察!指将两个或多个处理因素的各水平进行组合,如2×2的析因设计。B处理A处理是否是否随机化分组随机化抽样随机化问题明确排除标准受试对象病例来源确定诊断标准规定纳入标准确保受试对象分入每个组的概率(机会)相等临床试验分组盲底的产生由统计专业人员采用国际通用的统计软件(SAS、SPSS)完成盲底参数:种子数---产生随机数的基础分层数---常按中心分层区段(组)数---≥2区段的长度---≥3N=分层数×区段数×区段长度如:240=4(中心)×6(区段)×10(每段长度)多中心、随机、双盲、平行对照临床研究盲底ThePLANProcedureFactorSelectLevelsOrdercen44Orderedblock66Orderedlength1010Randomcenblock------------length-----------1181269473105228931014675348193567210447510261983545296173108631042785619218412651093721037984651234796310152845124106397855911047283665364107819231725496811032617109532843345691827104376149102855176328459106294683171054171089463521278562491031382104739651458136279104571029648531632765918410centeridtreatment(中心号)(药物编号)(处理分组)11B12A13A14B15B。。。。。。。261B262A263A264A265B。。。。。。。3121B3122A3123A3124A3125B。。。。。。。4181B4182B4183B。。。。。。。4239A4240B安慰剂对照标准(阳性)对照同期对照对照原则空白对照如何选择对照呢??对照选择问题重复原则不同受试对象间的重复样本含量N样本量与检验效能问题统计学要求确保检验效能power样本量的估计对于成组设计的两样本均数比较时,每组样本量计算公式近似为:2221412uuunnu为标准正态分布的临界值,可取单侧或双侧值;u只取单侧临界值(β≤0.2);为总体标准差,未知时可用样本标准差S作估计;为容许误差。对于成组设计的两样本率比较时,每组样本量计算公式近似为:2211121sinsin6.1641uunn1和2分别为两总体率,未知时可用预试验的结果进行估计;角度单位为度。Power≥0.8常见的统计学方法错误2统计描述统计学推断关联性分析统计学描述问题均数的滥用问题:中位数适合于偏态分布资料中位数算术均数只适合于正态分布资料算术均数率(rate)与构成比(constituentratio)率与构成比的问题在一定时间及范围内某事件发生的频率(强度)事物的内部各部分所占比重统计学推断问题假设检验假设检验的意义:由样本推断总体的差异无效假设H0与检验水平a=0.05或0.01检验效能power=1-β的含义常用的检验方法:t检验、方差分析(F检验)、χ2检验、非参数法及模型等任何选择方法??资料类型两独立样本----t检验或方差分析(F检验)多独立样本----方差分析(F检验)•任意两组之间的比较:SNK法•试验组与对照组比较:Dunnet法配对设计----配对t检验配伍设计----配伍方差分析协方差分析四格表χ2检验行列表χ2检验配对四格表χ2检验模型(如logistic回归等)计量资料分类资料正态偏态两独立样本----Wilcoxon秩和检验多独立样本----Kruskal-WallisH检验配伍设计----FriedmanM检验配对设计----Wilcoxon符号秩检验算术均数的滥用P值的含义不清误用t检验代替F检验重复测量数据的配对(伍)化处理参数方法与非参数方法不分相关与回归分析缺乏专业依据重复测量数据的方差分析算术均数只适合于正态资料计量资料统计分析常见错误四格表χ2检验条件不具备率的多重比较α水平不调整T1时应采用Fisher’s法分类资料统计分析常见错误----基于2分割法(partitionsof2method)的多重比较2)1(122kkCCkk多个试验组间的两两比较试验组与同一对照组的比较)1(2k四格表资料的Pearson2检验TTA22)(•条件:Tmin5且n40时:))()()(()(22dbcadcbabcadn•1Tmin5,且n40时:TTA22)5.0|(|))()()(()2/(22dbcadcbanbcdan•Tmin1或n40时,须使用精确概率法(Fisher’s)RC行列表的Pearson2—检验TTA22)(TTA22)5.0|(|ν=(R-1)(C-1)校正公式)1(22CRnnAn行列表χ2检验的类型不分•行列双向无序ν=(R-1)(C-1)•行无序列有序ν=R-1•行有序列无序ν=(R-1)(C-1)•行列双向有序ν=1常用的统计分析方法3统计分析回归分析关联性分析假设检验统计描述计量资料计数资料:率、构成比等正态:均数、标准差偏态:中位数、四分位间距计量资料计数资料:列联系数分析或有序变量的Spearman相关正态:Pearson相关偏态:秩相关应变量是连续性变量(满足正态、线性、独立):线性回归应变量是二分类或多分类变量:Logistic回归若考虑应变量出现结局所经历的时间长短(具有删失数据):cox回归等计量资料计数资料两样本均数比较多样本均数比较正态偏态:非参数秩和检验成组设计:方差齐:t检验;方差不齐:t’检验配对设计:配对设计t检验正态:方差分析(任意两组比较SNK-q检验实验组与对照组比较Dunnet-t检验偏态:非参数的Kruskal-wails检验两样本率或构成比:卡方检验(n>40,且T>5),否则,需校正或采用确切概率法R×C表:双向无序:Pearsonχ2检验单向有序:反应变量为有序分类,用秩和检验或CMHχ2检验双向有序:CMHχ2检验重复测量设计的方差分析重复测量设计(repeatedmeasurementdesign)在医学、生物学研究中较为常见,即在给予一种或多种处理后,在多个时间点上从同一个受试对象重复获得指标的观察值;目的是探讨同一研究对象在不同时间点某指标的变化情况。前后测量设计(premeasure-postmeasuredesign)与配对设计主要区别:“处理”分配配对设计是随机的,看同期观测结果前后测量设计不是随机的“独立性”“统计分析”配对设计的观测结果与差值独立前后测量设计观测结果与差值不独立配对设计用平均差值推断处理的作用前后测量设计除分析平均差值外,还可进行相关回归分析重复测量设计与随机区组设计的主要区别“处理”分配随机区组设计中“处理”在区组内随机分配,同期观测结果重复测量设计中“处理”在区组间可随机分配,但区组内各时点是固定的,不能随机分配“独立性”“统计分析”随机区组设计中区组内的实验单位及其观测结果独立重复测量设计中区组内的观测结果不独立随机区组设计的方差分析须满足“球对称”(sphericity)假设重复测量设计资料采用随机区组设计的方差分析,往往会增大Ⅰ类错误Mauchly“球对称”检验“球对称”系数ε-----G-G(Greenhous-Geisser)-----H-F(Huynh-Feldt)-----L-b(Lower-bound)界值的校正对处理组间F界值的校正----利用“球对称”系数ε乘几以处理组间效应F界值的自由度ν1和ν2,得τ1=ν1ε,τ2=ν2ε,用Fα(τ1τ2)作为检验界值。单样本重复测量数据方差分析表变异来源νSSMSF值调整前调整后F界值PF界值P时间点间t-1SS1SS1/(t-1)MS1/MS3受试对象间n-1SS2SS2/(n-1)受试对象内(误差)(n-1)(t-1)SS3SS3/(n-1)(t-1)合计n×t-1SS总“时间点间”------相当于随机区组设计的“处理因素”;“受试对象间”------相当于随机区组设计的“区组”“受试对象内”------误差(重复测量误差及其它随机误差)。单样本重复测量数据的方差分析只能分析一批观察对象的观测值在不同时间点的差别----往往存在设计缺陷!SS总=SS时间+SS对象间+SS对象内两因素多水平的重复测量数据的方差分析A因素,有g(≥2)个水平-----如“治疗因素”,分为3种治疗方法或药物,即g=3水平(也常称为3个处理组);B因素,有t(≥2)个水平-----“测量时间因素”,对同一受试对象在t个时间点上进行观测。每个处理组有r个受试对象-----共有n=g×r个受试对象,N=g×r×t个观测数据;Tij-------第i个处理组第j个时间点上观测数据的合计(i=1、2、…、g,j=1、2、…、t);Bi-------第i个受试对象观测数据的合计(i=1、2、…、gr);Hi-------第i个处理组观测数据的合计(i=1、2、…、g);Mj------第j个时间点上观测数据的合计(j=1、2、…、t)。重复测量试验数据的方差分析表方差来源νSSMSFP处理g-1CHrtSSi211MS1114/FMSMS测量时间t-1CMrgSSj221MS2225/FMSMS处理×测量时间(g-1)(t-1)21231SSSSCTrSSijMS3335/FMSMS观察对象间误差g(r-1)1241SSCBtSSiMS4观察对象内误差g(r-1)(t-1)43215SSSSSSSSSSSSTMS5合计gr-12TSSXC,2()/CXNSS总=SS处理+SS时间+SS处理×时间+SS对象间+SS对象内
本文标题:医学科研中的统计学问题-讲座11016
链接地址:https://www.777doc.com/doc-2640364 .html