您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业文化 > 临床科研中正确抉择统计学方法
临床科研中正确抉择统计学方法一、四个因素熟悉和掌握下述四个因素是正确进行统计分析的基础(一)分析目的统计描述–统计指标、统计图或统计表–均数、标准差、率、构成比统计推断(参数估计、假设检验)相关分析–以相关系数来衡量各因素间的密切程度和方向回归分析–研究某因素与另一因素的依存关系(二)资料类型数值变量资料-计量资料无序分类变量资料-计数资料有序分类变量资料-等级资料注意:不宜将定量资料转化为分类资料(三)设计方法每一种科研设计方法都有与之相适应的统计方法成组设计t检验配对t检验条件Logistic回归非条件Logistic回归(四)数理统计条件数理统计与概率论是统计的理论基础只有当某个或某些条件满足时,某个数理统计统计公式才成立涉及最多是数据分布特征其次方差齐性理论数大小二、数据资料的描述(一)数值变量资料的描述描述集中趋势的指标,用以反映一组数据的平均水平描述离散程度的指标,用以反映一组数据的变异大小(两类指标的联合应用才能全面描述一组数值变量的基本特征)描述数值变量资料的常用指标指标名称适用的资料均数(X)正态分布或近似正态分布中位数(M)偏态分布、分布未知、两端无界几何均数(G)对数正态分布、等比资料标准差(s)正态分布或近似正态分布四分位数间距偏态分布、分布未知、两端无界极差(R)观察例数相近的数值变量变异系数(CV)比较几组资料间的变异大小均数与标准差联合使用描述正态分布或近似正态分布资料的基本特征中位数与四分位数间距联合使用描述偏态分布或未知分布资料的基本特征最为常见的错误是不考虑这些指标的适用范围和条件的滥用(二)分类变量资料的描述以比代率,即误将构成比(proportion)当作率(rate)来描述某病发生的强度和频率把各种不同的率相混淆,如把患病率与发病率、死亡率与病死率等概念混同描述分类变量资料的常用指标指标名称计算公式意义率发生某现象的观察单位数可能发生某现象的观察单位数描述事件发生的强度和频率构成比A×100%A+B+….事物内部各组成部分所占的比重发病率Incidence一年内发生的某病新病例数/同年平均人口数在一定时间(一般为1年)内,某人群中发生某种疾病的新病例频率。患病率(现患率)Prevalence某特定时间内某人群中发现有某种疾病者的比例。死亡率Mortality死亡率=一年内总死亡数/同年平均人口数在一定时间(一般为1年)内,某人群中死亡的频率。病死率Casefatalityratio因某病死亡人数/患该病的总数患某病者中因该病死亡者占的比例。三、数据资料的比较(一)假设检验的基本思想样本数据间的不同有两种原因所致1.样本来自同一总体,样本指标间的不同是由于抽样误差所引起2.样本分别来自不同的总体,其样本指标间的不同是由于来源于不同的总体所致假设检验是反证法原理的统计应用假设两个样本均数可能来源于同一总体,然后计算出在此假设下的某个统计量的大小,当这个统计量在其分布中的概率较小时(如p≤0.05)我们就拒绝其假设,而接受其对立假设,认为两样本分别来自不同的总体。(二)假设检验的基本步骤建立检验假设(三个内容)1.无效假设(nullhypothesis)H02.备择假设(alternativehypothesis)H13.检验水准(sizeoftest)α计算统计量根据统计量的值来得到概率(p)值;再按概率值的大小得出结论(三)假设检验的注意事项前提1.研究者需要通过样本的信息去推断总体的结论2.各样本资料对其总体应具有良好的代表性假设检验的概率大小与结论的关系1.当p≤α时,概率越小,越有理由拒绝H0假设(无差别的假设),即拒绝H0假设的可信程度就越大2.注意:当p≤α时,不能说“概率越小,组间的差别就越大”假设检验的结论不能绝对化–在作出结论时,要避免使用绝对的或肯定的语句–当p≤α时,只要p≠0,我们无法完全拒绝无差别的假设,即不能肯定各总体间有差别–当p>α时,只要p≠1,我们无法完全接受无差别的假设,即不能肯定各总体间无差别两组与多组比较1.两组比较:t检验、u检验、两组秩和检验、四格表和较正四格表的X2检验等2.多组比较:方差分析、多组秩和检验、行乘列X2检验等(也可用于两组比较)3.注意:错误使用两组比较的方法代替多组比较的情况并不少见,如,三个均数比较用三个t检验、四个t检验假设检验结论的两类错误1.当p≤α时,做出“拒绝其无差别的假设,可认为各总体间有差别”的结论时就有可能犯错误,这类错误称为第一类错误(typeⅠerror)其犯错误的概率用α表示,若α取0.05,此时犯Ⅰ型错误的概率≤0.05,若假设检验的p值比0.05越小,犯第一类错误的概率就越小。2.当p>α时,做出“不拒绝其无差别的假设,还不能认为各总体间有差别”的结论时就有可能犯第二类错误(typeⅡ)其犯错误的概率用β表示,通常β为未知数,但假设检验p值越大,犯第二类错误的概率就越小注意:当认为干预有负影响时,应使用双侧检验法。除非你有非常可信的证据证明这种差异仅在一个方向存在,否则,你需要用双侧检验法。(四)常用的假设检验方法计量资料的假设检验计数资料的假设检验等级资料的假设检验1、常用计量资料的假设检验比较目的应用条件统计方法样本与总体比较例数较大u检验例数较小t检验两组资料的比较(完全随机设计)例数较大u检验例数较小,来自正态分布且方差齐成组设计的t检验例数较小且非正态分布或方差不齐成组设计的秩和检验/中位数检验统计学处理方法的选择单个自变量资料的统计学分析方法自变量因变量统计方法属性属性卡方(χ2)检验二分(属性)数值t-检验多分(属性)数值方差分析属性数值(有截缩)寿命表法/积限法数值数值回归(或相关)分析统计学处理方法的选择两个或以上自变量资料的统计学分析方法自变量因变量统计方法属性属性对数-线性属性或数值属性(二分)logistic回归属性或数值属性(多分)判别分析属性数值方差分析数值数值多元回归数值或属性数值(有截缩)Cox回归属性(有混杂)数值协方差分析数值─因子分析或聚类分析1、常用计量资料的假设检验(续表)比较目的应用条件统计方法配对资料的比较例数较大(任意分布)配随设计u检验(配对设计)例数较小,差值来自正态配对设计的t检验例数较小,差值为非正态配对设计的秩和检验多组资料的比较各组均数来自正态分布且方差齐成组设计的方差分析(完全随机设计)各组为非正态分布且方差不齐成组设计的秩和检验配伍资料的比较各组均数来自正态分布且方差齐配伍设计的方差分析(配伍设计)各组为非正态分布且方差不齐配伍设计的秩和检验2、常用计数资料假设检验方法比较目的应用条件统计方法样本率与总体率的比较n较小时二项分布的直接法np5且n(1-p)5二项分布的u检验两个率或构成比的比较(完全随机设计)np5且n(1-p)5二项分布的u检验n40且T5四格表的X2检验n40且1T5较正四格表的X2检验n40或T1四格表的确切概率法2、常用计数资料假设检验方法(续表)比较目的应用条件统计方法配对四格表比较(配对设计)b+c40配对X2检验np5且n(1-p)5较正配对X2检验多个率或构成比的比较(完全随机设计)全部格子T5或少于1/5的格子1T5列联表的X2检验若有T1或有多于1/5的格子1T5列联表的确切概率法3、常用等级资料假设检验方法比较目的统计方法两组比较(完全随机设计)多组比较(完全随机设计)两组比较的秩和检验多组比较的秩和检验配伍设计配伍设计的秩和检验配对设计符号秩和检验四、变量间的相关分析数据资料的比较,是同一指标的不同处理组间的比较。在临床研究工作中,常常涉及疾病危险因素的研究和疾病危险因素的探讨,即分析某个因素与疾病间的关系注意:相关关系并不等于因果关系1、常用数值资料的关系分析方法比较目的应用条件统计方法两变量的依存关系正态单变量资料直线回归Ⅰ型正态双变量资料直线回归Ⅱ型两变量的相关关系正态双变量资料直线相关两变量均不服从正态等级相关2、无序分类变量(计数资料)的相关分析前瞻性研究–相对危险度(RR)–归因危险度(AR)回顾性研究–比值比(OR)3、有序分类变量(等级资料)等级相关参数检验–积矩相关系数(Pearson’sγ)非参数检验–Spearman等级相关系数诊断性试验的研究与评价第一节诊断性试验研究的方法与评价条件一、确定金标准1.诊断性试验的金标准(goldstandard)是指当前临床医师公认的诊断疾病最可靠的方法,也称为标准诊断。应用金标准可以正确区分“有病”或“无病”。2.拟评价的诊断性试验对疾病的诊断,必须有金标准为依据,所谓金标准包括活检、手术发现、细菌培养、尸检、特殊检查和影象诊断,以及长期随访的结果。二、选择研究对象1.诊断性试验的研究对象,应当包括两组;一组是用金标准确诊有病的病例组,另一组是用金标准证实为无病的患者,称为对照组。所谓无病的患者,是指没有金标准诊断的目标疾病,而不是完全无病的正常人。2.病例组应包括各型病例:如典型和不典型的,早、中与晚期病例,轻、中与重型的,有和无并发症者等,以便使诊断性试验的结果更具有临床实用价值。3.对照组可选用金标准证实没有目标疾病的其他病例,特别是与该病容易混淆的病例,以期明确其鉴别诊断价值。正常人一般不宜纳人对照组。三、盲法比较诊断性试验与金标准的结果评价诊断性试验时,采用盲法具有十分重要的意义,即要求判断试验结果的人,不能预先知道该病例用金标准划分为有病还是无病,以免发生疑诊偏倚。新的诊断性试验,对疾病的诊断结果应当与金标准诊断的结果进行同步对比,并且列出格表,以便进一步评估,其方法如下。(I)用金标准诊断为有病的病例数为a+c;(2)上述有病的病例经诊断性试验检测,结果阳性者为a,阴性者为c;(3)金标准诊断无病的例数为b+d,其中经诊断性试验检测阳性者为b,阴性者为d;(4)列出四格表,将a,b,c,d的例数分别填入下列四格表(表1);如从论著资料中数据,不能列出四格表的诊断性试验,则无法进行评价。表1四格表的排列金标准(诊断标准)合计有病无病诊断性试验+真阳性a假阳性ba+b_假阴性c真阴性da+c合计a+cb+dn敏感度(sensitivity,SN)是正确诊断的真阳性病例在中风组中所占的百分率,计算公式为:SN=a/(a+c)100%特异度(specificity,SP)是正确诊断的真阴性部分所占百分率,计算公式为:SP=d/(b+d)100%准确性(accuracy,AC)反映了诊断试验结果与金标准试验结果的符合或一致程度,计算公式为:AC=(a+d)/N阳性预测值(positivepredictivevalue,PPV)是诊断试验为阳性结果中金标准证实患中风者所占的百分率,计算公式为:PPV=a/(a+b)100%阴性预测值(negativepredictivevalue,NPV)是诊断试验为阴性结果中金标准证实未患中风者所占的百分率,计算公式为:NPV=d/(c+d)100%.阳性似然比(positivelikelihoodratio,LR+)为患中风组真阳性率和未患中风组假阳性率的比值,计算公式为:LR+=SN/(1-SP),表明诊断性试验为阳性时患病于不患病的比值,比值越大则患病的概率越大.阴性似然比(negativelikelihoodratio,LR-)为患中风组假阴性率与未患中风真阴性率的比值,计算公式为:LR-=(1-SN)/SP,表明诊断试验为阴性时,患病与不患病时机会的比值.第二节诊断性试验的应用及其临床意义1.ROC曲线ROC曲线(receiveroperatorcharacteeristiccurve)又称受试者工作特征曲线,在诊断性试验中,用于正常值临界点的选择,对临床实验室工作尤为重要.诊断资料可以按资料的等级或性质归纳成2X2表(四格表)或行列表。一般地说,如果诊断资料本身为二值变量,即诊断的结
本文标题:临床科研中正确抉择统计学方法
链接地址:https://www.777doc.com/doc-1389626 .html