您好,欢迎访问三七文档
LOGO医药常用统计方法与统计图表中国药科大学生物统计与计算药学研究中心主要内容统计基本概念1假设检验2常用统计方法3统计图表4一、统计基本概念医学统计工作的内容统计工作贯穿医学研究中的全过程,医学研究中的统计工作包括:•研究设计•数据搜集•数据整理•数据分析医学统计工作的内容A.研究设计设计一般包括专业设计和统计设计。专业设计即确定调查题目、内容等。统计设计包括资料收集、整理与分析。实验三要素:处理因素、受试对象、实验效应设计四原则:对照、随机化、重复、盲法B.搜集资料:按照设计要求,原则是及时、准确、完整地收集原始数据。数据来源:病历、日常医疗工作记录、临床检查与化验记录、疾病监测报表、专题研究C.数据整理:对数据进行清理、改错、数量化D.数据分析:统计描述、统计推断一、统计基本概念常用概念A.同质与变异在调查研究或实验研究中,除了直接关注的影响因素外,其他非研究因素也会影响研究结果,为了突出研究因素的作用,需要使各比较组之间非研究因素尽可能相同,即同质即使非研究因素控制在相同条件下,个体的观察值之间也会有所不同,这种差异叫做变异B.总体与样本根据研究目的确定的同质研究对象的全体称为总体按随机化原则从总体中抽取的部分研究对象称为样本C.抽样和抽样误差抽样是指从总体选取样本的过程,抽样的目的是用样本信息来推断总体特征由于抽样所造成的样本指标与总体指标的差异称为抽样误差D.概率和小概率事件概率(probability)是反映某一事件发生的可能性的大小,常用符号P表示。其值在0和1之间。概率等于1的事件是必然事件,概率等于0的事件是不可能事件,随机事件的概率小于1,而大于0。小概率事件习惯上是指P=0.05的事件。E.变量类型定量变量也称数值变量,根据变量的取值之间有无缝隙,将定量变量分为连续变量和离散变量定性变量也称分类变量,根据变量类别之间是否有顺序、等级、大小关系,将定性变量划分成有序变量和名义变量变量定量变量(数值变量)连续变量离散变量定性变量(分类变量)有序变量二项分类多项分类名义变量二项分类多项分类二、假设检验在临床研究中常常需要判断两种疗效有无显著差异,从而选择临床最优治疗方案,需用到假设检验,亦称显著性检验基本思想对所估计的总体先提出假设(原假设),再用适当的统计方法确定假设成立的可能性大小,若可能性小,则认为假设不成立,若可能性大,不能认为假设不成立小概率事件在一次试验中基本不会发生统计检验(假设检验)步骤:(1)建立假设检验,确定检验水平H0:(无效假设)即假设两个X所属总体相同,表达为μ1=μ2H1:(备择假设)即假设两个X所属总体不同,表达为μ1≠μ2α:(检验水平)通常取5%,表达为α=0.05(2)计算统计量t(当样本含量n<100时)或U(当样本含量n≥100时)(3)确定概率值(P值)通过t与t0.05(查表可得)比较,或U与1.96(U0.05)比较(4)根据统计推断结果,结合相应的专业知识,给出结论假设检验分类参数检验单样本t检验两独立样本t检验两配对样本t检验多样本均值检验非参数检验符号检验秩和检验Pearson检验Kolmogorov-Smirnov检验2以单样本t检验为例例:正常人血清无机磷总体均数为4mg/dl,某地随机抽取16个成人慢性肾炎患者,检查得血清无机磷均数为5mg/dl,标准差为1.6mg/dl。问该地成人慢性肾炎患者的血清无机磷是否与正常人有区别?(即已知:μ=4X=5S=1.6n=16)临床意义:证实慢性肾炎是否会导致血清无机磷含量的改变,即血清无机磷是否可以作为慢性肾炎的诊断指标或疗效观察指标。1)H0:μ=μ0(慢性肾炎患者血清无机磷与正常人相同)H1:μ≠μ0(慢性肾炎患者血清无机磷与正常人不同)2)t=(X–μ)/SX=2.53)ν=n-1=16-1=15查t值表,得t0.05(15)=2.131∴t>t0.05(15)∵P<0.054)可以认为慢性肾炎患者血清无机磷与正常人不同配对样本t检验配对设计是将受试对象按一定条件配成对子,再随机分配每队中的两个受试者到不同的处理组数据形式:在假设检验中,对差值d是否为0做检验,其余计算类似于单样本t检验两独立样本t检验用来比较两样本所来自的总体均数或总体分布是否相同当两样本均来自正态总体且方差齐性时,用t检验,当两样本来自正态总体但方差不齐时,用矫正的t检验,当两样本来自非正态总体或分布未知时,用秩和检验数据形式:治疗药物血红蛋白增加量新药组常规药组多样本均值检验一般来说t检验仅适用于两个样本均值的检验,当检验涉及到三个或三个以上样本均值时,可利用方差分析要求数据正态、独立、方差齐性基本思想:按实验设计和分析目的把全部观察值之间的总变异分为两部分或更多部分,然后再作分析。Choosingatestforcomparingtheaveragesof2ormoresamplesofscoresofexperimentswithonetreatmentfactorDataBetweensubjects(independentsamples)Withinsubjects(relatedsamples)2samplesIntervalIndependentt-testPairedt-testOrdinalWilcoxon-Mann-WhitneytestWilcoxonsignedrankstest,SigntestNominalChi-squaretestMcNemartest2samplesIntervalOnewayANOVARepeatedmeasuredANOVAOrdinalKruskal-WallistestFriedmantestNominalChi-squaretestCochran’sQtest(dichotomousdataonly)三、常用统计方法生存分析Logistic回归分析判别分析聚类分析Meta分析主成分分析1、生存分析医学研究中,为了了解某种疾病的预后、评价治疗方法的优劣或观察预防保健措施的效果等,常需对研究对象进行追踪观察,以获得必要的数据,这类资料都属于随访资料。其研究内容主要包括3个方面:①对生存状况进行统计描述(生存概率、生存率、中位生存期等);②寻找影响生存时间的“危险因素”和“保护因素”;③估计生存率和生存时间长短,进行预后评价。传统方法在分析随访资料时的困难1、时间和生存结局都成为了要关心的因•如果将两者均作为变量拟合多元模型,因为时间分布不明(一般不呈正态分布,在不同情况下的分布规律也不同),拟合多元模型极为困难2、存在大量失访的资料,数据删失•失去联系(病人搬走,电话号码改变)•无法观察到结局(死于其他原因)•研究截止关于截尾或删失随访开始事件失访失访研究截止时仍存活研究截止时点患者进入期间删失的模式图1.非参数法:其特点是不论资料是什么样的分布形式,只根据样本提供的顺序统计量对生存率进行估计,常用的方法有乘积极限法和寿命表法。2.参数法:参数法的特点是假定生存时间服从于特定的参数分布,根据已知分布的特点对影响生存的时间进行分析,常用的方法有指数分布法、Weibull分布法、对数正态回归分析法和对数logistic回归分析法等。3.半参数法:半参数法兼有非参数法和参数法的特点,主要用于分析影响生存时间和生存率的因素,属多因素分析方法,典型方法为Cox模型分析法。生存分析的方法乘积极限法(product-limitmethod)非参数方法,是由Kaplan和Meier在1958年首先提出,故又称Kaplan-Meier法(K-M法)。用于估计生存率主要适用于样本含量较小的资料。表16-4对照组生存率计算秩次观察月数期初病例数死亡人数死亡概率生存概率活过该月的生存率生存率标准误ixndqpp(xt)s(1)(2)(3)(4)(5)(6)(7)(8)111010.10000.90000.90000.094922+900.00001.00000.9000.33810.12500.87500.78750.134046710.14290.85710.67500.155157610.16670.83330.56250.165167+500.00001.00000.5625.711410.25000.75000.42190.1737811+300.00001.00000.4219.913210.50000.50000.21090.17261017111.00000.00000.00000图16-2两种疗法治疗后白血病患者的生存率曲线Cox比例风险回归模型在医学中,对病人治疗效果的考查.一方面要看治疗结局的好坏,另一方面还要看生存时间的长短。生存时间的长短不仅与治疗措施有关,还可能与病人的体质,年龄,病情的轻重等多种因素有关。如何找出其中哪些因素与生存时间有关、哪些与它无关呢?由于失访、试验终止等原因造成某些时间的不完全,不能用多元线性回归分析。1972年英国统计学家CoxDR.提出一种比例危险模型方法,能处理多个因素对生存时间影响的问题。设含有p个变量x1,x2,…,xp及时间T和结局C的n个观察对象.其数据结构为:编号X1X2….XPTC1x11x21…x1py112x21x22…x2py20………………nxn1xn2…xnpyp.━━━━━━━━━━━━━00110,expexppphtXhtXXhtXCOX模型:mmXXXexpthXexpthX,th221100mpXXXexpth/X,th22110偏回归系数i的意义是:当其它协变量都不变时,iX每变化一个单位,相对危险度的自然对数(RRln)变化i个单位。若0i,则1RR,该因素为危险因素;若0i,则1RR,该因素为保护因素;若0i,则1RR,该因素为无关因素。实例:胃癌患者的预后;手术治疗(X1:X1=1,施行手术,X1=0,未施行手术);放射治疗(X2:X2=1,接受放疗,X2=0,未接受放疗);得偏回归系数1、2估计值分别为36001.b33302.bCox回归方程:21021333.0360.0exp./xxthxxth两组病人的危险率分别为:治疗组:)(5.0)1333.01360.0exp()()exp()(),(0022110ththxbxbthXthi未治疗组:)()0333.00360.0exp()()exp()(),(0022110ththxbxbthXthj二者的比值为:5.0,/,jiXthXthRRCox模型的适用范围Cox模型适用于生存资料的统计分析,属半参数模型,对资料没有特殊的要求,也可以估计各因素的参数,并能做多因素的统计分析。该模型的主要优点在于能从众多的影响因素中排除混杂因素的影响,找出影响生存时间的因素,根据各因素的参数估计出个体的生存率。另外,Cox模型能分析具有截尾数值的生存时间。Cox模型在临床流行病学分析中,使临床观察的定性指标又加上定量指标进行分析,提高了分析的效率。2、logistic回归模型Logistic回归模型概念:研究因变量y取某个值的概率变量p与自变量x的依存关系模型:由于概率只能取0到1之间的值,为了把因变量扩展到整个实数范围,对p做logit变换01112(....)1(1/,)1mmmxxPyxxxelogit()ln()1PPP011ln()....1mmPxxyP回归模型参数数学意义0(常数项):所有影响因素均为0时(记作X=0),个体发生事件概率与不发生事件的概率之比的自然对数值。j的含义:某因素Xj改变一个单位时,个
本文标题:医药常用统计方法终
链接地址:https://www.777doc.com/doc-3469238 .html