您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 综合/其它 > 讲稿6数值检验MBA
1数值变量的假设检验刘关键四川大学华西临床医学院循证医学与临床流行病学教研室一、概述数值变量的抽样分布样本来源于正态分布的数值变量,当其样本含量n较小时,其抽样分布服从t分布(组数≤2时),或F分布(组数2时)。样本来源于偏态或未知分布的数值变量,当其样本含量n较小时,其抽样分布的未知。无论样本来自何种分布的数值变量,当样本含量n较大时,其抽样分布仍服从正态分布(中心极限定理);大样本与小样本在数理统计中,n≤30为小样本,n>30是大样本。但是,在医学研究中很多研究无法达到数理统计推导时对设计的严格要求,因此,多数医学统计学者认为:n≤30为小样本,n≥100为大样本,样本含量在30~100之间时,视研究情况而定。数值资料的设计类型在实验设计中,数值资料的设计类型是昀丰富和完整的,主要类型有:完全随机设计(两组、三组及以上)配对与随机区组设计重复测量设计、交叉设计、拉丁方设计析因设计、正交设计计量资料常用的假设检验方法不同设计方案的比较数理统计特征统计方法组数=2成组设计的比较正态、方差齐u检验(例数较大)两个独立样本的t检验(例数较小)成组设计的方差分析(one-wayANOVA)正态、方差不齐两个独立样本的t’检验(例数较小)非正态或方差不齐两个独立样本的秩和检验(WilcoxonW)组数≥3正态、方差齐成组设计方差分析(one-wayANOVA)成组设计的比较非正态或方差不齐秩和检验(Kruskal-WallisHtest)配对计量比较差值服从正态配对t检验(pairedttest)随机区组设计的方差分析(two-wayANOVA)差值不服从正态配对秩和检验(Wilcoxonsignedrankstest)随机区组设计的比较数据服从正态、方差齐随机区组设计的方差分析(two-wayANOVA)数据服从不正态或方差不齐随机区组设计的秩和检验(FriedmanMTest)交叉设计的比较数据服从正态、方差齐交叉设计的方差分析数据服从不正态或方差不齐交叉设计的秩和检验重复测量设计的比较数据服从正态、方差齐、球对称重复测量设计的方差分析析因设计数据服从正态、方差齐析因设计设计的方差分析正交、拉丁方设计数据服从正态、方差齐正交、拉丁方设计的方差分析2二、t、u检验t分布曲线的示意图t分布曲线的特征t分布是一簇与正态分布相似的单峰分布,t=0处为函数昀大值;t分布与标准正态分布相似,以0为中心,左右对称;分布与自由度ν有关,自由度ν越小,其峰值越小,两侧尾部面积越大,反之,其峰值越大,两侧尾部面积越小。t分布与u分布的关系1.随自由度ν增大,t分布逐渐逼近标准正态分布,当自由度为无穷大(ν=∞)时,t分布就等于标准正态分布(u分布)。2.当t值等于u值时,两端尾部面积:t分布u分布;中央面积:t分布<u分布t分布与概率的关系1.自由度(ν)一定时,t值越大,概率(P)越小,t值越小,概率(P)越大;2.概率(P)一定时,随自由度(ν)增大,t值逐渐减小,反之亦然。t分布与t检验t检验,亦称student-t检验(student’st-test),它是以t分布为理论基础的假设检验方法,主要用于不多于两组设计的从正态总体中抽取的具有较小样本含量的计量资料间的比较。3t检验与u检验t、u检验都可用于数值资料的样本与总体比较、配对设计、两组完全随机设计的假设检验。多组完全随机设计(三组及三组以上的比较)、配伍设计(随机区组设计)、交叉设计等设计方案不能使用t检验和u检验。分析目的:统计推断(比较)资料类型:计量资料设计方案:单组、配对、两成组设计数理统计条件:小样本资料源自正态分布,两成组设计还要求两总体方差齐性。t检验应用条件三种设计类型的数值资料的假设检验适用条件和计算公式设计类型t检验(n较小,正态)u(Z)检验(n较小,正态)样本与已知总体均数的比较t=X--μ0SX-=X--µ0S/nu(z)=X--μ0SX-=X--µ0S/n配对计量资料的比较t=d--0Sd-=d-Sd/nu(z)=d--0Sd-=d-Sd/n完全随机设计的两均数比较两组的方差齐(σ12=σ22)时,用下式计算:t=X-1-X-2SX1-−X2-u(z)=X-1-X-2(S1)2n1+(S2)2n2两成组设计t检验的计算公式两均数比较的可信区间法计算两均数差值的可信区间,其公式如下:95%CI:(X1--X2-)±t0.05,νsX1-−X2-99%CI:(X1--X2-)±t0.01,νsX1-−X2-式中sX1-−X2-为两均数差值的标准误,计算公式为:SX1-−X2-=S12(n1-1)+S22(n2-1)n1+n2-2(1n1+1n2)两均数比较的可信区间法示意图0无效线无统计学意义有统计学意义有统计学意义4两成组设计t检验实例分析(两样本t检验例题,孙振球主编)实例分析数据空腹血糖下降值(mmol/L)试验组对照组-0.703.70-5.606.502.005.002.805.200.700.803.500.204.000.605.803.407.106.60-0.50-1.102.506.00-1.603.801.702.003.001.600.402.004.502.204.601.202.503.106.001.70-1.40-2.00试验组:阿卡波胶囊对照组:拜唐苹胶囊SPSS数据格式与菜单成组t检验SPSS分析结果成组t检验分析结果报道该试验组与对照组均数差值的95%CI为(-2.326~1.206),经成组设计的t检验分析,试验组(阿卡波糖胶囊)与对照组(拜唐苹胶囊)空腹血糖下降值的差别无统计学意义(t=-0.642,P=0.525)。2.420502.625020拜唐苹胶囊3.060152.065020阿卡波糖胶囊SDMeanN组别两种药物的降血糖效果的比较配对设计t检验实例分析(配对t检验例题,孙振球主编)5配对设计这是一种比较特殊的设计方式,能够很好地控制非实验因素对结果的影响,是将若干影响试验效应因素(如年龄、性别等)相同的两个受试个体组成一个对子,再将每个对子中的两个受试个体随机分配到两种不同的处理中去。该设计有以下几种情况:①对同对的两个受试对象分别给予两种处理(异体配对);②对同一受试对象分别给予两种处理(自身配对)。特点:每个对子的两个体实现随机分配,不同对子间可以不实行随机分配,目的都是推断两种处理的效果有无差别。注意:同一个体试验前后的比较,属于重复测量设计,而不属于配对设计的范畴。SPSS数据格式与菜单配对t检验SPSS分析结果配对t检验分析结果报道该两种方法对乳酸饮料中脂肪含量测定结果差值的95%CI为(0.194654~0.350146),经配对设计的t检验分析,两种测定方法的差别有统计学意义(t=7.296,P=0.000),可认为哥特里-罗紫法测定结果较高。0.185980.522810脂肪酸水解法0.184360.795210哥特里-罗紫法SDMeanN组别两种方法对乳酸饮料中脂肪含量测定结果的比较方差不齐时两均数比较的t’检验1.方差齐性检验与t’检验方差齐性检验的方法使用F检验,其原理是看较大样本方差与较小样本方差的商是否接近“1”。若接近“1”,则可认为两样本代表的总体方差齐,否则,两方差不齐。在进行两小样本均数的t检验之前,要推断两样本代表的总体方差是否相等,若方差相等,可用t检验,否则应使用t’检验或秩和检验等。62.t’检验(近似t检验)目前,t’检验共有三种方法可供选择:1.Satterthwaite法(1946),对自由度进行校正,然后用t分布获取概率。2.Cochrane&Cox法(1950),对临界概率的t值进行校正,然后得出结论。3.welch法(1947),也是对自由度进行校正,然后用t分布获取概率。三种方法中,昀常用为Satterthwaite法。t、u检验的注意事项1.正态性检验在做t、u检验前,首先应判断资料是否服从正态分布,不服从正态分布的资料不能使用这类统计方法。判断资料是否服从正态分布,可用正态性检验的方法。还可用统计图和表、均数与中位数差、医学知识对资料的正态性进行估计。2.设计方法t、u检验各有三种不同设计的检验方法,彼此间不能混用,否则,容易得出错误的结论。t、u检验适用于不多于两组设计的比较,若是三组及以上,或是其他设计方法,如随机区组、交叉设计、析因设计等,都不能使用t、u检验的统计方法。三、方差分析(analysisofvariance,ANOVA)方差分析又称变异数分析,它是由英国著名统计学家:R.A.Fisher建立的一种统计方法,故也叫F检验。7方差分析是根据资料设计的类型及研究目的,将全部数据的总变异分解成为由若干因素作用来解释的两个或多个变异部分。通过各因素所致的变异与随机误差的比较,可得出由某因素所致的变异与随机误差的比值,从而获得统计量F值和P值,昀后得出某因素对试验结果有无影响的结论。方差分析是推断两组或多组资料的总体均数是否相同,或是检验两个或多个均数的差异是否具有统计学意义的一大类统计分析方法的总称。它不仅可用于两个或多个均数的比较,还可用于交叉、析因、正交和拉丁方等设计方案的统计分析。方差分析也可以用于分析两个或多个研究因素间的交互作用。多个均数间的比较,由于涉及的对比组数大于2,若仍用两组比较的t检验,对每两个对比组作比较,会使犯第一类错误的概率(α)增大。这样,可能把本来无统计学意义的结果错判为有统计学意义。例如:若每次比较的检验水准α=0.05,则每次比较不犯第一类错误的概率为(1-0.05)=0.95,那么:比较组数比较次数实际的α331-0.953=0.1426461-0.956=0.26495101-0.9510=0.4013余类推。因此,多个均数比较(多组的完全随机设计),随机区组、交叉、析因等设计的资料不宜用前述t检验进行比较。两个均数或配对设计的数值资料可使用方差分析,其检验结果与t检验等价。1.正态分布,要求资料服从正态分布,偏态分布资料不适用方差分析。对偏态分布的资料应考虑使用秩和检验,或用变量变换方法将数据转变为正态或接近正态后再进行方差分析。2.方差齐性,即各组的方差要相等,若组间方差不齐则不适用方差分析。故方差分析前,应做多个方差的齐性检验。3.各样本是相互独立的随机样本。方差分析的应用条件8(一)完全随机设计的方差分析one-wayANOVA基本思想实例一三种人的载脂蛋白测定结果糖尿病IGT正常人85.796.0144.0105.2124.5117.0109.5105.1110.096.076.4109.0115.295.3103.095.3110.0123.0110.095.2127.0100.099.0121.0125.0120.0159.0111.0115.0106.5实例二(P54)四组6周后低密度脂蛋白的测定结果安慰剂2.4g4.8g7.2g3.532.422.860.894.593.362.281.064.344.322.391.082.662.342.281.273.592.682.481.63…………3.932.803.042.474.193.572.811.022.962.973.022.524.164.021.972.102.592.311.683.71完全随机设计的变异分解完全随机设计是将总的变异分解成SS组间和SS组内两部分,自由度也可分解成v组间和v组内两部分,各组部分的变异和自由度与总变异和总自由度的关系为:SS总=SS组间+SS组内v总=v组间+v组内完全随机设计的变异分析组间变异:多个组别间的实验数据不相同,这种变异叫做组间变异。它主要是由随机误差和实验效应共同作用的结果。组内变异:每组内部各观察对象的实验数据不相同,这种变异叫做组内变异,它主要是由个体变异(随机误差)所致。9完全随机设计的变异与F值试验效应无效试验效应有效组间/组内
本文标题:讲稿6数值检验MBA
链接地址:https://www.777doc.com/doc-664775 .html