您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 常用统计分析方法介绍与实例解析
常用推断性统计分析方法介绍及其实例解析浙江省疾病预防控制中心何凡Tel:0571-87115148;13777843290Email:zjhefan@126.com12基本概念——变量类型常用推断性统计分析1.两组之间比较—定性资料2.两组之间比较—等级资料3.两组之间比较—定量资料4.两组以上资料(无序多分类)的比较—定性资料5.两组以上资料(无序多分类)的比较—等级资料6.两组以上资料(无序多分类)的比较—定量资料7.两等级变量关系的分析8.等级变量与定量变量之间的关系分析9.两定量变量关系的分析10.多选题分析11.Logisitic回归分析目录基本概念——变量类型1、定性变量:最常见的是分类变量或名义变量;如职业:工人、农民、民工、商人、学生等,此为多分类变量;最简单和最常用的分类变量是二分类变量,如性别:男、女,某种疾病:有、无,某种结局:出现、未出现等。3有序变量或等级变量与分类变量不同,各种可能的“取值”中自然地存在着次序,如问卷调查中对某件事情的满意程度:非常不满意、有点满意、满意、很满意、非常满意;临床体检或实验室检验常用-、±、+、++、+++来表示测量结果;再如《护理与康复》,2004,3(1):54-55,临床教学中培养护生观察能力的方法探讨,作者选用了讲座、教学查房和案例教学三种方法,提高护生观察能力的作用变量为:很有帮助、有帮助、一般。42、定量变量:分两种→离散型和连续型离散型:只能取整数值,如一年中的手术病人数,一年里的新生儿数,细菌菌落数等;连续型:可以取实数中的任何数值,如血压、身高、体重等,可以在实数的一定范围内连续取值;有一些测量值,如红细胞计数,虽然以“个”为单位时只能取连续值,但其数值很大,当以“千”或“万”为单位时,却可取小数值,故通常把这类变量也作为连续型变量处理。5有时为了数据分析的方便,可以将一种类型的变量转化为另一种类型。但只能由高级向低级转化,即连续型→有序→分类→二分类。实例:如《护理与康复》2004,3(1):3-4,全子宫切除术后最佳下床活动时间与肛门排气时间关系的探讨,作者把肛门排气时间分为三个等级(=24h,25~30h,30h),然后再进行分析。6常用推断性统计分析方法7两组之间比较——定性资料(1)二分类资料I成组设计:所用统计方法为四格表χ2检验。8实例2:血压与冠心病患病之间的关系结局血压患病未患病血压偏高1961血压正常20465实例1:两种药物治疗某种疾病的疗效比较疗效药物种类治愈未治愈药物A3010药物B1149910II配对设计:对一组样品同时用两种检测方法对其进行检测,每种检测方法检测结果都分为阳性和阴性,数出两种检测方法同时判定为阳性、阴性的样品数以及它们检测结果不一致的样品数,将结果表示成配对四格表的资料格式。所用统计方法为配对四格表χ2检验。11实例1:两种探针同时检测的结果P探针检测结果生物探针检测结果+-+404-339实例1中,两种检测方法不知何者为优,任何一种方法检测的结果都有假阳性和假阴性,比较它们检测结果不一致的两个频数,无论差别有无统计学意义,都不能说明两种检测方法何者为优,缺乏“金标准”,因而没有必要做统计分析。实例2属于隐含金标准的配对四格表资料,若甲培养基培养出阳性结果,而乙却培养出阴性结果,表明甲优于乙,这种阳性结果为真阳性,此时值得做统计分析。实例3则可以明确地判定试验检测方法的优劣。配对四格表的χ2检验可用McNemarχ2检验,以检测结果不一致部分差别是否具有统计学意义。当然也可用Kappa检验法检验两种检测方法的检测结果是否具有一致性。12实例2:两种培养基对同一批痰液标本同时培养的结果乙培养基甲培养基+-+3634-0135实例3:两种检测方法对同一组受试者检测的结果金标准试验方法+-+314-330估计值P值卡方34.00005.51121E-09校正卡方32.02941.51856E-08估计值P值卡方0.14290.705457校正卡方0.00001.000000结果结果13(2)无序多分类资料:所用方法为2×C表的χ2检验。14实例1:某地城市和农村已婚妇女避孕方法比较避孕方法地区节育器服避孕药避孕套其它城市1533316540农村320754318SPSS数据格式可以采用两组有序变量资料的Wilcoxon秩和检验15两组之间比较——等级资料干预过去三个月您抽烟吗UValuePValue从不很少有时经常前4648461345291-2.88510.0039后3163297181164合计78117585264551617可以选用的方法有成组设计的t检验、u检验、单样本t检验(与总体作比较,实际上此时因素也为二分类)、配对t检验、非参数Wilcoxon检验、符号检验、符号秩和检验等。18参数检验与非参数检验的区别?通常参数检验的检验效能要高于非参数检验,但当参数检验的条件(正态性、方差齐性)得不到满足、开口资料、等级资料或资料的总体分布未知时,可以使用非参数检验的方法进行分析。成组设计和配对设计的区别?配对设计是按照一些非实验因素将受试对象配成对子,给予每对中的个体以不同的处理,配对的条件一般为年龄、性别、体重……。其优点是在同一对的试验对象间取得均衡,从而提高试验的效率。通常分为自身配对设计(某中措施作用于同一个体或两种措施作用于同一个体)和非自身配对设计两种。两组之间比较——定量资料(1)成组设计的t检验,设计类型为成组设计,且因素变量为二分类变量,分析前需要先对资料的正态性和方差齐性进行检验(这是很多参数检验的前提条件)。19例:两组雌鼠,分别饲以高蛋白和低蛋白饲料,8周后记录各鼠体重增加量(克),问两组动物的增重是否有差别?(此处正态性和方差齐性检验略)。利用SPSS进行分析,数据文件及格式见“成组设计t检验.sav”,SPSS菜单操作为:分析→比较均值→独立样本T检验结果见下页IndependentSamplesTest.015.9051.89117.0761.91113.082.078EqualvariancesassumedEqualvariancesnotassumed体重增加量FSig.Levene'sTestforEqualityofVariancestdfSig.(2-tailed)t-testforEqualityofMeans方差齐性检验的分析结果,P值(Sig)=0.9050.05,表明方差齐性t检验分析结果,P值(Sig)=0.0760.05,表明两组动物增加的重量无差异(无统计学意义)。当方差齐性时,看第一行的结果(t=1.891,P=0.076),当方差不齐时,看第二行的结果(t=1.911,P=0.078)20(2)成组设计的u检验,当样本量较大时,两组之间均数的比较可以用u检验,其在SPSS中的实现过程同t检验,此处略。(3)单样本t检验;21例:通过以往大规模调查,已知某地婴儿出生体重均数为3.30kg,今测得某地一组婴儿的出生体重,问该地婴儿出生体重是否与一般婴儿出生体重不同?利用SPSS进行分析,数据文件及格式见“单样本t检验.sav”,SPSS菜单操作为:分析→比较均值→单样本T检验One-SampleTest-1.23211.244婴儿体重tdfSig.(2-tailed)TestValue=3.30(4)配对t检验22例:用某药治疗10例高血压病人,测得治疗前后各病人的舒张压,问该药是否有降低舒张压的作用?利用SPSS进行分析,数据文件及格式见“配对t检验.sav”,SPSS菜单操作为:分析→比较均值→配对样本T检验结果见下页PairedSamplesTest9.70012.3472.4849.035治疗前-治疗后Pair1MeanStd.DeviationPairedDifferencestdfSig.(2-tailed)23(5)非参数Wilcoxon秩和检验,适用于成组设计资料。24例:测得某病的健康人12人和患者10人的某指标值,问两组之间该指标值是否有差异?25(1)二分类:所用方法为R×2表的χ2检验。如几种药物的疗效(有效、无效)比较;不同职业人群某病发生率的比较等等。26实例三种药物治疗某种疾病的疗效比较疗效药物种类治愈未治愈药物A3010药物B1149药物C5020两组以上资料(无序多分类)的比较——定性资料27(2)多分类:所用方法为R×C表的χ2检验。28实例1:某医院三年间四种甲状腺疾病在四季中发病人数的分布情况季节甲状腺病分类春夏秋冬甲亢411451294284亚甲炎249329331204甲低60615952甲状腺肿瘤45504640实例2:心律失常种类与心肌梗塞部位关系的调查结果部位心律失常种类下壁前壁后壁心内膜下窦性过缓8721被动心律1100房室阻滞6311束支阻滞11610实例2中小于5的理论频数的格子数超过了总格子数的1/5,若选用一般的χ2检验公式计算,将增大犯假阳性错误的概率,故此处应选用Fisher’s精确检验法。293031此时资料属于单向有序的R×C表资料,可以使用秩和检验、Ridit分析和Logistic回归的方法分析。32实例:三种药物治疗某病患者疗效的观察结果药物种类疗效治愈显效好转无效药物A1549315药物B495022药物C1154524两组以上资料(无序多分类)的比较——等级资料Kruskal-WallisTest:使用SPSS分析实例2资料,数据格式见右侧截图。菜单操作为:分析→非参数检验→旧对话框→K个独立样本注意:例数必须先进行加权操作TestStatisticsa,b61.1462.000Chi-SquaredfAsymp.Sig.疗效KruskalWallisTesta.GroupingVariable:药物b.33当多组之间比较时,可以选用的方法有单因素方差分析、配伍组设计的方差分析(属两因素方差分析,其与二分类的配对t检验相对应)、非参数Kruskal-Wallis检验及非参数Friedman检验等。34(1)单因素方差分析例:某医生为研究一种四类降糖新药的疗效,以统一的纳入标准和排除标准选择了60名2型糖尿病患者,按完全随机设计方案将患者分为三组进行双盲临床试验。其中,将糖新药高剂量组21人、低剂量组19人、对照组20人。对照组用公认的降糖药物,治疗4周后测得其餐后2小时血糖的下降值。问治疗4周后,餐后2小时血糖下降值的三组总体平均水平是否不同?(此处正态性和方差齐性检验略)。利用SPSS进行分析,数据文件及格式见“单因素方差分析.sav”,SPSS菜单操作为:分析→比较均值→单因素Anova两组以上资料(无序多分类)的比较——定量资料截图二:两两比较对话框,常用的有LSD、S-N-K、Bonferroni、Duncan、Dunnett方法。35截图一:方差同质性检验TestofHomogeneityofVariances血糖下降值.177257.838LeveneStatisticdf1df2Sig.ANOVA血糖下降值176.765288.3825.537.006909.8725715.9631086.63759BetweenGroupsWithinGroupsTotalSumofSquaresdfMeanSquareFSig.方差齐性检验结果:P0.05,方差齐方差分析结果,F=5.537,P=0.0060.05,说明三组之间总体平均水平不同。因而进一步用Dunnett法作多个试验组与一个对照组间的比较(见下页)。36MultipleComparisonsDependentVariable:血糖下降值3.3952*1.2650.010.8625.9283.7652*1.2483.0041.2666.265-3.3952*1.2650.010-5.928-.862.37001.2800.774-2.1932.933-3.7652*1.2483.004-6.265-1.266-.37001.2800.774-2.9332.
本文标题:常用统计分析方法介绍与实例解析
链接地址:https://www.777doc.com/doc-4917737 .html