您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 八应用统计学卡方检验
浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:522020年2月12日星期三`卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:522020年2月12日星期三卡方检验基础四格表卡方检验配对卡方检验与一致性检验两分类变量间关联程度的度量分层卡方检验小结内容提要浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:522020年2月12日星期三2检验是以2分布为基础的一种假设检验方法,主要用于分类变量,根据样本数据推断总体的分布与期望分布是否有显著差异,或推断两个分类变量是否相关或相互独立。其原假设为:H0:观察频数与期望频数没有差别卡方检验基础浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:522020年2月12日星期三首先假设H0成立,计算出2值,它表示观察值与理论值之间的偏离程度。根据2分布,2统计量以及自由度可以确定在H0成立的情况下获得当前统计量及更极端情况的概率P。如果P很小,说明观察值和理论值偏离程度太大,应当拒绝原假设,表示比较资料之间有显著性差异;否则就不能拒绝原假设,尚不能认为样本所代表的实际情况与理论假设有差别。卡方检验基础2检验的基本思想浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:522020年2月12日星期三2值的计算:22()AEE由英国统计学家KarlPearson首次提出,故被称为Pearson2。卡方检验基础浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:522020年2月12日星期三当n比较大时,2统计量近似服从k-1个自由度的2分布。在自由度固定时,每个2值与一个概率值(P值)相对应,此概率值即为在H0成立的前提下,出现这样一个样本或偏离假设总体更远的样本的概率。如果P值小于或等于显著性水准,则拒绝H0,接受H1,即观察频数与期望频数不一致。如果P值大于显著性水准,则不拒绝H0,认为观察频数与期望频数无显著性差异。P值越小,说明H0假设正确的可能性越小;P值越大,说明H0假设正确的可能性越大。卡方检验基础-卡方分布浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:522020年2月12日星期三检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布,Possion分布等检验某个分类变量各类的出现概率是否等于指定概率检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关检验控制某种或某几种分类变量因素的作用之后,另两个分类变量是否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊断,其诊断结果是否一致卡方检验基础-用途浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:532020年2月12日星期三例1某种药物加化疗与单用某种药物治疗的两种处理方法,观察对某种癌症的疗效,结果见下表。(数据见cancer.sav)四格表卡方检验处理疗效合计有效无效药物加化疗421355单用药物48351合计9016106两种治疗方法的疗效比较浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:532020年2月12日星期三首先建立数据文件,如下。四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:532020年2月12日星期三注意:由于上表给出的不是原始数据,而是频数表数据,应该进行预处理。四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:532020年2月12日星期三四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:532020年2月12日星期三四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:532020年2月12日星期三四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:532020年2月12日星期三四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:532020年2月12日星期三四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:532020年2月12日星期三结果分析表示药物加化疗与单用药物治疗某种癌症的疗效比较的行×列表,除了观察值以外,还有期望值。四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:532020年2月12日星期三结果分析此为四格表2检验的结果,2=6.508,P=0.011,差异有显著性意义,即药物加化疗与单用药物治疗癌症的疗效有显著性差异。四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:532020年2月12日星期三连续性校正2检验:仅适用于四格表资料,在n40,所有期望频数均大于1,只有1/5单元格的期望频数大于1小于5时;Fisher精确概率法:在样本含量40或有格子的期望频数1的列联表,应该采用该法;似然比2检验:当n40,最小期望频数5时,结论与Pearson2基本一致;几种卡方检验的比较:四格表卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:532020年2月12日星期三配对卡方检验在Pearson卡方检验中,对行列变量的相关性作了检验,其中的行列变量是一个事物的两个不同属性。实际应用中,还有一种列联表,其中的行列变量反映的是一个事物的同一属性。例如把每一份标本分为两份,分别用两种方法进行化验,比较两种化验方法的结果是否有本质不同;或分别采用甲、乙两种方法对同一批病人进行检查,比较此两种方法的结果是否有本质不同,此时要用配对卡方检验。浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:532020年2月12日星期三配对卡方检验配对卡方检验公式:22()=bcbc若b+c40,则用公式:若b+c≤40,则用公式:22(1)=bcbc浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:532020年2月12日星期三例2某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统性红斑狼疮患者血清中抗核抗体进行测定,结果见下表,问两种方法的检测结果有无差别?(数据见McNemar.sav)免疫荧光法乳胶凝集法合计+-+111223-23335合计134558两种方法的检测结果配对卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:542020年2月12日星期三首先建立数据文件,如下。配对卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:542020年2月12日星期三配对卡方检验同理,由于是频数表数据,应该先用weightcases进行预处理。不能忘记哦!浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:542020年2月12日星期三在此选入频数变量即可进行下一步的分析。配对卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:542020年2月12日星期三配对卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:542020年2月12日星期三配对卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:542020年2月12日星期三配对卡方检验选中进行配对卡方检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:542020年2月12日星期三Chi-SquareTests14.154b1.00011.8361.00114.5501.000.000.00013.9101.000.013c58PearsonChi-SquareContinuityCorrectionaLikelihoodRatioFisher'sExactTestLinear-by-LinearAssociationMcNemarTestNofValidCasesValuedfAsymp.Sig.(2-sided)ExactSig.(2-sided)ExactSig.(1-sided)Computedonlyfora2x2tablea.0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis5.16.b.Binomialdistributionused.c.配对卡方检验结果分析浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:542020年2月12日星期三在Pearson卡方检验中,对行变量和列变量的相关性作检验,其中行变量和列变量是一个事物的两个不同属性。在实际中,还有一种列联表,其行变量和列变量反映的是一个事物的同一属性的相同水平,只是对该属性各水平的区分方法不同。其特征是:行的数目和列的数目总是相同的。如果希望检验这两种区分同一属性的方法给出的结果是否一致,则不应当使用Pearson2检验,而应该采用Kappa一致性检验对两种方法一致程度进行评价。一致性检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:542020年2月12日星期三SymmetricMeasures.455.1153.762.00058KappaMeasureofAgreementNofValidCasesValueAsymp.Std.ErroraApprox.TbApprox.Sig.Notassumingthenullhypothesis.a.Usingtheasymptoticstandarderrorassumingthenullhypothesis.b.结果分析如果在crosstab过程的statistics子对话框中勾选上Kappa复选框,则有以下结果:一致性检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:542020年2月12日星期三一般认为,当Kappa≥0.75时,表明两者一致性较好;0.75Kappa≥0.4时,表明一致性一般;Kappa0.4时,表明两者一致性较差。一致性检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:542020年2月12日星期三注意:Kappa检验会利用列联表的全部信息,而McNemar检验只会利用非主对角线单元格上的信息。因此,对于一致性较好,即绝大多数数据都在主对角线的大样本列联表,McNemar检验可能会失去实用价值。一致性检验浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:542020年2月12日星期三两分类变量间关联程度的度量2检验可以从定性的角度说明两个变量是否存在关联,当拒绝原假设时,在统计上有把握认为两个变量存在相关。但接下来的问题是,如果两变量之间存在相关性,它们之间的关联程度有多大?针对不同的变量类型,在SPSS中可以计算各种各样的相关指标,而且Crosstabs过程也对此提供了完整的支持,此处只涉及两分类变量间关联程度的指标,更系统的相关程度指标见相关与回归一章。浙江大学医学院流行病与卫生统计学教研室沈毅重庆交通大学管理学院00:33:542020年2月12日星期三两分类变量间关联程度的度量相对危险度RR:是一个概率的比值,指试验组人群反应阳性概率与对照组人群反应阳性概率的比值。数值为1,表明试验因素与反应阳性无关联;小于1时,表明试验因素导致反应阳性的发生率降低;大于1时,表明试验因素导致反应阳性的发生率增加。优势比OR:是一个比值的比,是反应阳性人群中试验因素有无的比例与反应阴性人群中试验因
本文标题:八应用统计学卡方检验
链接地址:https://www.777doc.com/doc-3669822 .html