您好,欢迎访问三七文档
两变量关联性分析莫景富卫生统计学教研室本章内容一、pearson线性相关二、Spearman秩相关三、分类变量的关联性分析一、相关分析研究两个事物或现象间的关联性强度。1.pearson线形相关----两个连续性正态分布资料之间的相关2.Spearman秩相关----两个非正态分布资料(或一个变量不服从正态分布、或总体分布未知、等级资料)之间的相关3.分类变量的关联性分析----两个分类变量之间的相关性分析菜单位置:analyze—correlate—Bivariate(双变量)第一节pearson线性相关例10-1(p194)在某地一项膳食调查中,调查对象为14名40~60岁的中年健康妇女,测得每人的基础代谢(kj/d)与体重(kg)的数据。据此数据如何判断这两变量间有无关联?步骤:1、变量设置2、输入数据3、作散点图(Scatter/Dot)步骤graphs—legacydialogs—Scatter/DotScatter/Dot对话框:点击simple(单式散点图)-define定义散点图(横坐标轴、纵坐标轴)可双击散点图进行编辑4、正态性检验正态性检验结果TestsofNormality.15414.200*.93314.390.12914.200*.98114.956基础代谢(kJ/d)体重(kg)StatisticdfSig.StatisticdfSig.Kolmogorov-SmirnovaShapiro-WilkThisisalowerboundofthetruesignificance.*.LillieforsSignificanceCorrectiona.5、相关分析分析—相关—双变量变量相关分析对话框Options对话框描述均数、标准差、样本含量简略结果Correlations1.000.964**..0001414.964**1.000.000.1414PearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)N基础代谢(kJ/d)体重(kg)基础代谢(kJ/d)体重(kg)Correlationissignificantatthe0.01level(2-tailed).**.第二节秩相关适用资料:⑴不服从正态分布的资料⑵总体分布类型未知的资料⑶原始数据用等级表示的资料例10-5(p200)某研究者观察了10例6个月~7岁的贫血患儿的血红蛋白含量与贫血体征,试作秩相关分析。分析1、x变量(血红蛋白)连续性计量资料2、y变量(贫血体征)为等级资料3、选用spearman秩相关分析步骤:1、变量设置、输入数据2、spearman分析秩相关系数为-0.741,近似P值为0.014,小于0.05,拒绝H0,认为血红蛋白与贫血体征之间有相关关系。第三节分类变量的关联性分析根据两个定性变量交叉分类计数所得的频数资料(列联表)作关联(association)分析,即关于两种属性独立性的x2检验。一、交叉分类2×2表的关联分析例10-7(p201)为了观察大学生专业与艾滋病知晓程度之间是否有关,某研究者调查了某大学一年级不同专业的500学生。试分析大学生专业与艾滋病知晓程度之间的关联性。1、变量设置,数据输入2、加权,weightcases3、analyze-descriptivestatistics-crosstabs记录处理情况列联表假设检验结果:Pearson卡方值为42.579,近似概率为0.001,拒绝H0,两变量存在关联性。中文版结果NominalbyNominalContingencyCoefficient名义变量列联系数IntervalbyintervalPearson’sR数值变量Pearson相关系数OrdinalbyordinalSpearman有序变量Spearman相关系数2xn2,min(,)(1)xVkRCnk22xrxn名义变量phi系数为-0.292,近似p值为0.001,列联系数(contingencycoefficient)为0.280,近似p值为0.001,拒绝H0,接受H1,可以认为大学生专业与艾滋病知晓程度之间存在关联性。二、配对资料关联性分析例10-8(p203)有132份食品标本,把每份标本一分为二,分别用两种检测方法做沙门菌检验。试问两种检测方法的结果是否存在关联?1、变量设置输入数据2、加权3、分析analyze-descriptivestatistics-crosstabs记录处理情况CaseProcessingSummary132100.0%0.0%132100.0%甲法*乙法NPercentNPercentNPercentValidMissingTotalCases列联表甲法*乙法CrosstabulationCount80109031114211121132+-甲法Total+-乙法TotalPhi系数为0.192,列联系数为0.189,近似P值为0.027三、R×C表的关联性分析例10-9(p204)欲探讨职业类型与胃病类型是否有关联。某医生将收治的310名胃病患者按主要职业类型与胃病类型两种属性交叉分类,结果见表10-6.问职业类型与胃病类型间有无关联?1.设置变量、输入数据2、加权3、分析选择统计量记录处理情况Chi-SquareTests20.838a4.00020.2714.00016.7271.000310PearsonChi-SquareLikelihoodRatioLinear-by-LinearAssociationNofValidCasesValuedfAsymp.Sig.(2-sided)1cells(11.1%)haveexpectedcountlessthan5.Theminimumexpectedcountis4.36.a.延伸内容四、两有序分类变量的关联性分析例10-11(p206)某研究者欲了解20岁以上成年人研究晶状体浑浊程度与年龄的相关关系,收集资料见表10-9。请分析成年人研究晶状体浑浊程度与年龄的关联性先加权方法一在crosstabs中分析方法二在correlate中分析五、Kappa指数例10-12(p208)对某大学537名女生先后进行两次内容相同的营养调查(相隔2个月),其中食用鸡蛋的情况见表10-11.试对该调查的质量进行评价。1、加权2、在crosstabs中分析
本文标题:两变量关联性分析
链接地址:https://www.777doc.com/doc-3602614 .html