您好,欢迎访问三七文档
1相关分析过程2概念相关分析偏相关分析品质相关3相关分析的概念4确定性关系与非确定性关系区别:确定型关系:是通常的函数关系,如圆的面积与半径之间的关系:S=r2不确定型关系:例如,人的身高与体重之间的关系。变量之间的相关关系有两种:确定型关系和不确定型关系。相关分析是研究变量之间不确定关系的统计方法。5相关关系的统计学分类因果关系、共变关系单相关和复相关直线相关和曲线相关正相关、负相关、零相关完全相关、完全不相关、不完全相关本讲研究范围:不确定性的线性相关关系《公共管理定量分析:方法与技术》,袁政,p626《公共管理定量分析:方法与技术》,袁政,p76;另外参考张厚粲和徐建平,2009,p1507相关系数不能相除,不能说前者是后者的几倍相关系数值的大小表明两列数据相互间的相关程度。相关系数为-0.6和0.6,强度一致,只是方向不同。目的:用一个变量去预测另一个变量的值89皮尔逊(pearson)相关系数皮尔逊(pearson)相关系数,是一般常见的线性相关系数,一般用R表示:变量Y和X之间线性相关的程度。R在(0,1)之间为正相关;在(-1,0)之间为负相关;等于1为完全正相关;-1为完全负相关;0为不相关。又称:积差相关、积矩相关(product-momentcoefficientofcorrelation)计算公式为:10皮尔逊(pearson)相关系数21211niiniiiniiXYYYXXYYXXR11积差相关的适用条件成对数据两个变量的总体都符合正态分布:取大样本进行正态分布非参数检验两个变量都是连续变量(scale)两列变量之间的关系是直线性的:散点图+文献张厚粲和徐建平,2009,p11212EffectsizeofPearson’srCohen,J(1992).Apowerprimer.PsychologicalBulletin112(1):155–159.请双击以打开图标:13皮尔逊相关系数的显著性检验举例:14个学生英语考试成绩与每个学生掌握的单词量的相关系数是0.98,检验其显著性?选择=0.05,根据自由度df=14-2=12,查找t分布表得:t0.05/2=2.1788。结论:因为t=17.2792t0.05/2=2.1788,表明线性相关系数是显著的。2122ntrnrt2792.1798.0121498.02t14散点图相关系数为0,即零相关,但不能立即判定两个变量没有关系1516例子:马庆国CH8CH9CH10投资额与依据17简单相关分析:修改运行语句注意WITH前后有空格ABwithCD,只计算A和C、D之间和B和C、D之间的相关例子:马庆国CH8CH9CH10投资额与依据18斯皮尔曼(spearman)相关系数对数据分布形态不作要求适用于定序或以上度量尺度例子:10名学生的数学和语文成绩,计算其相关系数19斯皮尔曼(spearman)相关系数斯皮尔曼(spearman)相关系数,用于反映两个定序或等级变量的相关程度。计算时要首先对变量值求秩。对两个配对测量的变量X和Y的测度值在各自序列中求秩后,斯皮尔曼相关系数的计算公式与皮尔逊相关系数公式相同。两个定距度量尺度的变量也可以计算等级相关系数,但精确度不如积差相关系数(张厚粲和徐建平,2009,p.122)。故二者只报告一个。20斯皮尔曼(spearman)相关系数公式21二元变量的相关过程1.执行命令:Analyzecorrelatebivariate(二元变量)打开对话框;选择两个变量或更多的变量;Correlationcoefficient栏中3个复选项Pearson:连续变量Kendall’stau-b:两个等级变量或类型变量Spearman:两个等级变量或类型变量(系统将会自动对变量值求秩)TestofsignificanceTwo-tailedOne-tailedFlagssignificantcorrelations:加星号22二元变量的相关过程单击options按钮Statistics栏中的选项只当在主对话框选择pearson相关系数时才会被激活:MeanandstandarddeviationsCross-productdeviationsandcovariances:叉积离差阵和协方差阵Missingvalues:Excludecasespairwise:成对剔除参与计算的具有缺失值的观测量Excludecaseslistwise:剔除具有缺失值的所有观测量23马庆国例子同前24练习马庆国:CH9数学语文成绩25练习积差相关:蓝石10.1节;等级相关:张奇,data6-02;蓝石10.2节;26偏相关系数(partialcorrelations)偏相关系数:它描述的是当控制了一个或几个附加变量的影响时两个变量的相关性。例如可以控制工龄的影响,来研究工资收入与受教育程度之间的相关关系。工资教育工龄简单相关系数偏相关系数27偏相关分析的概念相关分析通过计算两个变量之间的相关系数,分析变量间线性相关的程度。在多元相关分析中,由于受到其他变量的影响,pearson相关系数只是从表面上反映两个变量相关的性质,往往不能真实地反映变量之间的线性相关程度,甚至会给人造成相关的假象。因此,在某些场合中,简单的pearson相关系数并不是刻画相关关系的本质统计量。当其他变量被固定住,即将它们控制起来后,给定的任意两个变量之间的相关系数叫偏相关系数。偏相关系数才是真正反映两个变量相关关系的统计量。2829二元变量的偏相关过程1.执行命令:Analyzecorrelatepartialcorrelations(偏变量),打开对话框;选择两个变量或更多的变量;选择至少一个控制变量移入控制变量栏;TestofsignificanceTwo-tailedOne-tailedDisplayactualsignificancelevel:加星号30二元变量的偏相关过程单击options按钮Statistics栏中的选项MeanandstandarddeviationsZero-ordercorrelations:零阶相关系数阵,即pearson相关系数矩阵;Missingvalues:Excludecasespairwise:成对剔除参与计算的具有缺失值的观测量Excludecaseslistwise:剔除具有缺失值的所有观测量31马庆国:CH9偏相关商客旅相关性控制变量商业投资万元地区经济增长游客增长%-无-a商业投资万元相关性1.000.644.791显著性(双侧)..000.000df02424地区经济增长相关性.6441.000.773显著性(双侧).000..000df24024游客增长%相关性.791.7731.000显著性(双侧).000.000.df24240游客增长%商业投资万元相关性1.000.083显著性(双侧)..695df023地区经济增长相关性.0831.000显著性(双侧).695.df230a.单元格包含零阶(Pearson)相关。32虚假相关(spuriouscorrelation)控制了第三个变量后,两个变量之间本来存在的相关关系不存在了。例子:鞋子大小与言语能力数学成绩与语文成绩8-13岁儿童的握力和数学成绩个人收入与大学阶段的成功张厚粲和徐建平,2009,pp148-93334练习偏相关:张奇,data6-03;3536品质相关计数数据二维度列联表373839马庆国书,pp.258-260404142Yete校正:对2×2列联表进行卡方检验,单元格的期望次数低于10但是大于5时,要用Yete连续性校正一行的结果;Fisher精确概率检验法:对2×2列联表进行卡方检验,当某个单元格内期望次数低于5,或者样本总人数低于20时,用本行结果。参考:张厚粲和徐建平,2009,p296;马庆国,2002,p.26043对于非四格表,当期望频数小于5的格子小于20%,用Pearson卡方一行的结果。否则,用似然比一行的结果。以上是关于读取哪一行的结果的指南。至于读取哪一列的结果,可以按下面的指南来判断:如果期望频数小于5的格子多于20%,就不能使用ASYMP.sig的结果。此时,应该在SPSS卡方检验中选择使用ExactTest(确切概率法),以ExactTest的结果为准(软件也同时显示ASYMP.sig的结果)=qrl&index=244卡方检验的注意点抽样的代表性!“在搜集计数数据时,最容易出现有偏样本而又最易被忽视。因此,在应用卡方检验分析计数资料,进行统计推论时,要特别小心谨慎,防止产生有偏样本,注意控制那些影响数据的因素。”(张厚粲和徐建平,2009,p.296)如:抽样的随机性、样本比例、问卷引导语等例子:支持vs不支持45PHI系数和Cramer’sV适用于:两个变量都是定名或者二分变量。2×2:用PHI(真正的二分变量);更多分类,则用Cramer’sV(蓝石,2011,p.180)PHI系数:张厚粲和徐建平,2009,pp143-5蓝石例子:附录KSPSS步骤:分析-描述统计-交叉表和品质相关/卡方检验的关系:PHI和Cramer’sV的输出结果中,给出了相关系数,公式参见张厚粲和徐建平,2009,p143。同时给出显著性概率。这里的显著性概率就是通过卡方检验来计算得出的。也就是说,卡方检验可以分析两个定名变量是否显著相关,而PHI和Cramer’sV则能给出相关系数。另参考张厚粲和徐建平,2009,p.145页最上方例子46品质相关的论文实例纳迪,2009。如何解读统计图表:研究报告阅读指南,pp60-814748质量相关定名变量和定距变量的相关点二列相关:张厚粲和徐建平,2009,pp134-137蓝石ETA法:10.3;附录K;ETA法不检验结果的显著性。4950概念相关分析偏相关分析品质相关51《公共管理定量分析:方法与技术》,袁政,p76;另外参考张厚粲和徐建平,2009,p15052相关系数不能相除,不能说前者是后者的几倍相关系数值的大小表明两列数据相互间的相关程度。相关系数为-0.6和0.6,强度一致,只是方向不同。目的:用一个变量去预测另一个变量的值
本文标题:相关分析(完整)
链接地址:https://www.777doc.com/doc-3725906 .html