您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 工程监理 > SPSS实用教程第07章
SPSS实用教程第七章相关分析第一节BivariateCorrelations过程7.1.1主要功能7.1.2实例操作第二节PartialCorrelations过程7.2.1主要功能7.2.2实例操作第三节DistancesCorrelations过程7.3.1主要功能7.3.2实例操作任何事物的存在都不是孤立的,而是相互联系、相互制约的。在医学领域中,身高与体重、体温与脉搏、年龄与血压等都存在一定的联系。说明客观事物相互间关系的密切程度并用适当的统计指标表示出来,这个过程就是相关分析。值得注意,事物之间有相关,不一定是因果关系,也可能仅是伴随关系。但如果事物之间有因果关系,则两者必然相关。SPSS的相关分析是借助于Statistics菜单的Correlate选项完成的。第一节Bivariate过程7.1.1主要功能调用此过程可对变量进行相关关系的分析,计算有关的统计指标,以判断变量之间相互关系的密切程度。调用该过程命令时允许同时输入两变量或两个以上变量,但系统输出的是变量间两两相关的相关系数。7.1.2实例操作[例7-1]某地区10名健康儿童头发和全血中的硒含量(1000ppm)如下,试作发硒与血硒的相关分析。编号发硒血硒1234567891074668869917366965873131013111697145107.1.2.1数据准备激活数据管理窗口,定义变量名:发硒为X,血硒为Y,按顺序输入相应数值,建立数据库(图7.1)。图7.1原始数据的输入7.1.2.2统计分析激活Statistics菜单选Correlate中的Bivariate...命令项,弹出BivariateCorrelation对话框(图7.2)。在对话框左侧的变量列表中选x、y,点击钮使之进入Variables框;再在CorrelationCoefficients框中选择相关系数的类型,共有三种:Pearson为通常所指的相关系数(r),Kendell’stau-b为非参数资料的相关系数,Spearman为非正态分布资料的Pearson相关系数替代值,本例选用Pearson项;在TestofSignificance框中可选相关系数的单侧(One-tailed)或双侧(Two-tailed)检验,本例选双侧检验。图7.2相关分析对话框点击Options...钮弹出BivariateCorrelation:Options对话框(图7.3),可选有关统计项目。本例要求输出X、Y的均数与标准差以及XY交叉乘积的标准差与协方差,故选Meansandstandarddeviations和Cross-productdeviationsandcovariances项,而后点击Continue钮返回BivariateCorrelation对话框,再点击OK钮即可。图7.3相关分析统计对话框7.1.2.3结果解释:在结果输出窗口中将看到如下统计数据:变量X、Y的例数、均数与标准差,变量X、Y交叉乘积的例数、标准差与协方差;XY两两对应的相关系数及其双侧检验的概率,本例r=0.8715,P=0.001。VariableCasesMeanStdDevX1075.400012.2945Y1010.80003.3267VariablesCasesCross-ProdDevVariance-CovarXY10320.800035.6444XYX1.0000.8715(10)(10)P=.P=.001Y.87151.0000(10)(10)P=.001P=.(Coefficient/(Cases)/2-tailedSignificance).isprintedifacoefficientcannotbecomputed第二节Partial过程7.2.1主要功能调用此过程可对变量进行偏相关分析。在偏相关分析中,系统可按用户的要求对两相关变量之外的某一或某些影响相关的其他变量进行控制,输出控制其他变量影响后的相关系数。7.2.2实例操作[例7-2]某地29名13岁男童身高(cm)、体重(kg)和肺活量(ml)的数据如下表,试对该资料作控制体重影响作用的身高与肺活量相关分析。编号身高(cm)体重(kg)肺活量(ml)编号身高(cm)体重(kg)肺活量(ml)12345678135.1139.9163.6146.5156.2156.4167.8149.732.030.446.233.537.135.541.531.0175020002750250027502000275015001617181920212223153.0147.6157.5155.1160.5143.0149.4160.847.240.543.344.737.531.533.940.4175020002250275020001750225027509101112131415145.0148.5165.5135.0153.3152.0160.533.037.249.527.641.032.047.22500225030001250275017502250242526272829159.0158.2150.0144.5154.6156.538.537.536.034.739.532.02500200017502250250017507.2.2.1数据准备激活数据管理窗口,定义变量名:身高为height,体重为weight,肺活量为vc,按顺序输入相应数值,建立数据库。7.2.2.2统计分析激活Statistics菜单选Correlate中的Partial...命令项,弹出PartialCorrelations对话框(图7.4)。现欲在控制体重的影响下对变量身高与肺活量进行偏相关分析,故在对话框左侧的变量列表中选变量height、vc,点击钮使之进入Variables框,选要控制的变量weight,点击钮使之进入Controllingfor框中,在TestofSignificance框中选双侧检验,然后点击OK钮即可。图7.4偏相关分析对话框7.2.2.3结果解释在结果输出窗口中将看到如下统计数据:控制体重的影响后,身高与肺活量的相关系数为0.0926,经检验P=0.639,故身高与肺活量的线性相关不存在。(如果不控制体重的影响,则身高与肺活量的相关系数为0.5884,P为0.001。在有控制的情况下,身高与肺活量的决定系数=r2=0.00857,而无控制的身高与肺活量决定系数=r2=0.34621,可见身高与肺活量的相关有33.764%是由体重协同作用而产生的。)Controllingfor..WEIGHTHEIGHTVCHEIGHT1.0000.0926(0)(26)P=.P=.639VC.09261.0000(26)(0)P=.639P=.(Coefficient/(D.F.)/2-tailedSignificance).isprintedifacoefficientcannotbecomputed如果控制变量改为身高,则得如下结果:体重与肺活量的相关系数为0.5528,经检验P=0.002,故体重与肺活量的线性相关存在。可见,尽管肺活量与身高和体重均有关系,但如果仅仅研究其中一个变量与肺活量的相关关系时,体重的意义会更大。Controllingfor..HEIGHTVCWEIGHTVC1.0000.5528(0)(26)P=.P=.002WEIGHT.55281.0000(26)(0)P=.002P=.(Coefficient/(D.F.)/2-tailedSignificance).isprintedifacoefficientcannotbecomputed第三节Distances过程7.3.1主要功能调用此过程可对变量内部各观察单位间的数值进行距离相关分析,以考察相互间的接近程度;也可对变量间进行距离相关分析,常用于考察预测值对实际值的拟合优度。7.3.2实例操作[例7-3]某医师对10份标准血红蛋白样品作三次平行检测,结果如下,问检测结果是否一致?样品号12345678910第一次第二次第三次12.3612.4012.1812.1412.2012.2212.3112.2812.3512.3212.2512.2112.1212.2212.1012.2812.3412.2512.2412.3112.2012.4112.3012.4612.3312.2212.3612.1712.2412.117.3.2.1数据准备激活数据管理窗口,定义变量名:第一次测量值为HB1,第二次测量值为HB2,第三次测量值为HB3,输入相应数值即完成。7.3.2.2统计分析激活Statistics菜单选Correlate中的Distance...命令项,弹出Distance对话框(图7.5)。在对话框左侧的变量列表中选变量hb1、hb2、hb3,点击钮使之进入Variables框。在ComputeDistances框中有两个选项,Betweencases表示作变量内部观察值之间的距离相关分析,Betweenvariables表示作变量之间的距离相关分析,在本例中,因三次平行测量结果分别置于三个变量中,故选择后者。图7.5距离相关分析对话框在Measure栏中有两种测距方式:Dissimilarities为不相似性测距,Similarities为相似性测距。若选Dissimilarties并点击Measure...钮,弹出Distance:DissimilarityMeasure对话框(图7.6),用户可根据数据特征选用测距方法:图7.6距离相关中不相似性距离测量对话框1、计量资料Euclideandistance:以两变量差值平方和的平方根为距离;SquaredEuclideandistance:以两变量差值平方和为距离;Chebychev:以两变量绝对差值的最大值为距离;Block:以两变量绝对差值之和为距离;Minkowski:以两变量绝对差值p次幂之和的p次根为距离;Customized:以两变量绝对差值p次幂之和的r次根为距离。2、计数资料Chi-squaremeasure:χ2值测距;Phi-squaremeasure:ψ2值测距,即将χ2测距值除合计频数的平方根。3、二分字符变量Euclideandistance:二分差平方和的平方根,最小为0,最大无限;SquaredEuclideandistance:二分差平方和,最小为0,最大无限;Sizedifference:最小距离为0,最大无限;Patterndifference:从0至1的无级测距;Variance:以方差为距,最小为0,最大无限;LanceandWilliams:Bray-Curtis非等距系数,界于0至1之间。若选Similarties并点击Measure...钮,弹出Distance:SimilarityMeasure对话框(图7.7),用户可根据数据特征选用测距方法:图7.7距离相关中相似性距离测量对话框1、计量资料Pearsoncorrelation:以Pearson相关系数为距离;Cosine:以变量矢量的余弦值为距离,界于-1至+1之间。2、二分字符变量RussellandRao:以二分点乘积为配对系数;Simplematching:以配对数与总对数的比例为配对系数;Jaccard:相似比例,分子与分母中的配对数与非配对数给予相同的权重;Dice:Dice配对系数,分子与分母中的配对数给予加倍的权重;RogersandTanimoto:RogersandTanimoto配对系数,分母为配对数,分子为非配对数,非配对数给予加倍的权重;SokalandSneath1:SokalandSneathⅠ型配对系数,分母为配对数,分子为非配对数,配对数给予加倍的权重;SokalandSneath2:SokalandSneathⅡ型配对系数,分子与分母均为非配对数,但分子给予加倍的权重;SokalandSneath3:SokalandSnea
本文标题:SPSS实用教程第07章
链接地址:https://www.777doc.com/doc-2850170 .html