您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 医学试题/课件 > SPSS 相关分析与回归分析专题
相关分析与回归分析相关分析与回归分析专题(Correlation®ression)相关分析与回归分析相关分析(CorrelationAnalysis)相关分析与回归分析一、相关分析的意义:研究问题过程:单变量分析双变量分析多变量分析多变量分析与单变量分析的最大不同:揭示客观事物之间的关联性。所以,相关分析的意义和目的在于:(1)在统计学中有理论与实践意义(2)对相关关系的存在性给出判断(3)对相关关系的强度给出度量和分析相关分析与回归分析二、相关分析的概念变量之间的关系分为确定性关系和非确定性关系。确定性关系:当一个变量值(自变量)确定后,另一个变量值(因变量)也就完全确定了,确定性关系往往可以表示成一个函数的形式,比如圆的面积和半径的关系:S=πr²非确定性关系:给定了一个变量值后,另一个变量值可以在一定范围内变化,例如家庭的消费支出和家庭收入的关系。研究者把非确定性关系称为相关关系。相关分析与回归分析三.相关分析的特点和应用相关关系是普遍存在的,函数关系仅是相关关系的特例。1.相关关系的类型相关关系多种多样,归纳起来大致有以下6种:强正相关关系,其特点是一变量X增加,导致另一变量Y明显增加,说明X是影响Y的主要因素。弱正相关关系,其特点是一变量X增加,导致另一变量Y增加,但增加幅度不明显。强负相关关系,其特点是X增加,导致Y明显减少,说明X是影响Y的主要因素相关分析与回归分析弱负相关关系,其特点是变量X增加,导致Y减少,但减少幅度不明显,说明X是Y的影响因素,但不是唯一因素。非线性相关关系,其特点是X、Y之间没有明显的线性关系,却存在着某种非线性关系,说明X仍是影响Y的因素。不相关,其特点是X、Y不存在相关关系,说明X不是影响Y的因素。相关分析与回归分析2.相关分析的应用(1)相关分析可以在影响某个变量的诸多变量中判断哪些是显著的,哪些是不显著的。而且在得到相关分析的结果后,可以用于其他分析,如回归分析和因子分析。(2)相关分析方法已广泛用于心理学、教育学、医学、经济学等各学科。它对试验数据的处理、经验公式的建立、管理标准的测定、自然现象和经济现象的统计预报,都是一种方便而且有效的工具。相关分析与回归分析四、相关系数相关分析的主要目的是研究变量之间关系的密切程度,以及根据样本的资料推断总体是否样关。反映变量之间关系紧密程度的指标主要是相关系数r。相关系数r取值在-1到+1之间,当数值愈接近-1或+1时,说明关系愈紧密,接近于0时,说明关系不紧密。相关分析与回归分析相关系数的计算样本的相关系数一般用r表示,总体的相关系数一般用p表示。对于不同类型的变量,相关系数的计算公式不同。在相关分析中,常用的相关系数有:Pearson简单相关系数:对定距连续变量的数据进行计算。如测度收入和储蓄,身高和体重。Spearman等级相关系数:用于度量定序变量间的线性相关关系。如军队教员的军衔与职称。Kendallr相关系数:用非参数检验方法来度量定序变量间的线性相关关系。计算基于数据的秩。相关分析与回归分析22)()())((yyxxyyxxr不相关与时,表示当为负相关与时,表示当为正相关与时,表示当高度相关显著相关、低度相关微弱相关、yxryxryxrrrrr00018.08.05.05.03.03.0Pearson相关系数应用广泛,其计算公式及其性质如下:相关分析与回归分析在Analyze的下拉菜单Correlate命令项中有三个相关分析功能子命令:Bivariate(两两相关分析过程)Partial(偏相关分析过程)Distances(距离分析过程)五、SPSS中相关分析─Correlation菜单相关分析与回归分析Bivariate过程相关分析与回归分析Bivariate过程用于进行两个或多个变量间的参数与非参数相关分析,如为多个变量,给出两两相关的分析结果。这是correlate菜单中最常用的一个过程,包括自动计算Pearson简单相关系数、T检验统计量和对应的概率P值。相关分析与回归分析举例:对肺活量和体重做相关分析1.打开SAV数据。2.用散点图初步观察两变量间有无相关趋势,依次单击菜单“Graphs-ChartBuilder”打开图形构建器,选择做散点图(Scatter/Dot)。相关分析与回归分析3.设置相关分析的参数。依次单击“Analyze-Correlate-Bivariate”执行两变量相关分析。其主设置面板如图所示:待分析变量列表变量列表相关系数显著性检验选项相关分析与回归分析相关分析与回归分析(2)相关性输出,“相关性”表格给出的是Pearson相关系数及其检验结果:“相关系数”表格给出的是两个非参数相关系数及其检验结果。可见,3个相关系数在0.01和0.05的显著性水平(双边检验)上都非常显著,从而推断体重和肺活量之间存在着明显的正相关关系。(1)描述性输出,“描述性统计量”表格给出了两个变量的基本统计信息,包括均值、标准差和频率。相关分析与回归分析Partial过程相关分析与回归分析偏相关分析也称净相关分析,它在控制其他变量的线性影响下分析两变量间的线性相关,所采用的是工具是偏相关系数(净相关系数)。运用偏相关分析可以有效地揭示变量间的真实关系,识别干扰变量并寻找隐含的相关性。如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关关系。Partial过程,当进行相关分析的两个变量的取值都受到其他变量的影响时,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数。相关分析与回归分析举例:分析身高与肺活量之间的相关性,要控制体重在相关分析过程中的影响。1.设置偏相关分析的参数。依次单击“Analyze-Correlate-Patial”执行偏相关分析。其主设置面板如图所示:相关分析与回归分析0阶偏相关(Pearson)1阶偏相关显著相关相关不显著相关分析与回归分析(1)描述性输出,“描述性统计量”表格给出了三个变量的基本统计信息,包括均值、标准差和频率。(2)相关性输出,“相关性”表格给出了所有变量的0阶偏相关(Pearson简单相关)系数和1阶偏相关系数的计算结果果、以及它们各自的显著性检验P值。分析结果显示:在体重不变的条件下,身高与肺活量之间不存在显著线性相关关系。相关分析与回归分析Distances过程相关分析与回归分析距离分析:此过程可以在观测记录之间或者不同变量之间进行相似性和不相似性分析。相似性分析可以用于检测观测值的接近程度,不相似性分析可用于考察各变量的内在联系和结构。该过程一般不单独使用,而是作为因子分析、聚类分析和多维尺度分析等的预分析过程,以帮助了解复杂数据集的内部结构,为进一步的分析做准备。与距离分析有关的统计量分为相似性测度和不相似性测试两大类。相关分析与回归分析不相似性测度a、对定距变量的测度可以使用的统计量有Euclid欧氏距离、平方欧氏距离、契比雪夫距离等。b、对定序变量,使用卡方不相似测度和Phi方不相似测度。c、对二值(只有两种取值)变量,使用欧氏距离、平方欧氏距离、LaneandWilliams不相似测度。相似性测度:a、对定距变量的测度,主要有统计量Pearson相关或余弦距离。b、对二值变量的相似性测度主要包括简单匹配系数、Jaccard相似性指数等。在通常使用的距离中,最常用的是欧式距离。相关分析与回归分析案例:打开“地区经济发展水平指标.sav”相关分析与回归分析参数设置:距离的计算对象距离的测度类型分析变量例表相关分析与回归分析结果分析:相关分析与回归分析(1)案例处理摘要。“案例处理摘要”表格给出了数据使用的基本情况。主要是对有无缺失值的统计信息,可见本例的11个案例没有缺失,全部用于分析。(2)近似矩阵。“近似矩阵”表格给出的是各变量之间的相似矩阵,图中以线框标注了相关系数较大的几对变量。它们在进一步的分析中应重点关注,或者直接对其进行适当的预处理(例如变量约减)相关分析与回归分析相关分析与回归分析相关分析与回归分析线性回归相关分析与回归分析线性回归事物关系函数关系(一一对应)统计关系(非一一对应)线性相关非线性相关相关分析与回归分析回归分析(regressionanalysis)确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。涉及的自变量的多少a.一元回归分析b.多元回归分析自变量和因变量之间的关系类型,a.线性回归分析b.非线性回归分析线性回归相关分析与回归分析回归分析一般步骤:•确定回归方程中的解释变量(自变量)和被解释变量(因变量)•确定回归模型•建立回归方程•对回归方程进行各种检验•利用回归方程进行预测线性回归相关分析与回归分析一元线性回归模型是指只有一个解释变量的线性回归模型,用于揭示被解释变量与另一个解释变量之间的线性关系。一元线性回归数学模型:其中β0和β1是未知参数,分别称为回归常数和回归系数,ε称为随机误差,是一个随机变量,且应该满足两个前提条件:E(ε)=0var(ε)=σ201yx线性回归模型线性回归相关分析与回归分析多元线性回归模型是指有多个解释变量的线性回归模型,用于揭示被解释变量与其他多个解释变量之间的线性关系。多元线性回归数学模型:其中β0、β1、…βp都是未知参数,分别称为回归常数和偏回归系数,ε称为随机误差,是一个随机变量,且同样满足两个前提条件:E(ε)=0var(ε)=σ201122ppyxxx线性回归线性回归模型相关分析与回归分析回归参数的普通最小二乘估计(OLSE)线性回归方程确定后的任务是利用已经收集到的样本数据,根据一定的统计拟合准则,对方程中的各参数进行估计。普通最小二乘就是一种最为常见的统计拟合准则。最小二乘法将偏差距离定义为离差平方和,即(1)最小二乘估计就是寻找参数β0、β1、…βp的估计值β̂0、β̂1、…β̂p,使式(1)达到极小。通过求极值原理(偏导为零)和解方程组,可求得估计值,SPSS将自动完成。2011(,,)(())npiiiQyEy线性回归相关分析与回归分析回归方程的统计检验回归方程的拟合优度检验(相关系数检验)一元线性回归的拟合优度检验采用R2统计量,称为判定系数或决定系数,数学定义为22121ˆ()()niiniiyyRyy21ˆ()niiyy其中称为回归平方和(SSA)称为总离差平方和(SST)21()niiyy线性回归相关分析与回归分析线性回归回归方程的统计检验回归方程的拟合优度检验(相关系数检验)R2取值在0-1之间,R2越接近于1,说明回归方程对样本数据点的拟合优度越高。相关分析与回归分析多元线性回归的拟合优度检验采用统计量,称为调整的判定系数或调整的决定系数,数学定义为2R式中n-p-1、n-1分别是SSE和SST的自由度。其取值范围和意义与一元回归方程中的R2是相同的。回归方程的统计检验回归方程的拟合优度检验(相关系数检验)2111SSEnpSSTnR线性回归相关分析与回归分析回归方程的统计检验回归方程的显著性检验(F检验)一元线性回归方程显著性检验的零假设是β1=0,检验采用F统计量,其数学定义为:2121ˆ()ˆ()2niiniiiyyMSAFMSEyyn即平均的SSA/平均的SSE,F统计量服从(1,n-2)个自由度的F分布。SPSS将会自动计算检验统计量的观测值以及对应的概率p值,如果p值小于给定的显著性水平α,则应拒绝零假设,认为线性关系显著。线性回归相关分析与回归分析回归方程的统计检验回归方程的显著性检验(F检验)多元线性回归方程显著性检验的零假设是各个偏回归系数同时为零,检验采用F统计量,其数学定义为:即平均的SSA/平均的SSE,F统计量服从(p,n-p-1)个自由度的F分布。SPSS将会自动计算检验统计量的观测值以及对应的概率p值,如果p值小于给定的显著性水平α,则应拒绝零
本文标题:SPSS 相关分析与回归分析专题
链接地址:https://www.777doc.com/doc-3293962 .html