您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 5SPSS讲义相关回归
直线相关与回归分析直线相关分析直线相关分析是研究两个连续性变量间线性相关的方向及相关密切程度的统计方法。资料要求X、Y均为随机变量,且服从双变量正态分布。相关系数用以说明两个变量间线性关系的密切程度及方向的统计指标。xyxxyylrll相关系数没有单位,取值范围是-1≤r≤1。r值为正,为正相关;r值为负,为负相关。r的绝对值越接近于1,表示两变量相关关系越密切;反之,越接近于0,两变量越差。例研究者研究大白鼠进食量(g)体重增量(g)间的关系如下表,分析两者之间有无相关关系。linear1.sav白鼠进食量(g)与体重增量(g)数据编号12345678910进食量820780720867690787934679639820体重增量165158130180134167186145120158散点图显示两变量间存在线性关系未发现离群值进食量与体重增重FEED1000900800700600WEIGHT190180170160150140130120110相关分析:SPSS操作AnalyzeCorrelationBivariateVariable:feed、weightCorrelationcoefficient:PearsonOK相关系数r=0.940,P0.01。进食量与体重增加量存在较强的正相关关系。Correlations1.000.940**..0001010.940**1.000.000.1010PearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)NFEEDWEIGHTFEEDWEIGHTCorrelationissignificantatthe0.01level(2-tailed).**.秩相关分析用于不服从双变量正态分布的资料;总体分布未知;原始数据用等级表示的资料。•例:欲研究年龄与限制性端粒片段长短的相关关系。Corr1.sav等级相关分析:SPSS操作AnalyzeCorrelationBivariateVariable:age、trfCorrelationcoefficient:SpearmanOK秩相关系数rs=-0.748,P0.01。年龄与限制性端粒片段长短存在负相关,相关程度较高。Correlations1.000-.748**..000123123-.748**1.000.000.123123CorrelationCoefficientSig.(2-tailed)NCorrelationCoefficientSig.(2-tailed)N年龄(岁)限制性端粒片断长度(bp)Spearman'srho年龄(岁)限制性端粒片断长度(bp)Correlationissignificantatthe0.01level(2-tailed).**.偏相关分析•控制其它变量的作用后,两个变量之间的相关关系。•控制了第三个因素的影响后,第一、第二因素的相关系数。12132312(3)22132311rrrrrr例:儿童血红蛋白与血清各种元素见的资料见linear2.sav两两变量的简单相关系数血红蛋白钙镁锰铜铁血红蛋白1.0000.0972.5692**-.3226.2481.8634**钙.09721.0000.5380**.1480.6248**.2995镁.5692**.5380**1.0000-.1212.5821**.6349**锰-.3226.1480-.12121.0000.2939-.2706铜.2481.6248**.5821**.29391.0000.2653铁.8634**.2995.6349**-.2706.26531.0000*-Signif.LE.05**-Signif.LE.01(2-tailed)控制铁后各变量之间的相关系数。Controllingfor..铁血红蛋白钙镁锰铜血红蛋白1.0000-.3354.0539-.1831.0390钙-.33541.0000.4718*.2494.5929**镁.0539.4718*1.0000.0681.5553**锰-.1831.2494.06811.0000.3940*铜.0390.5929**.5553**.3940*1.0000*-Signif.LE.05**-Signif.LE.01(2-tailed)直线回归分析直线回归是研究两变量(X、Y)间的数量依存关系的一种统计方法。其分析的任务是确定一条直线回归方程,保证各实测点距回归直线的纵向距离的平方和最小。•直线回归方程的理论模型:•直线回归方程的一般表达式:µYabX2~(0,)yxN•a表示直线在Y轴上的截距,即当X=0时Y的值。•b为回归系数,即回归直线的斜率。b的统计学意义是X每增加(减)一个单位,Y平均改变b个单位。适用条件:线性独立正态等方差回归系数的假设检验:t检验及方差分析回归拟和指标:决定系数2SSrSS回总•例大白鼠进食量(g)体重增量(g)资料为例,分析两者之间有回归关系。linear1.savSpss回归分析AnalyzeregressionlinearDependent:weightIndependent:feedOKModelSummary.940a.883.8687.88Model1RRSquareAdjustedRSquareStd.ErroroftheEstimatePredictors:(Constant),FEEDa.相关系数=0.94,决定系数=0.883,校正决定系数=0.868ANOVAb3737.41113737.41160.197.000a496.689862.0864234.1009RegressionResidualTotalModel1SumofSquaresdfMeanSquareFSig.Predictors:(Constant),FEEDa.DependentVariable:WEIGHTb.模型的方差分析表,回归模型F=60.197,P0.01,模型有统计学意义。Coefficientsa-17.35722.264-.780.458-68.69933.984.222.029.9407.759.000.156.288(Constant)FEEDModel1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.LowerBoundUpperBound95%ConfidenceIntervalforBDependentVariable:WEIGHTa.回归参数的估计值及检验结果。变量回归系数t检验,t=7.759,P0.01。回归方程weight=-17.357+0.222feedRegressionStandardizedResidual1.501.00.500.00-.50-1.00-1.50HistogramDependentVariable:WEIGHTFrequency2.52.01.51.0.50.0Std.Dev=.94Mean=0.00N=10.00残差的直方图显示残差满足正态性要求NormalP-PPlotofRegressionStandardizedResidualDependentVariable:WEIGHTObservedCumProb1.00.75.50.250.00ExpectedCumProb1.00.75.50.250.00残差的P-P图显示残差满足正态性要求ScatterplotDependentVariable:WEIGHTWEIGHT190180170160150140130120110RegressionStandardizedResidual2.01.51.0.50.0-.5-1.0-1.5-2.0残差的散点图显示残差等方差ScatterplotDependentVariable:WEIGHTRegressionStandardizedPredictedValue2.01.51.0.50.0-.5-1.0-1.5RegressionStudentizedResidual2.01.51.0.50.0-.5-1.0-1.5-2.0
本文标题:5SPSS讲义相关回归
链接地址:https://www.777doc.com/doc-1229206 .html