您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 第10章-相关与回归分析
第10章相关与回归分析XiangYE,InformationSchool,RUC统计数据分析基础教程―基于SPSS和Excel的调查数据分析第10章相关与回归分析第10章相关与回归分析XiangYE,InformationSchool,RUC本章内容10.1问题的提出10.2定量变量的线性相关分析10.3利用SPSS实现线性相关分析10.4定量变量的线性回归分析10.5利用SPSS实现线性回归分析10.6利用Excel图表实现一元线性回归分析10.7利用Excel回归分析工具实现多元线性回归分析第10章相关与回归分析XiangYE,InformationSchool,RUC相关分析与回归分析相关分析是分析客观事物之间关系的数量分析方法。客观事物之间的关系大致可归纳为两大类关系,分别是函数关系和统计关系。相关分析是用来分析事物之间统计关系的方法。回归分析是一种应用极为广泛的数量分析方法。它用于分析事物之间的统计关系,侧重考察变量之间的数量变化规律,并通过回归方程的形式描述和反映这种关系,帮助人们准确把握变量受其他一个或多个变量影响的程度,进而为预测提供科学依据。第10章相关与回归分析XiangYE,InformationSchool,RUC10.1问题的提出发现变量之间的统计关系,并且用此规律来帮助人们进行决策才是统计实践的最终目的。一般来说,统计可以根据目前所拥有的信息(数据)来建立人们所关心的变量和其他有关变量的关系。这种关系一般称为模型(Model)。假如用Y表示感兴趣的变量,用X表示其他可能与Y有关的变量(X也可能是若干变量组成的向量),则所需要的是建立一个函数关系Y=f(X)。这里Y称为因变量或响应变量(DependentVariable,ResponseVariable),而X称为自变量,也称为解释变量或协变量(IndependentVariable,ExplanatoryVariable,Covariate)。建立这种关系的过程就叫做回归(Regression)。第10章相关与回归分析XiangYE,InformationSchool,RUC10.1问题的提出例10-1有美国60个著名商学院的数据,包括的变量有GMAT分数、学费、进入MBA前后的工资等。进入MBA前后工资的散点图。可以看出,进入MBA前工资高的,毕业后工资也高。希望能够建立一个模型描述这个关系。601001401802535455565SalaryPreMBASalaryPostMBA第10章相关与回归分析XiangYE,InformationSchool,RUC10.2定量变量的线性相关分析如果两个定量变量没有关系,就谈不上建立模型或进行回归。但怎样才能发现两个定量变量有没有关系呢?最简单的直观办法就是画出它们的散点图。散点图很直观,但如何在数量上描述相关呢?这里介绍一种对相关程度的度量:Pearson相关系数(Pearson’sCorrelationCoefficient)。Pearson相关系数又称相关系数或线性相关系数。它是由两个变量的样本取值得到,是一个描述线性相关强度的量,一般用字母r表示。取值在-1和+1之间。当两个变量有很强的线性相关时,相关系数接近于+1(正相关)或-1(负相关),而当两个变量线性相关程度较弱时,相关系数就接近0。第10章相关与回归分析XiangYE,InformationSchool,RUC10.3利用SPSS实现线性相关分析对于例10-1,利用SPSS可以很容易得到进入MBA前后工资之间的线性相关系数。菜单:“Analyze”-“Correlate”-“Bivariate”结果:进入MBA前后工资的线性相关系数r=0.924,且检验的p值为0.000,说明这两个变量线性相关,因此可以考虑建立线性回归模型。第10章相关与回归分析XiangYE,InformationSchool,RUC10.4定量变量的线性回归分析回归分析是研究变量间相关关系的最重要、最常用的统计方法,它在工农业生产、金融保险、商业与科研管理、气象地质等方面都有极其广泛的应用,为解决实际中的预测、控制等问题提供了强有力的工具。最小二乘回归(LeastSquaresRegression)。古汉语“二乘”是平方的意思。最小二乘法就是寻找一条直线,使得所有点到该直线的竖直距离(即按因变量方向的距离)的平方和最小。这样的直线很容易通过计算机得到。用数据寻找一条直线的过程也叫做拟合(Fit)一条直线。第10章相关与回归分析XiangYE,InformationSchool,RUC10.5利用SPSS实现线性回归分析对于例10-1,关心的是SalaryPostMBA(y)和什么有关。利用逐步回归进行选择。通过SPSS软件得到三个自变量:SalaryPreMBA(x1)FiveYearGain(x2)YearsToPayback(x3)菜单:“Analyze”-“Regression”-“Linear”123106.8921.0550.88332.442yxxx第10章相关与回归分析XiangYE,InformationSchool,RUC10.5利用SPSS实现线性回归分析对于例10-1,关心的是SalaryPostMBA(y)和什么有关。利用求得的多元线性回归方程可知:(1)三个自变量都正向影响SalaryPostMBA(y);(2)SalaryPreMBA(x1)对SalaryPostMBA(y)的影响程度:在FiveYearGain(x2)和YearsToPayback(x3)不变的条件下,SalaryPreMBA(x1)每增加(或减少)1个单位,SalaryPostMBA平均增加(或减少)1.055个单位。(3)FiveYearGain(x2)对SalaryPostMBA(y)的影响程度:在SalaryPreMBA(x1)和YearsToPayback(x3)不变的条件下,FiveYearGain(x2)每增加(或减少)1个单位,SalaryPostMBA平均增加(或减少)0.883个单位。(4)YearsToPayback(x3)对SalaryPostMBA(y)的影响程度:在SalaryPreMBA(x1)和FiveYearGain(x2)不变的条件下,YearsToPayback(x3)每增加(或减少)1个单位,SalaryPostMBA平均增加(或减少)32.442个单位。123106.8921.0550.88332.442yxxx第10章相关与回归分析XiangYE,InformationSchool,RUC10.6利用Excel图表实现一元线性回归分析例10-2近年来国家教育部决定将各高校的后勤社会化。某从事饮食业的企业家认为这是一个很好的投资机会,他得到10组高校学生人数与周边饭店的季营业额的数据,并想根据高校的学生人数决策其投资规模。y=5x+60R2=0.9027050100150200250051015202530学生人数季营业额第10章相关与回归分析XiangYE,InformationSchool,RUC10.7利用Excel回归分析工具实现多元线性回归分析例10-3某大学教务处对学生的动手能力颇感兴趣。在研究中发现学生的学习成绩特别是统计成绩同计算机有关。他们将学生分成两组,一组是利用计算机学习统计,另一组是不用计算机学习统计。现随机从利用计算机与不用计算机的学生中抽取两个样本,包括统计成绩和过去的绩分点。在显著性水平为0.05时,能否确定使用计算机学生的统计成绩高于不使用计算机学生的统计成绩?菜单:“工具”-“数据分析”,选择“回归”1245.3610.8910.04yxx第10章相关与回归分析XiangYE,InformationSchool,RUC10.7利用Excel回归分析工具实现多元线性回归分析例10-3某大学教务处对学生的动手能力颇感兴趣。利用求得的多元线性回归方程可知:(1)绩分点(x1)对统计成绩(y)的影响方向:绩分点(x1)正向影响统计成绩(y),绩分点(x1)越高,统计成绩(y)也越高;(2)绩分点(x1)对统计成绩(y)的影响程度:在使用计算机(x2)相同的条件下,绩分点(x1)每增长(或减少)1点,统计成绩(y)平均增长(或减少)10.89分;(3)使用计算机(x2)对统计成绩(y)的影响方向:使用计算机(x2)正向影响统计成绩(y),使用计算机学习统计,统计成绩(y)就会提高;(4)使用计算机(x2)对统计成绩(y)的影响程度:在绩分点(x1)相同的条件下,使用计算机的学生要比那些不使用计算机的学生的预测分数高出10.04分,这个分数(10.04)是计算机对学生统计成绩(y)影响程度的一种度量。1245.3610.8910.04yxx
本文标题:第10章-相关与回归分析
链接地址:https://www.777doc.com/doc-4755387 .html