您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 统计学原理第八章相关分析与回归分析概要
1第八章相关分析与回归分析2一、函数关系与相关关系二、相关关系的种类三、相关分析与回归分析第一节基本概念3•一、函数关系与相关关系•客观现象总是普遍联系和相互依存的。它们之间的数量联系存在着两种不同的类型:一种是函数关系;另一种是相关关系。•(一)函数关系•是指现象之间存在严格的依存关系。即当一个或几个变量取一定的数值时,另外一个变量有确定的数值与之相对应。函数关系可以用数学表达式来反映。例如:2rπs4(二)相关关系•是指现象之间确实存在的,但关系数值不确定的相互依存关系。即当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的取值虽然不确定,但它仍然按某种规律在一定范围内变化。变量间的这种相互关系称为具有不确定性的相关关系。例如,劳动生产率与工资水平的关系、投资额与国民收入的关系等等都属于相关关系。5(三)函数关系与相关关系之间的关系•变量之间的函数关系和相关关系,在一定条件下是可以互相转化的。•本来具有函数关系的变量,当存在观测误差时,其函数关系往往以相关关系的形式表现出来。而具有相关关系的变量之间的联系,如果我们对它们有了深刻的规律性认识,并且能够把影响因变量变动的因素全部纳入方程,此时相关关系也可能转化为函数关系。6二、相关关系的种类•(一)按相关程度划分•完全相关:当一种现象的数量变化完全由另一种现象的数量变化所确定时,两者间的关系为完全相关。即函数关系。因此函数关系是相关关系的一个特例。•不相关:当两种现象彼此互不影响,其数量变化各自独立时,称为不相关。7•例如,股票价格的高低与气温的高低是不相关的。两者是不相关现象。•不完全相关:两个现象之间的关系介于完全相关和不相关之间。此类相关关系是本章研究的重点。•(二)按相关方向划分•正相关:是指两个变量呈同向变动。如工人的工资虽劳动生产率的提高而增加。•负相关:是指两个变量呈反向变动。如产量规模越大,单位产品成本越低。8(三)按相关表现形式划分•直线相关:如果现象之间的相关关系近似地表现为一条直线时,称之为直线相关。•曲线相关:如果现象之间的相关关系近似地表现为某种曲线形式时,就称这种相关关系为曲线相关。•(四)按涉及变量的多少来划分•单相关:是指两个变量之间的相关关系即一个自变量和一个因变量的关系。9•复相关:是指三个或三个以上变量间的相关关系。即一个因变量对两个或两个以上自变量之间的关系。如,某种商品的需求与其价格水平以及人们收入水平之间的相关关系便是一种复相关。•偏相关:在复相关中,当假定其他变量不变时,其中两个变量间的相关关系称为偏相关。例如,在假定人们收入水平不变的条件下,某种商品的需求与其价格水平的关系就是一种偏相关。10三、相关分析与回归分析•(一)相关分析•是用一个指标(相关系数)来表明现象之间相互依存的密切程度。•(二)回归分析•是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量之间的平均变化关系。(高度相关)11•(三)相关分析与回归分析的联系•1.它们有具有共同的研究对象。•2.相关分析要依靠回归分析来表明现象数量关系的具体形式。•3.回归分析则要依靠相关分析来表明现象数量变化的相关程度。只有变量间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。12•(四)相关分析与回归分析的区别•1.相关分析只研究变量间的相关方向和相关程度,不必确定变量中哪个是自变量,哪个是因变量,变量都是随机的。•2.回归分析是对具有相关关系的变量间的数量联系进行测定,必须事先确定变量的类型。通常因变量是随机的,自变量可以是随机的,也可以是非随机的。13第二节简单线性相关分析一、相关图与相关表二、相关系数的测定与应用三、相关系数的密切程度14第二节简单线性相关分析•一、相关图与相关表•相关图和相关表是相关分析的基本工具,根据相关图可以直接判断现象之间大致呈现何种关系形式。15NYX15499102429851353894246981097587212846988150278071394873813039102515551013161917111539205112156121111317852286141762231115196020031619022435钢材消费量与国民收入相关表国民收入钢材消费量16钢材消费量与国民收入05001000150020002500050010001500200025003000国民收入(亿元)钢材消费量(万吨)(相关图)17•二、相关系数的测定与应用•(一)相关系数的定义•单相关分析是对两个变量之间的相关程度进行分析。单相关分析所用的指标称为单相关系数,简称相关系数,用r表示。相关系数的定义式为:yx2xyσσσrx数列与y数列的协方差分别为x数列与y数列的标准差①18将上述公式展开:)y)(yx(xn1n)y)(yx(xσ2xy22x)x(xn1n)x(xσ22y)y(yn1n)y(yσ19再代入到原公式中,得:•(二)相关系数的简捷计算方法22yx2xy)y(y)x(x)y)(yx(xσσσr···②)yy2y(y)xx2x(x)yxyxyx(xyr2222202222ynyy2yxnxx2xyxnxyyxxyryny,xnx得:,nyy,nxx根据:2222ynyxnxyxnxyr·····③21•通过对基本公式的变形简化,可以不计算离差直接根据历史资料计算相关系数。222222n)y(nyn)x(nxnynxnxyr2222)y(yn)x(xnyxxynr···④重要22例1:P354页,第1题企业序号产量X(4件)单位成本(元)YXYX2Y21252104427042354162929163452208162704444819216230455482402523046646276362116∑24300118210615048即:∑X=24,∑Y=300,∑XY=1182,n=6,∑X2=106,∑Y2=15048232222)y(yn)x(xnyxxynr223001504862410663002411826r0.821616.97067.746010828860108r•r=-0.8216,包含了两方面的内容:即两个变量相关的方向和相关的程度。正负号说明了相关的方向,具体数字说明了相关的程度24三、相关系数的密切程度相关系数的变化范围在-1到+1之间。负值代表负相关,正值代表正相关。相关系数绝对值的大小代表相关关系的密切程度。(1)0<r<1:正线性相关(2)-1<r<0:负线性相关(3)r=0:线性无关(4)r=1:完全正线性相关(5)r=-1:完全负线性相关重要25•为了判断时有个标准,有学者提出了相关关系密切程度的等级,即相关系数在0.3以下为不相关,0.3以上为有相关。•具体等级的划分如下:r≥0.8:强相关(高度相关)0.5≤r<0.8:中度相关(显著相关)0.3≤r<0.5:弱相关(低度相关)r<0.3:不相关(无相关)重要26•当计算相关系数的原始资料较多时,比如50个以上,上述相关程度的等级是可以相信的;但是,如果计算相关系数所依据的历史资料较少,则相关等级的可信度将会降低。此时,判断相关等级的起点应该提高,要以0.4或0.5为起点,这样判断相关等级的结果才会于实际情况相吻合。27•一、回归分析的概念和表现形式•(一)回归分析的概念•相关分析只能说明现象之间的相关方向和相关程度,但不能说明现象之间因果的数量关系。要了解现象之间的因果数量关系必须运用回归分析的方法。•回归分析:是对具有高度相关关系的变量之间数量变化的一般关系进行测定,确定一个相关的数学模型进行预测的统计方法。第三节回归分析28(二)回归分析的表现形式•1.直线回归分析:用一条直线来近似地代表现象之间的一般数量关系。这条直线在数学上叫做回归直线。•2.曲线回归分析:用一条曲线来近似地代表现象之间的一般数量关系。这条曲线在数学上叫做回归曲线。曲线的形式有抛物线、指数曲线、双曲线等。29二、直线回归分析•(一)简单直线回归分析(2个变量)•1、简单直线回归分析的特点•随着自变量的变动,因变量按照大体相等的逐期增长量进行变动的一般数量关系。•即因变量的逐期增长量大体相等。•1)进行回归分析时必须根据研究目的确定自变量和因变量。•2)在两个变量互为因果的条件下,可以配合两条回归直线方程:30①Y倚X的直线方程:Y是因变量,X是自变量yc=a+bx②X倚Y的直线方程:X是因变量,Y是自变量xc=c+dyX和Y只能计算一个相关系数,但是却可以配合两条回归方程。当两个变量不是互为因果的关系时,则只能配合出一个条回归直线。2、回归方程的作用推算作用:给出自变量取值来推算因变量数值31•简单回归直线方程的基本形式:•Y倚X的直线方程:yc=a+bx•X倚Y的直线方程:xc=c+dy•a和c是直线的截距,b和d是两条直线的回归系数。a、b、c、d都是待定参数。确定这些参数可以用不同的方法,但是统计中最常使用的还是最小平方法。与第五章不同的用自变量(x)代替时间(t)。3、简单回归方程的确定32•1)Y倚X的直线方程的确定•根据最小平方法的原理:•将yc=a+bx代入上述公式中,分别对a和b求一阶偏导数,并令偏导数等于0,就可以得出两个正规方程:最小值)y(y2c2xbxaxyxbnayxbyax)(xnyxxynb22重要33ydxcy)(ynxyyxnd22•2)X倚Y的直线方程的确定•根据最小平方法的原理:•将xc=c+dy代入上述公式中,分别对c和d求一阶偏导数,并令偏导数等于0,就可以得出两个正规方程:最小值)x(x2c2ydycyxydncx举例:P355,第4题。34NXY19944.10.2719954.50.3119965.60.35199760.419986.40.5219996.80.5520007.50.5820018.50.620029.80.652003110.73Y00.10.20.30.40.50.60.70.8024681012X—汽车货运量(亿吨/千米)Y—汽车拥有量(万辆)35汽车货运量与汽车拥有量的散点图00.10.20.30.40.50.60.70.8024681012Y要求:(1)根据资料作散点图36年份XYXYX2Y219944.10.271.10716.810.072919954.50.311.39520.250.096119965.60.351.96031.360.122519976.00.402.400360.1619986.40.523.32840.960.270419996.80.553.74046.240.302520007.50.584.35056.250.336420018.50.605.10072.250.3620029.80.656.37096.040.4225200311.00.738.0301210.5329合计70.24.9637.78537.162.676237(2)求相关系数。2222)y(yn)x(xnyxxynr224.962.67621070.2537.16104.9670.237.7810r0.95630.95629.6082.1604443.5629.608r38•(3)配合简单线性回归方程。xbyax)(xnyxxynb220.0668443.5629.60870.2537.16104.9670.237.7810b20.0271070.20.0668104.96nxbnya将a=0.027,b=0
本文标题:统计学原理第八章相关分析与回归分析概要
链接地址:https://www.777doc.com/doc-3498993 .html