您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 统计学原理第八章-相关与回归分析
2020/6/252020/6/252第八章相关与回归分析相关关系的概念及特点(一)函数关系函数关系是指现象之间存在着严格的数量依存关系。(二)相关关系相关关系是指现象间存在着不完全确定的数量依存关系。1.相关关系的特点(1)相关关系表现为数量上的相互依存关系。(2)相关关系在数量上表现为非确定性的相互依存关系2020/6/2532020/6/254现象之间的关系一般可以区分为两种不同的类型:函数关系:当一个或几个变量取一定值时,另一个变量有确定值与之相对应,这种关系称为确定性的函数关系。[在函数关系中,一般把作为影响因素的变量称为自变量(x);把发生对应变化(结果)的变量称为因变量(y)。]相关关系:当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系。2020/6/255函数关系与相关关系是两种不同类型的关系,但两者之间并不存在严格的界限。由于在观察或实验中出现的误差,函数关系也就通过相关关系反映出来;而当对现象之间的内在联系和规律性了解得更加清楚的时候,相关关系就可能转化为函数关系。在相关关系中,通常存在一定的因果关系。但也应该知道,在相关关系中,有时两个变量之间只存在相互联系而并不存在明显的因果关系。相关关系的种类•(一)按照相关的变量(因素)的多少,可分为单相关、复相关•1.单相关•单相关,也称一元相关,是指两个变量之间的相关关系。如广告费用与产品销售量之间的相关关系。•2.复相关•复相关,也称多元相关,是指三个或三个以上变量之间的相关关系,如商品销售额与居民收入、商品价格之间的相关关系。2020/6/25相关关系的种类(二)按照相关的形式,可分为线性相关和非线性相关1.线性相关线性相关,也称直线相关,是指当一个变量变动时,另一变量随之发生大致均等的变动。从图形上看,其观察点的分布近似地表现为一条直线,例如,人均消费水平与人均收入水平通常呈线性相关。2.非线性相关非线性相关,也称为曲线相关。即一个变量变动时,另一变量也随之发生变动,但这种变动不是均等的,从图形上看,其观察点的分布近似地表现为一条曲线,如抛物线、指数曲线等。2020/6/25相关关系的种类(三)按照相关关系变化的方向不同,可分为正相关和负相关1.正相关正相关是当一个变量值增加或减少时,另一个变量的值也会随之而增加或减少。如家庭人均收入的提高,会使家庭支出也随之提高;如果家庭收入降低,家庭支出通常也会相应降低。2.负相关即当一个变量的值增加或减少时,另一变量的值随之减少或增加。如随着产量的增加,单位成本会随之下降;而随着产量的下降,单位成本也会相应提高。2020/6/25相关关系的种类(四)按相关程度,可分为完全相关、不完全相关和完全不相关1.完全相关即当一个变量的数量完全由另一个变量的数量变化所确定时,两者之间即为完全相关。例如,在价格不变的条件下,销售额与销售量之间的关系即为函数关系。2.不相关即当变量之间彼此互不影响,其数量变化各自独立,则变量之间为不相关。例如,学生的学习成绩与企业的单位成本之间的关系。3.不完全相关即两个现象介于完全相关和不相关之间,大多数相关关系属于不完全相关。2020/6/25相关分析的主要内容(一)确定现象之间有无相关关系(二)确定相关关系的表现形式(三)判定相关关系的密切程度和方向其主要方法是绘制相关图表和计算相关系数。2020/6/252020/6/2511四、相关表和相关图1.相关表是能够反映两个或两个以上变量之间的相互关系的统计表式。P1762.当观察的单位数目较少时,通过整理以后就可以用普通的表式将资料一一对照起来,3.而当观察的单位数目较多且标志的变异又较为复杂时,则需要将资料进行分组,编制特殊的相关表。4.由于相关分析是研究两个或两个以上标志的关系,因此,需要细心地确定组距和组数以使二者的关系能在表式中明显地反映出来。相关表是一种反映变量之间相关关系的统计表。它包括简单相关表、单变量分组表和双变量分组表。(一)简单相关表简单相关表是将相关的两个变量的变量值一一对应地填列在同一张表格上,这样的表格叫简单相关表。(二)单变量分组相关表单变量分组相关表是对自变量进行分组,因变量不分组,只是计算出次数和平均数这种表格称为单变量分组相关表。(三)双变量分组相关表双变量分组相关表是将自变量和因变量都进行分组编制成的统计表称双变量分组相关表。2020/6/25•相关图(ScattorDiagram)又叫散布图,指把两个变量之间的相关关系,用直角坐标系表示的图表。•对于既相关又不完全确定的关系,就称为相关关系。•人们应用画相关图,求出相关系数的方法来确定两个量之间的相关关系,就称为相关分析。•而当确定了相关关系之后,再用统计检验与估计的方法对相关系数进行判断并求出回归方程的作法,称为回归分析。2020/6/252020/6/25140102030405060708090020406080100120可支配收入消费支出(二)、消费与收入的相关图居民消费和收入的相关表单位:百元消费支出15203040425360657078可支配收入18254560627588929998相关图的形式2020/6/25(6)无相关(5)曲线相关(4)负弱相关(3)负强相关(2)正弱相关1)正相关相关系数P179•相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母r表示。•由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。•相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。•相关系数是用以反映变量之间相关关系密切程度的统计指标。•相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。2020/6/25(二)相关系数的种类1.简单相关系数简单相关系数,是描述呈线性相关的两个变量之间密切程度及相关方向的指标。2.复相关系数复相关系数,是测量一个因变量y与其他多个自变量x1、x2、x3……xp之间线性相关程度的指标。3.曲线相关系数曲线相关系数,也称相关指数,是衡量非线性关系密切程度的指标。4.偏相关系数在多元相关分析中,在消除其他变量影响的条件下,所计算的某两变量之间的相关系数。2020/6/252020/6/2518§2相关分析相关系数:用于判断线性相关关系。用积差法进行计算。相关指数:用于判断所有相关关系,包括线性和非线性的相关关系。但要用回归系数b判别其相关方向。19一、相关系数(二)相关系数的计算1.相关系数的计算公式(1)积差法(2)简捷法22yx2xy)yy()xx()yy)(xx(r2222)y(yn)x(xnyxxynr20第二节相关关系的测定一、相关系数(二)相关系数的计算2.简单相关系数的取值范围第一,当r0时,表示两个变量呈正相关,当r0时,表示两变量负相关。第二,当r=1或r=-1时,表明两变量之间为完全的相关,即为函数关系。第三,当r=0时,表明两变量之间没有相关关系。如果r=0,则表明两个现象之间完全没有直线相关关系。(但并不表明两个现象之间没有非线性相关)第四,当时0<∣r∣<∣1∣,表明两变量存在一定程度的直线相关关系。且越接近于1,两变量间相关关系越密切;越接近于0,表明两变量之间相关关系越弱。第五,相关的密切程度一般可以划分为三个级别:无相关;低度相关;中度相关;高度相关。相关系数的绝对值r在0.3以下是无直线相关,在0.3—0.5是低度直线相关,在0.5—0.8是显著相关,0.8以上是高度相关。21第二节相关关系的测定一、相关系数(三)应用相关系数时要注意的问题首先,相关系数只适合于测定两个变量的线性相关的密切程度,如果计算结果数值很小,并非就说明二者之间没有相关关系或相关程度很低,也许现象之间还存在着其它形式的相关关系。其次,相关系数有一个明显的缺点,即它的数值与实际观测的数据组数有关,当n较小时,相关系数的波动较大,当n较大时,相关系数的绝对值容易偏小;特别是当n=2时,相关系数的绝对值总为1。因此在样本容量n较小时,我们仅凭相关系数较大就判定变量之间的关系密切程度也是不妥当的。2020/6/2522§3一元线性回归分析在相关分析中,已知两个变量之间有直线相关关系。就需要确定一个数学表达式反映因变量与自变量之间的关系。有了这种数学表达式就便于进行解析,当有了自变量的一定数值,就可以估计因变量的数值平均来说将会有怎样的变动。这样的数学表达式称为回归方程式。由于变量之间关系的复杂性,回归方程式也有多种类型和形式。一元线性回归方程式是指一个自变量且相关形式为直线。23第三节回归分析的基本问题一、回归分析的含义回归分析就是对具有相关关系的两个或两个以上变量之间的数量变化关系进行测定,建立因变量和自变量之间数量变动关系的数学表达式(回归方程),以便利用自变量的数值去估计或预测因变量数值的统计分析方法。回归分析的基本思想是:根据现象间相关关系的形态,配合一条最合适的直线或曲线,用这条直线或曲线,反映它们之间数量变化的一般关系,即当自变量给定一个数值时,因变量一般为多少。24第三节回归分析的基本问题二、回归分析与相关分析的关系(一)回归分析与相关分析的区别1.在相关分析中涉及的变量不存在自变量和因变量的划分问题,变量之间的关系是对等的;而在回归分析中,变量之间的关系是不对等的。2.在相关分析中所有的变量都必须是随机变量;而在回归分析中,自变量是给定的,因变量才是随机的。3.相关分析主要是通过一个指标即相关系数来反映变量之间相关密切程度的大小,由于变量之间是对等的,因此相关系数是惟一确定的;而在回归分析中,对于互为因果关系的两个变量,则有可能存在两个回归方程。当x为自变量、y为因变量时,称y倚x的回归方程,当y为自变量、x为因变量时,称x倚y的回归方程。25第三节回归分析的基本问题二、回归分析与相关分析的关系(二)回归分析与相关分析的联系相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。26第三节回归分析的基本问题三、回归分析的主要内容(一)根据研究的目的和现象之间的内在联系,确定自变量和因变量(二)确定回归分析模型的类型及数学表达式(三)对回归分析模型进行评价和诊断(四)根据给定的自变量数值推断因变量的数值27第三节回归分析的基本问题四、回归分析的种类(一)按相关关系的变量多少来分,可分为一元回归分析和多元回归分析1.一元回归分析一元回归分析是指只有一个自变量和一个因变量的回归分析。例如,对学习时间与学习成绩两个变量进行回归分析,这两个变量中,学习时间为自变量,也是解释变量,是现象变化的原因;学习成绩为因变量,是被解释变量,是自变量发生变化所带来的结果。这是两个变量之间的回归分析,只有学习时间一个自变量。2.多元回归分析多元回归模型是指对多个自变量和一个因变量的回归分析。例如,分析研究农作物亩产量与施肥量、浇水量、温度等因素的关系。28第三节回归分析的基本问题四、回归分析的种类(二)按相关的形式不同,可分为线性回归分析和非线性回归分析1.线性回归分析当相关变量之间的表现形式为线性相关时,为其拟合的直线回归方程所进行回归分析称为线性回归分析。2.非线性回归分析当变量之间的表现形态为曲线相关时,为其拟合的曲线方程所进行回归分析称为非线性回归分析。29第四节一元线性回归方程一、一元线性回归方程的建立一元线性回归方程又称简单线性回归方程,它是根据成对的两个变量的样本数据,配合直线方程,并根据自变量的变动,来推算因变量发展趋势和水平的一种数学关系式。ˆybxa2020/6/2530对研究线性关系来说,回归方程式应当满足这样的要求:根据方程所确定的估计值应能代表所有观察值y的全体,而按照求出的估计直线与各观察点之间应达到最大限度的
本文标题:统计学原理第八章-相关与回归分析
链接地址:https://www.777doc.com/doc-6129431 .html