您好,欢迎访问三七文档
1本章主要内容第一节相关的意义和种类第二节相关图表和相关系数第三节回归分析第四节估计标准误差第九章相关分析2第一节相关的意义和种类一、相关关系的概念函数关系:函数关系是一种严格的依存关系,这种关系可以用y=f(x)的方程来表现。相关关系:相关关系是一种不完全确定的随机关系。函数关系与相关关系的联系:对具有相关关系的现象进行分析时,必须利用相应的函数关系的数学表达式来表明现象之间的相关方程式。第九章相关分析3二、相关的种类1、按相关的程度划分完全相关不完全相关不相关2、按相关的方向划分正相关负相关3、按相关的形式划分线性相关非线性相关4、按影响因素的多少划分单相关复相关第九章相关分析4三、相关分析的主要内容:(一)确定现象之间有无关系,以及相关关系的表现形式(二)确定相关关系的密切程度(三)选择合适的数学模型(四)测量变量估计值的可靠程度(五)对计算出的相关系数进行显著检验第九章相关分析5第二节相关图表和相关系数一、相关图表相关图表是相关分析的重要方法。通过相关图表可以直观地判断现象之间呈现的相关的形态和方向。相关表简单相关表:根据总体单位的原始资料编制的相关表p.308分组相关表单变量分组相关表p.309双变量分组相关表p.310相关图利用直角坐标系第一象限,把自变量置于横轴上,因变量置于纵轴上,再将两变量相对应的变量值用坐标点形式描绘出来即可。P.308第九章相关分析6二、相关系数相关系数是测定变量之间相关密切程度的统计指标。1、相关系数的计算方法:相关系数按“积差法”计算。该方法是通过两变量与各自平均值的离差的乘积来反映两变量之间的相关程度。积差法公式为:yxxy2计算相关系数的简化式:2222yynxxnyxxyn第九章相关分析7如果定义:xxLxx2)(yyLyy2)(xyLyyxx))((相关系数可以表示为:yyxxxyLLL第九章相关分析82、相关系数的性质(2)相关系数的取值范围在绝对值的之间。其值大小反映两变量之间相关的密切程度。(1)相关系数有正负号,分别表示正相关和负相关。(3)相关系数1表明两变量完全相关;表明两变量完全不相关。010(4)当计算相关系数的原始数据较多(如50项以上)时,认为相关系数在0.3以下为无相关,0.3以上为有相关;0.3-0.5为低度相关;0.5-0.8为显著相关;0.8以上为高度相关。第九章相关分析9相关系数计算分析例题88036.4∑6286801101151321351601.22.03.13.85.06.17.28.012345678生产费用月产量序号xy2x2yxy1.444.009.6114.4425.0017.2151.8464.00207.54384473966400121001322517424182252560010421474.4172.0248.0418.0575.0805.2972.01280.04544.6第九章相关分析,54.207,8,880,4.362xnyx6.4544,1042142xyy根据计算结果可知:则相关系数为:2222yynxxnyxxyn97.0说明产量和生产费用之间存在高度正相关。第九章相关分析11第三节回归分析一、回归分析的意义回归分析是对具有相关关系的两个或两个以上变量之间的数量变化的一般关系进行测定,确立一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估算预测提供一个重要的方法。二、回归的种类按自变量的个数分一元回归多元回归按回归线的形态分线性回归非线性回归第九章相关分析12三、简单线性回归方程(一)简单线性方程式的一般形式:bxay(当两变量的增长比率为常数时,它们之间就呈现为一种简单线性关系。)(二)利用简单线性回归方程进行回归分析的前提:所分析的两个变量之间必须存在相关关系,且相关程度在显著相关以上。(三)对两变量进行简单线性回归分析的任务:设法在分散的、具有线性关系的相关点之间配合一条最优的直线,这条直线就是估计回归线,它表明两变量之间具体的变动关系。第九章相关分析13配合估计回归线的方程称为回归方程。bxayc方程式为:自变量归系数:直线的斜率,又称回直线的起点值,:因变量的估计值::,xbayc回归系数b的经济涵义:当自变量变动一个单位时,因变量的平均变动值。(四)配合直线回归方程的方法第九章相关分析14用最小平方法配合回归直线的基本思想是:在所有的相关点中,通过数学方法配合一条较为理想的直线,这条直线必须满足两点:2、原数列与趋势线的离差平方和为最小值。即最小值2)(cyy1、原数列与趋势线的离差之和为零。即:0)(cyy配合直线回归方程的过程就是求解方程系数a、b的过程,求解a、b的方法一般采用最小平方法。第九章相关分析15最小值22)()(bxayyybxaycc通过求a、b的一阶偏导可得到求解a、b的联立方程:xyxbxayxbna2解联立方程得到:xxxyLLxxnyxxynxxyxxybnxbnyxbya2222)(第九章相关分析164544.674.4172.0248.0418.0575.0805.2972.01280.01042143844739664001210013225174241822525600207.541.444.009.6114.4425.0037.2151.8464.0088036.4∑6286801101151321351601.22.03.13.85.06.17.28.012345678生产费用月产量序号2xxy2yxy根据前面例题资料配合生产费用依产量变化的回归方程:第九章相关分析17,54.207,8,880,4.362xnyx6.4544,1042142xyy22)(xxnyxxynb9.124.3654.20788804.366.454482nxbnya3.5184.369.128880则回归方程为:xyc9.123.51回归系数b的涵义:月产量每增加1000吨,生产费用平均增加12.9万元。计算得到:第九章相关分析186708290100114140144耐用消费品销售额(万元)2820340380450470560620人均年收入(元)合计199019911992199319941995时间要求:分析两变量相关密切程度,若为显著相关以上,则对两变量进行回归分析。有某地区人均年收入与耐用消费品销售额资料如下:第九章相关分析19答案:相关系数r=0.98b=0.24a=-1.13yc=-1.13+0.24x回归系数b的涵义:人均年收入每增加一元,耐用消费品销售额平均增加0.24万元。第九章相关分析20四回归系数与相关系数的关系因为:2222yynxxnyxxyn22)(xxnyxxynbyxxy222xxybyyxxyxLLbb所以:xxyyxyLLrrb即:第九章相关分析21五回归分析与相关分析的特点1、回归分析必须区分自变量和因变量,而相关分析不必区分。2、回归分析的两个变量一个是自变量,一个是因变量,通过给定自变量的值来推算因变量的可能值;而相关分析的两个变量都是随机变量。3、回归分析中对于因果关系不甚明确的两个变量,可以建立两个回归方程;而相关分析只能计算出一个相关系数。4、一种回归方程只能做一种推算,即只能给出自变量的值来推算因变量的值,不能逆推。第九章相关分析22第四节估计标准误差一、估计标准误的涵义:根据直线回归方程,在知道了自变量的数值情况下可以推算出因变量的数值,但是,推算出来的因变量的数值不是精确的值,它与实际值之间有差异。估计标准误差就是用来说明回归方程推算结果的准确程度的统计分析指标,或者说是反映回归直线代表性大小的统计分析指标。第九章相关分析23二、估计标准误的计算公式:简化公式:2)(2nyyScyx22nxybyaySyx(一)根据因变量实际值和估计值的离差计算p.325(二)根据a、b两个参数值计算。称为简化公式p.326第九章相关分析24三、相关系数与估计标准误差的关系根据方差分析的一般原理:因变量y的实际观察值yi总是围绕其平均数而上下波动,所以y的变动可以由来反映,称之为总变差。引起总变差的原因可以有两方面:y2)(yy一个是由于自变量x的取值不同,使得与x有直线相关关系的y值不同。在建立回归方程:yc=a+bx,yc为y的估计值,x通过方程对y产生影响,其影响程度可由来表示,称其为剩余变差。2)(cyy另一个是随机因素的影响,即除自变量x对y的影响外,其他随机因素所引起的y的变动,这种变动可以由表示,称之为回归变差。三者关系是:2)(yyc第九章相关分析252)(cyy2)(yy2)(yyc+=由此可以推导出:222)()()(yyyyyycc2)(xbabxaLyy第九章相关分析xxyyLbL2xxxxxyyyLLLL222)(xxbLyy26因为:yyxxxyLLL所以:)1()(2222yyyyyyxxxxxyyycLLLLLLLyy第九章相关分析272)1(2)(22nLnyySyycyx从这个式子可以看出,如果两个变量之间的直线相关关系十分密切,相关系数的绝对值就接近于1,这时估计标准误差的数值越接近于0,说明回归方程的代表性越高。所以相关系数与估计标准误差的关系为:第九章相关分析28或者:222)()(1)2(1yyyynLScyyyx从这个式子可以看出,如果Syx越小,其在总变差中所占的比重也就越小,从而相关系数r的值就会越大,即一个代表性很好的方程,其变量之间的相关关系也一定很高。第九章相关分析292、不管自变量如何变化,因变量都不变,这种情况称为零相关。〈〉1、若两变量完全相关,则这两变量之间的关系是函数关系。〈〉3、总变差一定大于回归变差。〈〉4、在相关分析中,要求相关的两个变量都是随机变量。〈〉5、相关系数的值越大,说明相关的程度越高。〈〉6、求解一元线性回归方程中参数的常用方法是最小平方法。〈〉一、判断对错TTTTTT第九章相关分析30二、单项选择题1、现象之间相互关系的类型有:A函数关系与因果关系B相关关系与函数关系C相关关系与因果关系D回归关系与因果关系2、相关系数等于1,说明两个变量之间:A完全负相关B相关程度很高C完全正相关D相关程度很低3、估计标准误差是反映:A平均数代表性指标B序时平均数代表性指标C现象之间相关关系的指标D回归直线代表性指标4、相关分析是研究:A变量之间的数量关系B变量之间的变动关系C变量之间相互关系的密切程度D变量之间的因果关系BCDC第九章相关分析31三、多项选择题1、在相关关系中各现象之间:A一定存在着严格的依存关系B存在着一定的依存关系,但不是确定的关系C存在着不明显的因果关系D存在一一对应的函数关系E存在着明显的因果关系2、变量x值按一定数量增加时,变量y也近似地按一定数量随之增加,反之亦然。则x和y之间存在:A正相关关系B负相关关系C直线相关关系D曲线相关关系E零相关3、如果两个变量之间的相关系数为1,则这两个变量是:A正相关关系B负相关关系C完全相关关系D不完全相关关系E零相关4、相关系数值的大小是说明:A两个变量的相关关系程度的高低B和估计标准误差值成正比C和估计标准误差值成反比D和估计标准误差值无关系E和估计标准误差值的关系不确定BCACACAB第九章相关分析321、在回归分析中,要求自变量是_______,因变量是_______。2、相
本文标题:统计学第九相关分析
链接地址:https://www.777doc.com/doc-4400312 .html