您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 新相关与回归幻灯片(7章)
制作:数统学院.黄应绘一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,银行行长除了对经济环境作了广泛的调研外,还希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。行长想知道,不良贷款是否与贷款余额、应收贷款、贷款项目的多少、固定资产投资等因素有关?如果有关系,它们之间是一种什么样的关系?关系强度如何?数据案例2不良贷款制作:数统学院.黄应绘第七章相关与回归分析本章重点1、判断相关关系的方法2、相关系数的计算及其判断标准3、一元线性回归方程的求解制作:数统学院.黄应绘§1相关的意义和种类一、变量之间的关系1.是一一对应的确定关系2.记为y=f(x),其中x称为自变量,y称为因变量3.各观测点落在一条线上xy函数关系制作:数统学院.黄应绘二、相关的种类•变量间关系不能用函数关系精确表达•一个变量的取值不能由另一个变量唯一确定•当变量x取某个值时,变量y的取值可能有几个•各观测点分布在直线周围xy相关关系制作:数统学院.黄应绘1、按相关的程度划分完全相关不完全相关不相关2、按相关的方向划分正相关负相关3、按相关的形式划分线性相关非线性相关4、按影响因素的多少划分单相关复相关体重90807060504030身高180170160150线性正相关制作:统计学院.黄应绘支出700600500400300200成绩100806040200线性负相关非线性相关制作:统计学院.黄应绘制作:数统学院.黄应绘§2简单线性相关分析一、相关表主要有定性判断、相关表、相关图、相关系数。(一)简单相关表(二)分组相关表1、单变量分组相关表2、双变量分组相关表制作:数统学院.黄应绘二、相关图可通过Excel绘制相关图(散点图)。三、相关系数(直线积差相关系数)相关系数可以测定变量之间相关的密切程度。(一)原始公式及判断标准1、原始公式yxNyyxxr它是著名英国统计学家卡尔.皮尔逊设计的。•为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上,如图。用水平轴X上的数代表父亲身高,垂直轴Y上的数代表儿子的身高,1078个点所形成的图形是一个散点图。它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。制作:统计学院.黄应绘制作:数统学院.黄应绘以上公式中,除去、,剩下的叫做x与y的协方差,用COV或表示。xy2xy所以,yxxy2制作:数统学院.黄应绘2、判断标准(1)相关系数的取值范围在-1至1之间。其绝对值大小反映两变量之间相关的密切程度,(2)相关系数有正负号,分别表示正相关和负相关。(3)相关系数1表明两变量完全直线相关;表明两变量不存在直线相关;03、习题:试证明完全正直线相关时,r等于1;完全负直线相关时,r等于-1。制作:数统学院.黄应绘yyxxnnyxxyn2222(二)常用计算公式制作:数统学院.黄应绘例7-2-1:案例1电视广告的时间长度2222yynxxnyxxyn0.54说明广告时间和记忆内容之间存在显著正相关。制作:数统学院.黄应绘四、相关系数的检验一般计算出相关系数后,还需要对其进行检验,通过检验的r才能实际应用,常用t检验。)2(~122ntrnrt当t大于t(n-2)时,通过检验制作:数统学院.黄应绘案例1:以5%的显著水平检验26020.5410.54t=4.89查t分布表得t(n-2)=2.04所以,广告时间长度与记忆内容之间存在着显著的正线性相关关系制作:数统学院.黄应绘§3回归分析一、回归分析的起源制作:数统学院.黄应绘1903年,统计学家K.皮尔逊和A.李随机抽取了1078对父子的样本,得链接高尔顿简介儿子的身高=37.73+0.516父亲的身高(英寸)儿子的身高=95.83+0.516父亲的身高(厘米)制作:数统学院.黄应绘二、回归分析的概念回归分析是对具有相关关系的两个或两个以上变量之间的数量变化的一般关系进行测定,确立一个相应的数学表达式,以便从已知量来推测未知量。三、回归的种类按自变量的个数分一元回归多元回归按回归线的形态分线性回归非线性回归制作:数统学院.黄应绘四、简单线性回归方程的求解yabx1、方程式为:,::abxy:因变量的估计值直线的起点值,:直线的斜率,又称回归系数自变量(一)方程式制作:数统学院.黄应绘3、条件:所分析的两个变量之间必须存在相关关系,且相关程度在显著相关以上。2、回归系数b的经济涵义:当自变量变动一个单位时,因变量的平均变动值。(二)估计a、b的几种方法根据求出的拟合值与实际值总有误差,如果求出的a和b能使误差为最小,就是最好的。yabx制作:数统学院.黄应绘1、使=miny(y)2、使=minyy3、使=minMaxyy4、使=min2yy常用第4种方法,称为最小二乘法(最小平方法)。使误差达到最小的准则,可从以下四方面考虑。制作:数统学院.黄应绘1、用最小平方法配合回归直线的基本思想是:在所有的相关点中,通过数学方法配合一条较为理想的直线,这条直线必须满足两点:⑵原数列与趋势线的离差平方和为最小值。即2()yy最小值⑴原数列与趋势线的离差之和为零。即:()0yy(三)a、b的最小二乘估计制作:数统学院.黄应绘22()()yabxyyyabx最小值通过求a、b的一阶偏导可得到联立方程:xyxbxayxbna22、具体求解制作:数统学院.黄应绘解联立方程得到:22()nxyxybnxxaybx制作:数统学院.黄应绘22)(xxnyxxynb2603452422808280.26760980802280解:nxbnya82822800.26753.65460603.6540.267yx则回归方程为:例7-3-1:案例1电视广告的时间长度制作:数统学院.黄应绘6708290100114140144耐用消费品销售额(万元)2820340380450470560620人均年收入(元)合计199019911992199319941995时间要求:分析两变量相关密切程度,若为显著相关以上,则对两变量进行回归分析。例7-3-2:制作:数统学院.黄应绘答案:r=0.98b=0.24a=-1.13=-1.13+0.24x回归系数b的涵义:人均年收入每增加一元,耐用消费品销售额平均增加0.24万元。y制作:数统学院.黄应绘四、回归系数与相关系数的关系xyrb五、回归分析与相关分析的区别回归系数及模型也需要进行检验制作:数统学院.黄应绘1、自变量的确定上的区别3、同一资料,结果多少的区别2、对变量要求的区别:回归分析中,自变量是给定的,因变量是随机变量;相关分析中两个都是随机变量。制作:数统学院.黄应绘六、估计标准误差2.估计标准误差的测定2()(1)2yyySn2(2)2yyaybxySn1.它是用来说明回归直线代表性大小的指标,用表示yS制作:数统学院.黄应绘例7-3-3:用两种方法计算例7-3-1中的估计标准误差解:法一,根据公式2()2yyySn则有=2011.106165.89602yS链接数据制作:数统学院.黄应绘法二,根据公式有22yyaybxySn142563.6548280.26734524602yS5.89制作:数统学院.黄应绘3.利用回归模型进行区间估计下限:上限:yytSyytS制作:数统学院.黄应绘4.相关系数与估计标准误差的关系ySry21(1)相关系数与估计标准误差呈反向关系(2)当变量之间为完全直线相关时,估计标准误差为0(3)当变量之间不存在直线相关时,估计标准误差等于y的标准差,即回归直线和y数列的平均线重合。制作:数统学院.黄应绘案例:不良贷款1、散点图2、相关系数及检验3、回归分析4、预测制作:数统学院.黄应绘一、判断对错1、施肥量与收获率是正相关关系。()2、利用一个回归方程,两个变量可以互相推算。3、若直线回归方程为=170–2.5X,则变量X与Y之间存在负相关关系。()4、回归系数和相关系数都可用来判断现象之间相关的密切程度。()5、当两个变量之间存在曲线相关时,回归估计标准误差为1。()6、完全相关的关系就是函数关系。()y制作:数统学院.黄应绘二、选择题1、相关系数的取值范围是()A、-∞<r<+∞B、-1≤r≤0C、0≤r≤1D、-1≤r≤12、相关系数与回归系数的符号()A、相同B、相反C、视a的符号而定D、不能确定3、如果相关系数为0,则二变量()A、无直线相关B、负线性相关C、可能存在曲线相关D、无线性相关,也无非线性相关制作:数统学院.黄应绘4、变量X对变量Y的相关关系,同变量Y对X的相关关系是()A、同一个问题B、不同的问题C、有一定联系,但不完全相同5、相关系数的大小()A、说明两个变量相关密切程度高低B、和估计标准误差成反向变化关系C、和估计标准误差成正向变化关系D、和估计标准误差没有关系制作:数统学院.黄应绘三、计算题部分1、根据某地区历年人均收入(元)与商品销售额(万元)资料计算的有关数据如下:(x代表人均收,y代表销售额)要求:①建立以商品销售额为因变量的直线回归方程,并解释回归系数的含义;②若2004年人均收入为6000元,试推算该年商品销售额。n=9,制作:数统学院.黄应绘2、随机抽取某地12个居民家庭,得到他们的人均收入与人均食品支出的资料如下:要求:①计算相关系数,判断相关情况;②建立回归方程,假定家庭人均月收入为1000元时,人均月食品支出是多少?;③计算回归估计标准误差。编号123456789101112家庭人均月收入(元)382393405430444450460480500570600700人均月食品支出(元)758592105120120130145156200200220
本文标题:新相关与回归幻灯片(7章)
链接地址:https://www.777doc.com/doc-3854394 .html