您好,欢迎访问三七文档
当前位置:首页 > 幼儿/小学教育 > 小学教育 > 怎样分析变量间的关系
工商管理统计IP资料第1页第七章怎样分析变量间的关系教学目的与要求本章主要介绍如何利用相关与回归方法来分析变量之间的关系。通过本章学习,要求掌握相关与回归分析的基本思想与和原理;掌握相关与回归分析方法的特点和应用场合;掌握相关与回归分析的计算分析方法;能够利用EXCEL进行计算并对分析结果进行解释和分析;能应用相关与回归分析方法对实际问题进行有效地分析。本章重点问题辅导一、变量间有什么样的关系?1.函数关系:是指两个变量之间存在一定关系,这种关系是固定的,当自变量取一值时,因变量只有一个唯一确定的值与之对应。如:2Rs2.相关关系:是指两个变量之间存在一定的关系,这种关系是不固定的,当自变量取一个值时,因变量有许多值与之对应。如:身高-----体重XY二、相关的种类1.完全相关、不完全相关、不相关2.正相关与负相关3.线性相关与非线性相关4.单相关与复相关三、用图形来显示变量间的关系做散点图四、测度变量间的关系强度----计算相关系数1.相关系数的概念是在线性相关的情况下,用来说明相关关系密切程度的统计分析指标。2.相关系数的计算:3.根据相关系数判断相关的程度相关系数的取值是在+1和-1之间,即11r。若10r,表示X与Y之间存在正的相关关系,若01r,表示X与Y之间存在负的相关关系;若r-+1,,表示X、Y之间为完全正相关关系,若r=-1,表示X与Y之间为完全负相关关系,当r=0时,表示Y的取值与X无关,即二者之间不存在线性相关关系,但不能说明两者之间没有任何关系。它们可能会存在非线性相关关系。2222yynxxnyxxyn工商管理统计IP资料第2页五、总体中也存在这样的关系吗?----假设检验1.为什么要对相关系数进行显著性检验?因为两个变量之间存在相关关系是根据样本计算出来得出的结论,这一结论是否正确还吸引仅仅系检验,相关系数是一个随机变量,由于是随机的,所以具有一定的偶然性,两个不相关的变量,其相关系数也可能较高,要从样本相关系数判断总体中是否也有这样的关系,则需要对相关系数进行显著性检验后才能下结论。2.显著性检验的步骤:第一步,提出假设第二步,计算检验的统计量212rnrt第三步,进行决策。六、建立变量间的数学关系式1.回归模型:xy102.回归方程:xyE10)(3.估计回归方程:xy10ˆˆˆ用最小平方法求参数10ˆˆ。用Excel计算统计量的方法。见教材138页例。nxxnyyxbyxnxyxnxyxy0221ˆ1.ˆ11ˆˆˆˆ工商管理统计IP资料第3页七、回归效果的度量SST—总平方和,反映因变量取值的总的波动状况。SSR---回归平方和,反映有自变量X的变化引起Y的变化。SSE—残差平方和,反映除了X对Y的影响之外的其它因素的影响。三者的关系:SST=SSR+SSE回归平方和占总平方和的比例称为判定系数:SSTSSRr2其实际意义是:在因变量取值的总变差中可以由自变量X取值所解释的比例。八、检验数学关系式的可信程度1.为什么要对回归方程进行显著性检验?回归方程通常是根据样本数据建立,建立回归方程有很多假定,如假定因变量与自变量之间有线性关系,对回归模型中的误差项也有许多假定。这些假定是否成立,只有在方程通过显著性检验后才能回答,所以要对回归方程进行显著性检验。2.回归方程显著性检验包括哪些内容?包括两方面的内容:一是线性关系的检验,也称为总体的显著性检验,用于检验因变量与自变量之间是否存在线性关系;二是回归系数的检验,检验自变量对因变量的影响是否显著。在一元回归分析中,两种检验是等价的。3.进行线性关系显著性检验的步骤:第一步,提出假设第二步,计算统计量F第三步,作出统计决策。当FF时,拒绝原假设。更简单的办法:见教材144页。九、用自变量来估计因变量1.点估计---是根据建立的回归方程xy10ˆˆˆ,对于自变量的一个特定值X求出因变量Y的一个估计值。2.区间估计---利用估计的回归方程,对于x的与个特定值0x,求出Y的一个估计值的区间就是区间估计。置信区间估计:它是对x的一个给定值,求出y的平均值的估计区间。预测区间估计:它是对x的一个给定值,求出y的个别值的估计区间。本章练习题:一、名词解释1.相关系数:是在线性相关的情况下,用来说明相关关系密切程度的统计分析指标。工商管理统计IP资料第4页2.总变差平方和:SST—总平方和,反映因变量取值的总的波动状况。3.回归平方和:SSR---回归平方和,反映有自变量X的变化引起Y的变化。4.残差平方和:SSE—残差平方和,反映除了X对Y的影响之外的其它因素的影响。5.判定系数:回归平方和占总平方和的比例称为判定系数:SSTSSRr2其实际意义是:在因变量取值的总变差中可以由自变量X取值所解释的比例。6.点估计:是根据建立的回归方程xy10ˆˆˆ,对于自变量的一个特定值X求出因变量Y的一个估计值。7.区间估计:利用估计的回归方程,对于x的与个特定值0x,求出Y的一个估计值的区间就是区间估计。二、判断题1.统计上描述两个变量之间关系的图示方法是散点图。(对)2.测度变量之间关系密切程度的统计量是相关系数。(对)3.若相关系数R=0,说明两个变量之间没有任何关系。(错)4.变量之间非线性相关程度较大时,就可能导致相关系数等于。(对)5.两个不相关的变量,其相关系数也可能较高。(对)6.回归平方和反映了因变量取值的总的波动情况。(错)三、填空题1.现象之间的关系可以归纳为两种不同类型,一种是(函数关系),一种是(相关关系)。2.统计上描述变量之间关系的图示方法是(散点图)。3.测定变量之间相关关系密切程度的统计量是(相关系数)。4.相关系数的取值范围是(11r)。5.总变差平方和SST、回归平方和SSR、残差平方和SSE三者的关系是(SST=SSR+SSE)6.回归平方和占总平方和的比例叫(判定系数)。7.判定系数的取值范围是(0--1),判定系数越接近于1,表示回归直线对观察数据的拟合程度越(高)。8.点估计可分为两种,一种是(平均值的点估计),另一种是(个别值的点估计)。9.区间估计有两种类型,一是(置信区间估计),二是(预测区间估计)。四、问答题1.解释相关系数的意义。相关系数的取值是在+1和-1之间,即11r。若10r,表示X与Y之间存在正的相关关系,若01r,表示X与Y之间存在负的相关关系;若r-+1,,表工商管理统计IP资料第5页示X、Y之间为完全正相关关系,若r=-1,表示X与Y之间为完全负相关关系,当r=0时,表示Y的取值与X无关,即二者之间不存在线性相关关系,但不能说明两者之间没有任何关系。它们可能会存在非线性相关关系。2.为什么要对相关系数进行显著性检验?因为两个变量之间存在相关关系是根据样本计算出来得出的结论,这一结论是否正确还吸引仅仅系检验,相关系数是一个随机变量,由于是随机的,所以具有一定的偶然性,两个不相关的变量,其相关系数也可能较高,要从样本相关系数判断总体中是否也有这样的关系,则需要对相关系数进行显著性检验后才能下结论。3.为什么要对回归方程进行显著性检验?答:回归方程通常是根据样本数据建立,建立回归方程有很多假定,如假定因变量与自变量之间有线性关系,对回归模型中的误差项也有许多假定。这些假定是否成立,只有在方程通过显著性检验后才能回答,所以要对回归方程进行显著性检验。4.回归方程的显著性检验主要包括哪些内容?答:包括两方面的内容:一是线性关系的检验,也称为总体的显著性检验,用于检验因变量与自变量之间是否存在线性关系;二是回归系数的检验,检验自变量对因变量的影响是否显著。在一元回归分析中,两种检验是等价的。五、案例分析见指导书本章案例2、案例4
本文标题:怎样分析变量间的关系
链接地址:https://www.777doc.com/doc-2476238 .html