您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 第十二章相关与回归分析
1第十二章相关与回归分析第一节变量之间的相关关系相关程度与方向·因果关系与对称关系第二节定类变量的相关双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数第三节定序变量的相关分析同序对、异序对和同分对·Gamma系数·肯德尔等级相关系数(τa系数、τb与τc系数)·萨默斯系数(d系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数第四节定距变量的相关分析相关表和相关图·积差系数的导出和计算·积差系数的性质第五节回归分析线性回归·积差系数的PRE性质·相关指数R第六节曲线相关与回归可线性化的非线性函数·实例分析(二次曲线指数曲线)一、填空1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是(随机性)变量。2.变量间的相关程度,可以用不知Y与X有关系时预测Y的全部误差E1,减去知道Y与X有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是(削减误差比例)。3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y围绕每个估计值cY是服从();(2)分布中围绕每个可能的cY值的()是相同的。4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为(变化根据)的变量,因变量是随(自变量)的变化而发生相应变化的变量。5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为(回归方程),并据以进行估计和预测。这种分析方法,通常又称为(回归分析)。6.积差系数r是(协方差)与X和Y的标准差的乘积之比。二、单项选择1.当x按一定数额增加时,y也近似地按一定数额随之增加,那么可以说x与y之间存在(A)关系。A直线正相关B直线负相关C曲线正相关D曲线负相关22.评价直线相关关系的密切程度,当r在0.5~0.8之间时,表示(C)。A无相关B低度相关C中等相关D高度相关3.相关分析和回归分析相辅相成,又各有特点,下面正确的描述有(D)。A在相关分析中,相关的两变量都不是随机的;B在回归分析中,自变量是随机的,因变量不是随机的;C在回归分析中,因变量和自变量都是随机的;D在相关分析中,相关的两变量都是随机的。4.关于相关系数,下面不正确的描述是(B)。A当0r1时,表示两变量不完全相关;B当r=0时,表示两变量间无相关;C两变量之间的相关关系是单相关;D如果自变量增长引起因变量的相应增长,就形成正相关关系。5.欲以图形显示两变量X和Y的关系,最好创建(D)。A直方图B圆形图C柱形图D散点图6.两变量X和Y的相关系数为0.8,则其回归直线的判定系数为(C)。A0.50B0.80C0.64D0.907.在完成了构造与评价一个回归模型后,我们可以(D)。A估计未来所需样本的容量B计算相关系数和判定系数C以给定的因变量的值估计自变量的值D以给定的自变量的值估计因变量的值8.两变量的线性相关系数为0,表明两变量之间(D)。A完全相关B无关系C不完全相关D不存在线性相关9.身高和体重之间的关系是(C)。A函数关系B无关系C共变关系D严格的依存关系10.在相关分析中,对两个变量的要求是(A)。A都是随机变量B都不是随机变量C其中一个是随机变量,一个是常数D都是常数11.在回归分析中,两个变量(D)。A都是随机变量B都不是随机变量C自变量是随机变量D因变量是随机变量12.一元线性回归模型和多元线性回归模型的区别在于只有一个(B)。A因变量B自变量C相关系数D判定系数13.以下指标恒为正的是(D)。A相关系数rB截距aC斜率bD复相关系数14.下列关系中,属于正相关关系得是(A)。A身高与体重B产品与单位成本C正常商品的价格和需求量D商品的零售额和流通费率三、多项选择1.关于积差系数,下面正确的说法是(ABCD)。A积差系数是线性相关系数3B积差系数具有PRE性质C在积差系数的计算公式中,变量X和Y是对等关系D在积差系数的计算公式中,变量X和Y都是随机的2.关于皮尔逊相关系数,下面正确的说法是()。A皮尔逊相关系数是线性相关系数B积差系数能够解释两变量间的因果关系Cr公式中的两个变量都是随机的Dr的取值在1和0之间E皮尔逊相关系数具有PRE性质,但这要通过r2加以反映3.简单线性回归分析的特点是(ABE)。A两个变量之间不是对等关系B回归系数有正负号C两个变量都是随机的D利用一个回归方程,两个变量可以互相推算E有可能求出两个回归方程4.反映某一线性回归方程y=a+bx好坏的指标有(ABD)。A相关系数B判定系数Cb的大小D估计标准误Ea的大小5.模拟回归方程进行分析适用于(ACDE)。A变量之间存在一定程度的相关系数B不存在任何关系的几个变量之间C变量之间存在线性相关D变量之间存在曲线相关E时间序列变量和时间之间6.判定系数r2=80%和含义如下(ABC)。A自变量和因变量之间的相关关系的密切程度B因变量y的总变化中有80%可以由回归直线来解释和说明C总偏差中有80%可以由回归偏差来解释D相关系数一定为0.64E判定系数和相关系数无关7.回归分析和相关分析的关系是(ABE)。A回归分析可用于估计和预测B相关分析是研究变量之间的相互依存关系的密切程度C回归分析中自变量和因变量可以互相推导并进行预测D相关分析需区分自变量和因变量E相关分析是回归分析的基础8.以下指标恒为正的是(BC)。A相关系数B判定系数C复相关系数D偏相关系数E回归方程的斜率9.一元线性回归分析中的回归系数b可以表示为(BC)A两个变量之间相关关系的密切程度B两个变量之间相关关系的方向C当自变量增减一个单位时,因变量平均增减的量D当因变量增减一个单位时,自变量平均增减的量4E回归模型的拟合优度10.关于回归系数b,下面正确的说法是()。Ab也可以反映X和Y之间的关系强度。;B回归系数不解释两变量间的因果关系;Cb公式中的两个变量都是随机的;Db的取值在1和-1之间;Eb也有正负之分。四、名词解释1.消减误差比例变量间的相关程度,可以用不知Y与X有关系时预测Y的误差0E,减去知道Y与X有关系时预测Y的误差1E,再将其化为比例来度量。将削减误差比例记为PRE。2.确定性关系当一个变量值确定后,另一个变量值夜完全确定了。确定性关系往往表现成函数形式。3.非确定性关系在非确定性关系中,给定了一个变量值,另一个变量值还可以在一定范围内变化。4.因果关系变量之间的关系满足三个条件,才能断定是因果关系。1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。5.单相关和复相关单相关只涉及到两个变量,所以又称为二元相关。三个或三个以上的变量之间的相关关系则称为复相关,又称多元相关。6.正相关与负相关正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。7.散点图散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察X与Y的相互关系,即得相关图,又称散点图。8.皮尔逊相关系数r皮尔逊相关系数是协方差与两个随机变量X、Y的标准差乘积的比率。9.同序对在观察X序列时,如果看到ijXX,在Y中看到的是ijYY,则称这一配对是同序对。10.异序对在观察X序列时,如果看到ijXX,在Y中看到的是ijYY,则称这一配对是异序对。11.同分对如果在X序列中,我们观察到ijX=X(此时Y序列中无ijY=Y),则这个配对仅是X方向而非Y方向的同分对;如果在Y序列中,我们观察到ijY=Y(此时X序列中无ijX=X),则这个配对仅是Y方向而非X方向的同分对;我们观察到ijX=X,也观察到ijY=Y,则称这个配对为X与Y同分对。5五、判断题1.由于削减误差比例的概念不涉及变量的测量层次,因此它的优点很明显,用它来定义相关程度可适用于变量的各测量层次。(√)2.不管相关关系表现形式如何,当r=1时,变量X和变量Y都是完全相关。(√)3.不管相关关系表现形式如何,当r=0时,变量X和变量Y都是完全不相关。(×)4.通过列联表研究定类变量之间的关联性,这实际上是通过相对频数条件分布的比较进行的。而如果两变量间是相关的话,必然存在着Y的相对频数条件分布相同,且和它的相对频数边际分布相同。(×)5.如果众数频数集中在条件频数分布列联表的同一行中,系数便会等于0,从而无法显示两变量之间的相关性。(√)6.从分析层次上讲,相关分析更深刻一些。因为相关分析具有推理的性质,而回归分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。(×)六、计算题1.对某市市民按老中青进行喜欢民族音乐情况的调查,样本容量为200人,调查结果示于下表,试把该频数列联表:①转化为相对频数的联合分布列联表②转化为相对频数的条件分布列联表;③指出对于民族音乐的态度与被调查者的年岁有无关系,并说明理由。对于民族音乐的态度(Y)年岁(X)Σ老中青喜欢不喜欢383830153346Σ2.已知十名学生身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。身高(cm)171167177154169体重(kg)5356644955身高(cm)175163152172162体重(kg)6652475850【皮尔逊相关系数:0.889,斯皮尔曼相关系数:0.94,回归方程:Y=-54.48+0.66X】3.假定有不同文化程度的35~45岁育龄妇女100人的生育情况如下表,求文化程度与平均生育数的相关系数r。6序号一二三四五育龄妇女人数2020202020文化程度(年)平均生育数04.7463.3193.08122.41161.944.某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。环境名次397512810211416体质名次596712811110324【斯皮尔曼相关系数:0.94,肯德尔等级相关系数:0.83】5.以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之Gamma系数和肯德尔相关系数τc。文化程度婚姻美满大学中学小学美满9165一般83018不美满347【τc=0.18】6.以下为两位评判员对10名参赛人名次的打分。试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。参赛人ABCDEFGHIJ评判员1评判员21122433455866778991010【斯皮尔曼相关系数:0.95】7.某原始资料为:X65739188765396678285Y571313.574.5156.71011要求:(1)求回归方程;(2)这是正相关还是负相关;(3)求估计标准误差;(4)用积差法求相关系数。【Y=-11.48+0.27X】【正相关】【相关系数r=0.95】8.两变量X、Y之间的关系如下表,X24681012Y14109754(1)求回归方程;(2)求相关系数。【Y=-0.957X+14.867】【r=0.98】79.试就下表所示资料,计算关于身高和体重的皮尔逊相关系数。N0身高(厘米)体重(千克)1234567891016016116516516717017217417618051565966637069738065【r=0.77】10.青年歌手大奖赛评委会对10名决赛选手的演唱水平(X)和综合素质(Y)进行打分,评价结果如下表(表中已先将选手按演唱水平作了次序排列)所示,试计算选手的演唱水平和综合素质间的肯德尔等级相关系数及斯皮尔曼等级相关系数。选手名ABCDEFGHIJ演唱水平(X)综合素质(Y)1234567891031527410869【肯德尔系数:0.56,斯皮尔曼系
本文标题:第十二章相关与回归分析
链接地址:https://www.777doc.com/doc-2163518 .html