您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 交通运输 > 第九章第四节相关性最小二乘估计回归分析与独立性检验
课时提升作业(六十四)一、选择题1.下面是2×2列联表:y1y2总计x1a2173x2222547总计b46120则表中a,b的值分别为()(A)94,72(B)52,50(C)52,74(D)74,522.对于给定的两个变量的统计数据,下列说法正确的是()(A)都可以分析出两个变量的关系(B)都可以用一条直线近似地表示两者的关系(C)都可以作出散点图(D)都可以用确定的表达式表示两者的关系3.(2013·铜陵模拟)相关系数度量()(A)两个变量之间线性关系的强度(B)散点图是否显示有意义的模型(C)两个变量之间是否存在因果关系(D)两个变量之间是否存在关系4.遗传学研究发现,子女的身高与父母的身高相关,且子女的身高向人类的平均身高靠近,这种现象称为“回归”.现用x(单位:米)表示父母的身高,y(单位:米)表示子女的身高,则在下列描述子女身高与父母身高关系的回归直线中,拟合比较好的是()5.(2013·新余模拟)若回归方程中的回归系数b=0,则相关系数为()(A)r=1(B)r=-1(C)r=0(D)无法确定6.(2013·佛山模拟)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()(A)r2r10(B)0r2r1(C)r20r1(D)r2=r17.(2013·鞍山模拟)设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是()(A)x和y的相关系数为直线l的斜率(B)x和y的相关系数在0到1之间(C)当n为偶数时,分布在l两侧的样本点的个数一定相同(D)直线l过点(,)8.(2013·九江模拟)已知数组(x1,y1),(x2,y2),…,(x10,y10)满足线性回归方程y=a+bx,则“(x0,y0)满足线性回归方程y=bx+a”是“x0=,y0=”的()(A)充分不必要条件(B)必要不充分条件(C)充要条件(D)既不充分也不必要条件9.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回归直线方程y=a+bx,那么下面正确说法的序号是()①直线y=a+bx必经过点(,);②直线y=a+bx至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点;③直线y=a+bx的斜率b=;④直线y=a+bx和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差[yi-(bxi+a)]2是该坐标平面上所有直线与这些点的偏差中最小的.(A)①②③(B)②③④(C)①③④(D)①②④10.(2013·安庆模拟)某著名纺织集团为了减轻生产成本继续走高的压力,计划提高某种产品的价格,为此销售部在10月1日至10月5日连续五天对某个大型批发市场中该产品一天的销售量及其价格进行了调查,其中该产品的价格x(元)与销售量y(万件)之间的数据如表所示:日期10月1日10月2日10月3日10月4日10月5日价格x(元)99.51010.511销售量y(万件)1110865已知销售量y与价格x之间具有线性相关关系,其回归直线方程为:y=a-3.2x,若该集团提高价格后该批发市场的日销售量为7.36万件,则该产品的价格约为()(A)14.2元(B)10.8元(C)14.8元(D)10.2元二、填空题11.(2013·芜湖模拟)许多因素都会影响贫穷,教育也是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的回归直线方程为y=0.8x+4.6,斜率的估计值等于0.8说明,成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)之间的相关系数(填“大于0”或“小于0”).12.(2013·南昌模拟)对一些城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查后知,y与x具有相关关系,满足回归方程y=1.562+0.66x.若某被调查城市的居民人均消费水平为7.675(千元),则可以估计该城市人均消费额占人均工资收入的百分比约为%(结果保留两个有效数字).13.在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:能否有99%的把握认为该种血清(填“能”或“不能”)起到预防感冒的作用.未感冒感冒总计使用血清258242500未使用血清216284500总计474526100014.(能力挑战题)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:时间x12345命中率y0.40.50.60.60.4小李这5天的平均投篮命中率为;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为.三、解答题15.某企业为了更好地了解设备改造前后与生产合格品的关系,随机抽取了180件产品进行分析,其中设备改造前的合格品有36件,不合格品有49件,设备改造后生产的合格品有65件,不合格品有30件.根据所给数据:(1)写出2×2列联表;(2)判断产品是否合格与设备改造是否有关.答案解析1.【解析】选C.∵a+21=73,∴a=52,又a+22=b,∴b=74.2.【解析】选C.给出一组样本数据,总可以作出相应的散点图,但不一定能分析出两个变量的关系,更不一定符合线性相关或函数关系,故选C.3.【解析】选A.相关系数是度量两个变量之间线性关系强弱程度的.4.【思路点拨】描述子女身高与父母身高关系的回归直线中,拟合效果越好,则两条直线的倾斜角越接近,我们逐一分析四个图形,寻找四个答案中直线的倾斜角最接近的图象,即为答案.【解析】选B.回归直线拟合效果越好,则两条直线的倾斜角越接近,我们逐一分析四个图形,直线的倾斜角最接近的图象为B,故选B.5.【解析】选C.因为回归系数b的计算公式与相关系数r的计算公式中分子相同,故b=0时有r=0.6.【思路点拨】先根据数据作出X与Y及U与V的散点图,再根据散点图判断出变量之间的正负相关性.【解析】选C.结合散点图可得:变量X与Y成正相关,变量V与U成负相关,故r10,r20.7.【思路点拨】根据最小二乘法的有关概念:样本点的中心、相关系数、线性回归方程的意义等进行判断.【解析】选D.在A中,相关系数用来衡量两个变量之间的相关程度,直线的斜率表示直线的倾斜程度,它们的计算公式也不相同,故A不正确;在B中,相关系数的值有正有负,还可以是0;当相关系数在0到1之间时,两个变量为正相关,在-1到0之间时,两个变量负相关,故B不正确;在C中,l两侧的样本点的个数分布与n的奇偶性无关,也不一定是平均分布,故C不正确;由回归直线方程的计算公式=-可知直线l必过点(,),故D正确.8.【解析】选B.x0,y0为这10组数据的平均值,又因为线性回归方程y=a+bx必过样本中心(,),因此(,)一定满足线性回归方程,但满足线性回归方程的除了(,)处,可能还有其他样本点.9.【解析】选C.回归直线y=a+bx经过样本中心点(,),可能不经过(x1,y1),(x2,y2),…,(xn,yn)中的任何一点,这些点分布在这条直线附近.10.【解析】选D.依题意=10,=8.因为线性回归直线必过样本中心点(,),所以8=-3.2×10+a,解得a=40.所以回归直线方程为y=40-3.2x.令y=7.36,则7.36=40-3.2x,解得x=10.2.所以该产品的价格约为10.2元.11.【解析】由回归方程知a=4.6,b=0.8,再由x,y表示的实际意义可知0.8的含义,相关系数r0.答案:一个地区受9年或更少教育的百分比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将增加0.8%左右大于012.【解析】依题意得,当y=7.675时,有0.66x+1.562=7.675,x≈9.262.因此,可以估计该城市人均消费额占人均工资收入的百分比为≈83%.答案:8313.【思路点拨】在使用该种血清的人中,有=48.4%的人患过感冒;在没有使用该种血清的人中,有=56.8%的人患过感冒,使用过血清的人与没有使用过血清的人的患病率相差较大.从直观上来看,使用过血清的人与没有使用过血清的人患感冒的可能性存在差异.【解析】由列联表中的数据,求得χ2=≈7.075.∵7.0756.635,因此有99%的把握认为该种血清能起到预防感冒的作用.答案:能【方法技巧】两个分类变量是否有关的直观判断在列联表中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比重,和满足条件X=x2的个体中具有Y=y1的个体所占的比重,若两个分类变量无关,则两个比重应差别不大,即≈,因此两个比重和相差越大,两个分类变量有关的可能性就越大.14.【解析】平均命中率=×(0.4+0.5+0.6+0.6+0.4)=0.5,而=3,(xi-)(yi-)=(-2)×(-0.1)+(-1)×0+0×0.1+1×0.1+2×(-0.1)=0.1,(xi-)2=(-2)2+(-1)2+02+12+22=10,于是b=0.01,a=-b=0.47,∴y=0.47+0.01x,令x=6,得y=0.53.答案:0.50.5315.【思路点拨】列表后利用χ2的值进行检验.【解析】(1)由已知数据得合格品不合格品合计设备改造后653095设备改造前364985合计10179180(2)∵χ2=≈12.38.由于12.386.635,所以有99%以上的把握认为产品是否合格与设备改造有关.【变式备选】对某校学生进行心理障碍测试,得到如下列联表.焦虑说谎懒惰总计女生5101530男生20105080总计252065110试说明在这三种心理障碍中哪一种与性别关系最大?【解析】对于上述三种心理障碍分别构造三个随机变量,,.由表中数据可得=≈0.8632.706,=≈6.3663.841,=≈1.4102.706所以没有充分的证据显示焦虑与性别有关,有95%的把握认为说谎与性别有关,没有充分的证据显示懒惰与性别有关.
本文标题:第九章第四节相关性最小二乘估计回归分析与独立性检验
链接地址:https://www.777doc.com/doc-2184585 .html