您好,欢迎访问三七文档
1第十一章统计与统计案例11.3变量间的相关关系、统计案例试题理北师大版1.相关性(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.(2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为曲线拟合.(3)若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的,若所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关是非线性相关的.如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.2.线性回归方程(1)最小二乘法如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2来刻画这些点与直线y=a+bx的接近程度,使得上式达到最小值的直线y=a+bx就是所要求的直线,这种方法称为最小二乘法.(2)线性回归方程方程y=bx+a是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的线性回归方程,其中a,b是待定参数.b=∑ni=1xi-xyi-y∑ni=1xi-x2=∑ni=1xiyi-nxy∑ni=1x2i-nx2,a=y-bx.3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)中,(x,y)称为样本点的中心.(3)相关系数2①r=∑ni=1xi-xyi-y∑ni=1xi-x2∑ni=1yi-y2=1222211niii=nniii=i=xynxyxnxyny;②当r0时,表明两个变量正相关;当r0时,表明两个变量负相关;当r=0时,表明两个变量线性不相关.|r|值越接近于1,表明两个变量之间的线性相关程度越高.|r|值越接近于0,表明两个变量之间的线性相关程度越低.4.独立性检验设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=A1;变量B:B1,B2=B1.2×2列联表:BAB1B2总计A1aba+bA2cdc+d总计a+cb+dn=a+b+c+d构造一个统计量χ2=nad-bc2a+bc+da+cb+d.利用统计量χ2来判断“两个分类变量有关系”的方法称为独立性检验.当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;当χ22.706时,有90%的把握判定变量A,B有关联;当χ23.841时,有95%的把握判定变量A,B有关联;当χ26.635时,有99%的把握判定变量A,B有关联.【思考辨析】判断下列结论是否正确(请在括号中打“√”或“×”)(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.(×)(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.(√)(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.(√)(4)某同学研究卖出的热饮杯数y与气温x(℃)之间的关系,得回归方程y=-2.352x+3147.767,则气温为2℃时,一定可卖出143杯热饮.(×)(5)事件X,Y关系越密切,则由观测数据计算得到的χ2越大.(√)(6)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.(×)1.(2015·湖北)已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关答案C解析因为y=-0.1x+1,-0.10,所以x与y负相关.又y与z正相关,故可设z=by+a(b0),所以z=-0.1bx+b+a,-0.1b0,所以x与z负相关.故选C.2.(教材改编)下面是2×2列联表:y1y2合计x1a2173x2222547合计b46120则表中a,b的值分别为()A.94,72B.52,50C.52,74D.74,52答案C解析∵a+21=73,∴a=52.又a+22=b,∴b=74.3.(2016·河南八市质检)为了研究某大型超市当天销售额与开业天数的关系,随机抽取了5天,其当天销售额与开业天数的数据如下表所示:开业天数x1020304050当天销售额y/万元62758189根据上表提供的数据,求得y关于x的线性回归方程为y=0.67x+54.9,由于表中有一个数据模糊看不清,请你推断出该数据的值为()A.67B.68C.68.3D.714答案B解析设表中模糊看不清的数据为m,因为x=10+20+30+40+505=30,又样本中心点(x,y)在回归直线y=0.67x+54.9上,所以y=m+3075=0.67×30+54.9,得m=68,故选B.4.(2016·西安模拟)某产品在某零售摊位的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:x16171819y50344131由上表可得线性回归方程y=bx+a中的b=-4,据此模型预测零售价为15元时,每天的销售量为()A.51个B.50个C.49个D.48个答案C解析由题意知x=17.5,y=39,代入线性回归方程得a=109,109-15×4=49,故选C.5.(2016·玉溪一中月考)利用独立性检验来判断两个分类变量X和Y是否有关系,通过查阅下表来确定“X和Y有关系”的可信度.为了调查用电脑时间与视力下降是否有关系,现从某地网民中抽取100位居民进行调查.经过计算得χ2≈3.855,那么就有________%的把握认为用电脑时间与视力下降有关系.P(χ2≥k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828答案95解析根据表格发现3.8553.841,3.841对应的是0.05,所以根据独立性检验原理可知有95%的把握认为用电脑时间与视力下降有关系.题型一相关关系的判断例1(1)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得线性回归方程,分别得到以下四个结论:①y与x负相关且y=2.347x-6.423;②y与x负相关且y=-3.476x+5.648;5③y与x正相关且y=5.437x+8.493;④y与x正相关且y=-4.326x-4.578.其中一定不正确的结论的序号是()A.①②B.②③C.③④D.①④(2)x和y的散点图如图所示,则下列说法中所有正确命题的序号为________.①x,y是负相关关系;②在该相关关系中,若用y=c12ecx拟合时的相关系数的平方为r21,用y=bx+a拟合时的相关系数的平方为r22,则r21r22;③x、y之间不能建立线性回归方程.答案(1)D(2)①②解析(1)由线性回归方程y=bx+a知当b0时,y与x正相关,当b0时,y与x负相关,∴①④一定错误.(2)①显然正确;由散点图知,用y=c12ecx拟合的效果比用y=bx+a拟合的效果要好,故②正确;x,y之间能建立线性回归方程,只不过预报精度不高,故③不正确.思维升华判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)相关系数:r0时,正相关;r0时,负相关.(3)线性回归方程中:b0时,正相关;b0时,负相关.(1)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为()A.-1B.0C.12D.1(2)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()A.r2<r1<0B.0<r2<r1C.r2<0<r1D.r2=r16答案(1)D(2)C解析(1)所有点均在直线上,则样本相关系数最大,即为1,故选D.(2)对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0,故选C.题型二线性回归分析例2(2016·全国丙卷)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码17分别对应年份2008-2014.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:i=17yi=9.32,i=17tiyi=40.17,i=17yi-y2=0.55,7≈2.646.参考公式:相关系数r=i=1nti-tyi-yi=1nti-t2i=1nyi-y2,回归方程y=a+bt中斜率和截距的最小二乘估计公式分别为:b=i=1nti-tyi-yi=1nti-t2,a=y-bt.解(1)由折线图中数据和附注中参考数据得t=4,i=17(ti-t)2=28,i=17yi-y2=0.55.7i=17(ti-t)(yi-y)=i=17tiyi-ti=17yi=40.17-4×9.32=2.89,所以r≈2.890.55×2×2.646≈0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.(2)由y=9.327≈1.331及(1)得b=i=17ti-tyi-yi=17ti-t2=2.8928≈0.103,a=y-bt≈1.331-0.103×4≈0.92.所以y关于t的回归方程为y=0.92+0.10t.将2016年对应的t=9代入回归方程得y=0.92+0.10×9=1.82.所以预测2016年我国生活垃圾无害化处理量将约为1.82亿吨.思维升华线性回归分析问题的类型及解题方法(1)求线性回归方程①利用公式,求出回归系数b,a.②待定系数法:利用回归直线过样本点的中心求系数.(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数b.(4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.(2015·课标全国Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.8xywi=18(xi-x)2i=18(wi-w)2i=18(xi-x)·(yi-y)i=18(wi-w)·(yi-y)46.65636.8289.81.61469108.8表中wi=xi,w=18i=18wi.(1)根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为β=i=1nui-uvi-vi
本文标题:2018版高考数学大一轮复习第十一章统计与统计案例11.3变量间的相关关系统计案例试题理
链接地址:https://www.777doc.com/doc-4109094 .html