您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 20202021学年高考数学考点第十章统计与概率变量间的相关关系统计案例理
1变量间的相关关系、统计案例1.相关关系与回归方程(1)相关关系的分类①正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.②负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(2)线性相关关系如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(3)回归方程①最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.②回归方程方程y^=b^x+a^是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中a^,b^是待定参数.b^=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^x.(4)回归分析①定义:对具有相关关系的两个变量进行统计分析的一种常用方法.②样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中(x,y)称为样本点的中心.③相关系数当r0时,表明两个变量正相关;当r0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之2间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.2.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量K2=nad-bc2a+bc+da+cb+d,其中n=a+b+c+d为样本容量.(3)独立性检验利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.概念方法微思考1.变量的相关关系与变量的函数关系有什么区别?提示相同点:两者均是指两个变量的关系.不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系.②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.2.线性回归方程是否都有实际意义?根据回归方程进行预报是否一定准确?提示(1)不一定都有实际意义.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.(2)根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.1.(2020•新课标Ⅰ)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(ix,)(1iyi,2,,20)得到下面的散点图:3由此散点图,在10C至40C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.yabxB.2yabxC.xyabeD.yablnx【答案】D【解析】由散点图可知,在10C至40C之间,发芽率y和温度x所对应的点(,)xy在一段对数函数的曲线附近,结合选项可知,yablnx可作为发芽率y和温度x的回归方程类型.故选D.2.(2017•山东)为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为ˆˆˆybxa,已知101225iix,1011600iiy,ˆ4b,该班某学生的脚长为24,据此估计其身高为()A.160B.163C.166D.170【答案】C【解析】由线性回归方程为ˆˆ4yxa,则101122.510iixx,101116010iiyy,则数据的样本中心点(22.5,160),由回归直线方程样本中心点,则ˆ4160422.570ayx,回归直线方程为ˆ470yx,当24x时,ˆ42470166y,则估计其身高为166,故选C.43.(2018•新课标Ⅱ)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,,17)建立模型①:ˆ30.413.5yt;根据2010年至2016年的数据(时间变量t的值依次为1,2,,7)建立模型②:ˆ9917.5yt.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【解析】(1)根据模型①:ˆ30.413.5yt,计算19t时,ˆ30.413.519226.1y;利用这个模型,求出该地区2018年的环境基础设施投资额的预测值是226.1亿元;根据模型②:ˆ9917.5yt,计算9t时,ˆ9917.59256.5y;利用这个模型,求该地区2018年的环境基础设施投资额的预测值是256.5亿元;(2)模型②得到的预测值更可靠;因为从总体数据看,该地区从2000年到2016年的环境基础设施投资额是逐年上升的,而从2000年到2009年间递增的幅度较小些,从2010年到2016年间递增的幅度较大些,所以,利用模型②的预测值更可靠些.1.(2020•河南模拟)某公司的广告费支出x与销售额y(单位:万元)之间有下列对应数据:已知5y对x呈线性相关关系,且回归方程为𝑦^=6.5𝑦+17.5,工作人员不慎将表格中y的第一个数据遗失,该数据为()x24568y40605070A.28B.30C.32D.35【答案】B【解析】设第一个数据遗失为y,由表中数据,可得:𝑦=15×(2+4+5+6+8)=5,且回归方程𝑦^=6.5𝑦+17.5,过样本中心点(𝑦,𝑦),即𝑦=6.5×5+17.5=50,所以𝑦=15×(y+40+60+50+70)=50,解得y=30.故选B.2.(2020•衡水模拟)某公司某型号无人机以其小巧轻便、高效机动、影像清晰、智能化、用途广等突出特点,得到广大用户的青睐,该型号无人机近5年销售量数据统计如表所示.年份20152016201720182019年份代码x01234年销量y/万件1015203035根据表中的数据用最小二乘法求得y关于x的线性回归方程为𝑦̂=6.5𝑦+𝑦,则可以预测2020年该型号无人机的销量大约为()A.40万件B.41.5万件C.45万件D.48万件【答案】B【解析】𝑦=0+1+2+3+45=2,𝑦=10+15+20+30+355=22.又因为直线𝑦̂=6.5𝑦+𝑦过点(2,22),故6.5×2+t=22,解得t=9.故预测2020年该型号无人机的销量大约为𝑦̂=6.5×5+9=41.5(万件),故选B.63.(2020•东湖区校级模拟)某产品的宣传费用x(万元)与销售额y(万元)的统计数据如表所示:宣传费用x(万元)4235销售额y(万元)4524a50根据上表可得回归方程𝑦̂=9.6𝑦+2.9,则宣传费用为3万元时,对应的销售额a为()A.36.5B.30C.33D.27【答案】D【解析】由题意产品的宣传费用x(万元)与销售额y(万元)的统计数据满足回归方程𝑦̂=9.6𝑦+2.9,则𝑦=4+2+3+54=3.5,𝑦=45+24+𝑦+504=119+𝑦4,因为回归直线经过样本中心,所以119+𝑦4=9.6×3.5+2.9,解得a=27,宣传费用为3万元时,𝑦̂=27.故选D.4.(2020•桃城区校级模拟)已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:x24568y3040m6570根据表中提供的全部数据,用最小二乘法得出y关于x的线性回归方程为𝑦̂=7𝑦+15,则表中m的值为()A.45B.50C.55D.60【答案】A【解析】∵𝑦=2+4+5+6+85=5,𝑦=30+40+𝑦+65+705=205+𝑦5,∴样本点的中心坐标为(5,205+𝑦5),代入𝑦̂=7𝑦+15,得205+𝑦5=50,解得m=45,故选A.5.(2020•吉林四模)若通过10组数据(xi,yi)(i=1,2,…,10)得到y关于x的线性回归方程7为𝑦^=3x+𝑦̂,且∑10𝑦=1𝑦𝑦=10,∑10𝑦=1𝑦𝑦=90,则𝑦̂=()A.4B.5C.6D.7【答案】C【解析】∵𝑦=110∑10𝑦=1𝑦𝑦=10=1,𝑦=110∑10𝑦=1𝑦𝑦=90=9,∴样本点的中心为(1,9),代入𝑦̂=3𝑦+𝑦̂,得9=3×1+𝑦̂,即𝑦̂=6.故选C.6.(2020•衡水模拟)某市2015年至2019年新能源汽车年销量y(单位:百台)与年份代号x之间的关系如表所示:年份20152016201720182019年份代号x01234年销量y101520m35若根据表中的数据用最小二乘法求得y关于x的回归直线方程为𝑦̂=6.5𝑦+9,则表中m的值为()A.22B.25.5C.28.5D.30【答案】D【解析】因为𝑦=0+1+2+3+45=2,所以y=6.5×2+9=22,因为回归直线方程过样本中心,所以10+15+20+m+35=22×5,解得m=30.故选D.7.(2020•茂名二模)某市2015年至2019年新能源汽车年销量y(单位:百台)与年份代号x的数据如表:年份20152016201720182019年份代号x01234年销量y101520m35若根据表中的数据用最小二乘法求得y关于x的回归直线方程为𝑦^=6.5𝑦+9,则表中m的值为()8A.22B.25C.30D.无法确定【答案】C【解析】因为𝑦=0+1+2+3+45=2,代入回归直线方程为𝑦^=6.5𝑦+9,所以,𝑦=6.5×2+9=22,于是得10+15+20+m+35=22×5,解得m=30.故选C.8.(2020•沈阳三模)已知x与y之间的几组数据如表:x1234y1mn4如表数据中y的平均值为2.5,若某同学对m赋了三个值分别为1.5,2,2.5,得到三条线性回归直线方程分别为y=b1x+a1,y=b2x+a2,y=b3x+a3,对应的相关系数分别为r1,r2,r3,下列结论中错误的是()参考公式:线性回归方程y=𝑦̂𝑦+𝑦̂中,其中𝑦̂=∑𝑦𝑦=1(𝑦𝑦−𝑦)(𝑦𝑦−𝑦)∑𝑦𝑦=1(𝑦𝑦−𝑦)2,𝑦̂=𝑦−𝑦̂𝑦.相关系数r=∑𝑦𝑦=1(𝑦𝑦−𝑦)(𝑦𝑦−𝑦)√∑𝑦𝑦=1(𝑦𝑦−𝑦)2∑𝑦𝑦=1(𝑦𝑦−𝑦)2.A.三条回归直线有共同交点B.相关系数中,r2最大C.b1>b2D.a1>a2【答案】D【解析】由题意,1+m+n+4=10,即m+n=5.若m=1.5,则n=3.5,此时𝑦=1+2+3+44=2.5,𝑦=2.5.∑4𝑦=1(𝑦𝑦−𝑦)(𝑦𝑦−𝑦)=(1﹣2.5)(1﹣2.5)+(2﹣2.5)(1.5﹣2.5)+(3﹣2.5)(3.5﹣2.5)+(4﹣2.5)(4﹣2.5)=5.5,∑4𝑦=1(𝑦𝑦−𝑦)2=(﹣1.5)2+(﹣0.5)2+0.52+1.52=5,∑4𝑦=1(𝑦𝑦−𝑦)2=(﹣1.5)2+(﹣1)2+12+1.52=6.5.则𝑦1=5.55=1.1,a1=2.5﹣1.1×2.5=﹣0.25,𝑦1=5.5√5×√6.5≈√0.93;若m=2,则n=3,此时𝑦=1+2+3+44=2.5,𝑦=2.5.∑
本文标题:20202021学年高考数学考点第十章统计与概率变量间的相关关系统计案例理
链接地址:https://www.777doc.com/doc-7332785 .html