您好,欢迎访问三七文档
考向51变量间的相关关系、统计案例1.(2020·全国·高考真题(理))某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)iixyi得到下面的散点图:由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.yabxB.2yabxC.exyabD.lnyabx【答案】D【分析】根据散点图的分布可选择合适的函数模型.【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近,因此,最适合作为发芽率y和温度x的回归方程类型的是lnyabx.故选:D.【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.2.(2020·海南·高考真题)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和2SO浓度(单位:3μg/m),得下表:2SOPM2.5[0,50](50,150](150,475][0,35]32184(35,75]6812(75,115]3710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO浓度不超过150”的概率;(2)根据所给数据,完成下面的22列联表:2SOPM2.5[0,150](150,475][0,75](75,115](3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO浓度有关?附:22()()()()()nadbcKabcdacbd,2()PKk0.0500.0100.001k3.8416.63510.828【答案】(1)0.64;(2)答案见解析;(3)有.【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据可得22列联表;(3)计算出2K,结合临界值表可得结论.【详解】(1)由表格可知,该市100天中,空气中的2.5PM浓度不超过75,且2SO浓度不超过150的天数有32618864天,所以该市一天中,空气中的2.5PM浓度不超过75,且2SO浓度不超过150的概率为640.64100;(2)由所给数据,可得22列联表为:2SO2.5PM0,150150,475合计0,7564168075,115101020合计7426100(3)根据22列联表中的数据可得222()100(64101610)()()()()80207426nadbcKabcdacbd36007.48446.635481,因为根据临界值表可知,有99%的把握认为该市一天空气中2.5PM浓度与2SO浓度有关.【点睛】本题考查了古典概型的概率公式,考查了完善22列联表,考查了独立性检验,属于中档题.1.回归分析问题的类型及解题方法(1)求回归方程①根据散点图判断两变量是否线性相关,如不是,应通过换元构造线性相关.②利用公式,求出回归系数b^.③待定系数法:利用回归直线过样本点的中心求系数a^.(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.(3)利用回归直线判断正、负相关,决定正相关还是负相关的是系数b^.(4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.2.在2×2列联表中,如果两个变量没有关系,则应满足ad-bc≈0.|ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.3.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表:(2)根据公式χ2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d)计算χ2;(3)通过比较χ2与临界值的大小关系来作统计推断.1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关;点散布在左上角到右下角的区域内,两个变量的这种相关关系为负相关.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归方程为y^=b^x+a^,其中121niiiniixxyybxx,aybx$$.(3)通过求的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.(4)相关系数:当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.3.独立性检验(1)2×2列联表设X,Y为两个变量,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(2)独立性检验利用随机变量K2(也可表示为χ2)的观测值k=nad-bc2a+bc+da+cb+d(其中n=a+b+c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.【常用结论】(1)求解回归方程的关键是确定回归系数a^,b^,应充分利用回归直线过样本中心点(x-,y-).(2)根据K2的值可以判断两个分类变量有关的可信程度,若K2越大,则两分类变量有关的把握越大.(3)根据回归方程计算的b^值,仅是一个预报值,不是真实发生的值.1.(2020·新疆·克拉玛依市教育研究所三模(理))已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:x24568y3040506070根据上表可得回归方程为^^ ybxa,计算得^7b,则当投入10万元广告费时,销售额的预报值为()A.75万元B.85万元C.95万元D.105万元2.(2018·河北衡水中学一模(理))如图,5个(,)xy数据,去掉(3,10)D后,下列说法错误的是()A.相关系数r变大B.残差平方和变大C.R2变大D.解释变量x与预报变量y的相关性变强3.(2021·全国·模拟预测(理))已知对于一组数据11,xy,22,xy,…,1010,xy,y关于x的线性回归方程为ˆ27.2yx,若1016iix,则101iiy______.4.(2021·四川内江·模拟预测(文))有人发现,多看手机容易使人近视,下表是调查机构对此现象的调查数据:近视不近视总计少看手机154560多看手机15520总计305080则在犯错误的概率不超过__________的前提下认为近视与多看手机有关系.附表:2PKk0.150.100.050.0100.0250.0050.001k2.0722.7063.8415.0246.6357.87910.828参考公式:22nadbcKabcdacbd,其中nabcd.1.(2021·广东肇庆·模拟预测)某种兼职工作虽然以计件的方式计算工资,但是对于同一个人的工资与其工作时间还是存在一定的相关关系,已知小孙的工作时间x(单位:小时)与工资y(单位:元)之间的关系如下表:x24568y3040506070若y与x的线性回归方程为ˆ6.5yxa,预测当工作时间为9小时时,工资大约为()A.75元B.76元C.77元D.78元2.(2019·辽宁大连·一模)设有一个回归方程为21.5ˆyx,则变量x增加一个单位时()A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位3.(2021·黑龙江肇州·模拟预测(文))为了了解山高y(km)与气温x(℃)的关系,登山人员随机抽测了5次山高与相应气温,如下表:气温(℃)2214814山高(km)2233384752由表中数据,得到线性回归方程1.1yxa,由此估计山高56km处气温大约为()A.7.4℃B.8.2℃C.8.8℃D.9.2℃4.(2021·江西丰城·模拟预测(理))对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()A.24310rrrrB.42130rrrrC.42310rrrrD.24130rrrr5.(2021·山东菏泽·二模)下列说法错误的是()A.用相关指数2R来刻画回归效果,2R越小说明拟合效果越好B.已知随机变量2~(5,)XN,若(1)0.1Px,则(9)0.9PxC.某人每次投篮的命中率为35,现投篮5次,设投中次数为随机变量Y.则7(2)1EYD.对于独立性检验,随机变量2K的观测值k值越小,判定“两分类变量有关系”犯错误的概率越大6.(2021·河南·模拟预测(文))由一组样本点1,1、2,1.2、3,2.1、4,2.7、5,3,根据最小二乘法求得的回归方程为0.55yxa,则a___________.7.(2021·全国·模拟预测)某企业一种商品的产量与单位成本数据如下表:产量x(万件)234单位成本y(元/件)3a7现根据表中所提供的数据,求得y关于x的线性回归直线方程为25ayx,则预测当5x时单位成本为每件______元.8.(2021·福建·漳州三中三模)根据下面的数据:x1234y32487288求得y关于x的回归直线方程为19.212yx,则这组数据相对于所求的回归直线方程的4个残差的方差为___________.(注:残差是指实际观察值与估计值之间的差.)9.(2021·江西南昌·一模(理))2020年,全球展开了某疫苗研发竞赛,我为处于领先地位,为了研究疫苗的有效率,在某地进行临床试验,对符合一定条件的10000名试验者注射了该疫苗,一周后有20人感染,为了验证疫苗的有效率,同期,从相同条件下未注射疫苗的人群中抽取2500人,分成5组,各组感染人数如下:调查人数x300400500600700感染人数y33667并求得y与x的回归方程为0ˆ0.11yxa,同期,在人数为10000的条件下,以拟合结果估算未注射疫苗的人群中感染人数,记为N;注射疫苗后仍被感染的人数记为n,则估计该疫苗的有效率为__________.(疫苗的有效率为1nN;参考数据:1109.50.009132;结果保留3位有效数字)10.(2020·广东·大沥高中模拟预测)某工厂在疫情形势好转的情况下,复工后的前5个月的利润情况如下表所示:第1个月第2个月第3个月第4个月第5个月利润(单位:万元)111275180设第i个月的利润为y万元.(1)根据表中数据,求y关于i的方程^^^21ybia(^b,^a的值要求保留小数点后四位有效数字);(2)根据已知数据求得回归方程后,为验证该方程的可靠性,可用一个新数据加以验证,方法如下:先计算新数据00,xy对应的残差^000yy,再计算00y,若000.05y,则说明该方程是可靠的,否则说明不可靠.现已知该厂第6个月的利润为120万元,是判断(1)中求得的回归方程是否可靠,说明你的理由.参考数据:44441234354,取419=4.816187.附:回归直线^^^ybxa的斜率和截距的最小二乘估计分别为^1221niiiniixynxybxnx,^^^aybx.11.(2021·新疆·克拉玛依市教育研究所模拟预测(文))推进垃圾分类处理,是落实绿色发展理念的必然选择.为加
本文标题:【新高考复习】考向51 变量间的相关关系、统计案例-备战2022年高考数学一轮复习考点微专题(新高考
链接地址:https://www.777doc.com/doc-12787825 .html