您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 2024年高考数学一轮复习(新高考版) 第9章 §9.3 一元线性回归模型及其应用
公众号:高中试卷君公众号:高中试卷君§9.3一元线性回归模型及其应用考试要求1.了解样本相关系数的统计含义.2.了解最小二乘法原理,掌握一元线性回归模型参数的最小二乘估计方法.3.针对实际问题,会用一元线性回归模型进行预测.知识梳理1.变量的相关关系(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(2)相关关系的分类:正相关和负相关.(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.2.样本相关系数(1)r=i=1nxi-xyi-yi=1nxi-x2i=1nyi-y2.(2)当r0时,称成对样本数据正相关;当r0时,称成对样本数据负相关.(3)|r|≤1;当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.3.一元线性回归模型(1)我们将y^=b^x+a^称为Y关于x的经验回归方程,其中b^=i=1nxi-xyi-yi=1nxi-x2,a^=y-b^x.(2)残差:观测值减去预测值称为残差.常用结论1.经验回归直线过点(x,y).公众号:高中试卷君公众号:高中试卷君2.求b^时,常用公式b^=i=1nxiyi-nxyi=1nx2i-nx2.3.回归分析和独立性检验都是基于成对样本观测数据进行估计或推断,得出的结论都可能犯错误.思考辨析判断下列结论是否正确(请在括号中打“√”或“×”)(1)相关关系是一种非确定性关系.(√)(2)散点图是判断两个变量相关关系的一种重要方法和手段.(√)(3)经验回归直线y^=b^x+a^至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.(×)(4)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.(√)教材改编题1.在对两个变量x,y进行回归分析时有下列步骤:①对所求出的经验回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求经验回归方程;④根据所收集的数据绘制散点图.则下列操作顺序正确的是()A.①②④③B.③②④①C.②③①④D.②④③①答案D解析根据回归分析的思想,可知对两个变量x,y进行回归分析时,应先收集数据(xi,yi),然后绘制散点图,再求经验回归方程,最后对所求的经验回归方程作出解释.2.对于x,y两变量,有四组成对样本数据,分别算出它们的样本相关系数r如下,则线性相关性最强的是()A.-0.82B.0.78C.-0.69D.0.87答案D解析由样本相关系数的绝对值|r|越大,变量间的线性相关性越强知,各选项中r=0.87的绝对值最大.3.某单位为了了解办公楼用电量y(度)与气温x(℃)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:气温(℃)181310-1用电量(度)24343864公众号:高中试卷君公众号:高中试卷君由表中数据得到经验回归方程y^=-2x+a^,当气温为-4℃时,预测用电量约为()A.68度B.52度C.12度D.28度答案A解析由表格可知x=10,y=40,根据经验回归直线必过(x,y)得a^=40+20=60,∴经验回归方程为y^=-2x+60,因此当x=-4时,y^=68.题型一成对数据的相关性例1(1)(2023·保定模拟)已知两个变量x和y之间有线性相关关系,经调查得到如下样本数据:x34567y3.52.41.1-0.2-1.3根据表格中的数据求得经验回归方程为y^=b^x+a^,则下列说法中正确的是()A.a^0,b^0B.a^0,b^0C.a^0,b^0D.a^0,b^0答案B解析由已知数据可知y随着x的增大而减小,则变量x和y之间存在负相关关系,所以b^0.又x=15×(3+4+5+6+7)=5,y=15×(3.5+2.4+1.1-0.2-1.3)=1.1,即1.1=5b^+a^,所以a^=1.1-5b^0.(2)(2022·大同模拟)如图是相关变量x,y的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到经验回归方程y^=b^1x+a^1,样本相关系数为r1;方案二:剔除点(10,21),根据剩下的数据得到经验回归方程y^=b^2x+a^2,样本相关系数为r2.则()A.0r1r21B.0r2r11公众号:高中试卷君公众号:高中试卷君C.-1r1r20D.-1r2r10答案D解析根据相关变量x,y的散点图知,变量x,y具有负线性相关关系,且点(10,21)是离群值;方案一中,没剔除离群值,线性相关性弱些;方案二中,剔除离群值,线性相关性强些;所以样本相关系数-1r2r10.思维升华判定两个变量相关性的方法(1)画散点图:若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到右下角,则两个变量负相关.(2)样本相关系数:当r0时,正相关;当r0时,负相关;|r|越接近1,相关性越强.(3)经验回归方程:当b^0时,正相关;当b^0时,负相关.跟踪训练1(1)某公司2017~2022年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如表所示:年份201720182019202020212022利润x12.214.6161820.422.3支出y0.620.740.810.8911.11根据统计资料,则利润中位数()A.是16,x与y有正相关关系B.是17,x与y有正相关关系C.是17,x与y有负相关关系D.是18,x与y有负相关关系答案B解析由题意知,利润中位数是16+182=17,而且随着年利润x的增加,广告支出y也在增加,故x与y有正相关关系.(2)已知相关变量x和y的散点图如图所示,若用y=b1·ln(k1x)与y=k2x+b2拟合时的样本相关系数分别为r1,r2则比较r1,r2的大小结果为()公众号:高中试卷君公众号:高中试卷君A.r1r2B.r1=r2C.r1r2D.不确定答案C解析由散点图可知,用y=b1ln(k1x)拟合比用y=k2x+b2拟合的程度高,故|r1||r2|;又因为x,y负相关,所以-r1-r2,即r1r2.题型二回归模型命题点1一元线性回归模型例2(2023·蚌埠模拟)某商业银行对存款利率与日存款总量的关系进行调研,发现存款利率每上升一定的百分点,日均存款总额就会发生一定的变化,经过统计得到下表:利率上升百分点x0.10.20.30.40.5日均存款总额y(亿元)0.20.350.50.650.8(1)在给出的坐标系中画出上表数据的散点图;(2)根据上表提供的数据,用最小二乘法求出y关于x的经验回归方程y^=b^x+a^;(3)已知现行利率下的日均存款总额为0.625亿元,试根据(2)中的经验回归方程,预测日均存款总额为现行利率下的2倍时,利率需上升多少个百分点?参考公式及数据:①b^=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^x,②i=15xiyi=0.9,i=15x2i=0.55.解(1)如图所示.公众号:高中试卷君公众号:高中试卷君(2)由表格数据可得x=15×(0.1+0.2+0.3+0.4+0.5)=0.3,y=15×(0.2+0.35+0.5+0.65+0.8)=0.5,所以b^=∑5i=1xiyi-5xy∑5i=1x2i-5x2=0.9-5×0.3×0.50.55-5×0.3×0.3=1.5,a^=y-b^x=0.5-1.5×0.3=0.05,故y^=1.5x+0.05.(3)设利率需上升x个百分点,由(2)得,0.625×2=1.5x+0.05,解得x=0.8,所以预测利率需上升0.8个百分点.命题点2非线性回归模型例3(2023·保山模拟)某印刷企业为了研究某种图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的关系,收集了一些数据并进行了初步整理,得到了如图所示的散点图及一些统计量的值.xyui=17(xi-x)2i=17(xi-x)·(yi-y)i=17(ui-u)2i=17(ui-u)·(yi-y)53.50.22300.77表中ui=1xi,u=17i=17ui.(1)根据散点图判断y=a+bx与y=c+dx哪一个模型更适合作为该图书每册的成本费y与印刷公众号:高中试卷君公众号:高中试卷君数量x的经验回归方程?(只要求给出判断,不必说明理由)(2)根据(1)的判断结果及表中数据求出y关于x的经验回归方程;(3)若该图书每册的售价为9元,则预测至少应该印刷多少册,才能使销售利润不低于80000元(假设能够全部售出).附:对于一组数据(ω1,v1),(ω2,v2),…,(ωn,vn),其经验回归方程v^=β^ω+α^的斜率和截距的最小二乘估计分别为β^=i=1nωi-ωvi-vi=1nωi-ω2,α^=v-β^ω.解(1)由散点图判断y=c+dx更适合作为该图书每册的成本费y与印刷数量x的经验回归方程.(2)先建立y关于u的经验回归方程得y^=c^+d^u,由于d^=i=17ui-uyi-yi=17ui-u2=70.7=10,故c^=y-d^u=3.5-10×0.2=1.5,所以预测y关于u的经验回归方程为y^=1.5+10u,从而y关于x的经验回归方程为y^=1.5+10x.(3)假设印刷x千册,依据题意得9x-1.5+10xx≥80,解得x≥12,所以预测至少应该印刷12000册图书,才能使销售利润不低于80000元.思维升华求经验回归方程的步骤跟踪训练2(2022·南充模拟)某特色餐馆开通了某APP的外卖服务,在一周内的某特色菜外卖份数x(单位:份)与收入y(单位:元)之间有如下的对应数据:外卖份数x(份)24568收入y(元)3040605070(1)在给出的坐标系中画出数据散点图;公众号:高中试卷君公众号:高中试卷君(2)请根据以上数据用最小二乘法求出收入y关于份数x的经验回归方程;(3)据此估计外卖份数为12时,收入为多少元.参考数据公式:i=15x2i=145,i=15xiyi=1380,b^=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nxyi=1nx2i-nx2,a^=y-b^x.解(1)作出散点图如图所示.(2)由表格数据得,x=2+4+5+6+85=5,y=30+40+60+50+705=50,则b^=i=15xiyi-5xyi=15x2i-5x2=1380-5×5×50145-5×52=6.5,a^=y-b^x=50-6.5×5=17.5,因此,所求经验回归方程为y^=6.5x+17.5.(3)当x=12时,y^=12×6.5+17.5=95.5,即外卖份数为12时,预测收入为95.5元.公众号:高中试卷君公众号:高中试卷君题型三残差分析例4(1)(多选)下列说法正确的是()A.在经验回归方程y^=-0.85x+2.3中,当解释变量x每增加1个单位时,响应变量y^平均减少2.3个单位B.在经验回归方程y^=-0.85x+2.3中,相对于样本点(1,1.2)的残差为-0.25C.在残差图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好D.若两个变量的决定系数R2越大,表示残差平方和越小,即模型的拟合效果越好答案BCD解析对于A,根据经验回归方程,当解释变量x每增加1个单位时,响应变量y^平均减少0.85个单位,故A错误;对于B,当解释变量x=1时,响应变量y^=1.45,则样本点(1,1.2)的残差为-0.25,故B正确;对于C,在残差图中,残差分布的水平带状区域的宽度越窄,说明拟合精度越高,即拟合效果越好,故C正确;对于D,由决定系数R2的意义可知,R2越大,表示残差平方和越小,即模型的拟合效果越好,故D正确.(2)新能源汽车的核心部件是动力电池,电池占了新能源整车成本的很大一部分,而其中的原材
本文标题:2024年高考数学一轮复习(新高考版) 第9章 §9.3 一元线性回归模型及其应用
链接地址:https://www.777doc.com/doc-12824504 .html