您好,欢迎访问三七文档
第一章统计§8最小二乘估计自主学习梳理知识课前基础梳理|学习目标|1.了解线性回归的思想方法,知道最小二乘法的思想.2.会求回归直线方程,并能利用回归直线方程解决实际问题.1.最小二乘法如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2,使得上式达到________的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法.最小值2.线性回归方程用x表示x1+x2+…+xnn,用y表示y1+y2+…+ynn,则用最小二乘法可求得b=x1-xy1-y+x2-xy2-y+…+xn-xyn-yx1-x2+x2-x2+…+xn-x2=__________________________________.a=__________.x1y1+x2y2+…+xnyn-nxyx21+x22+…+x2n-nx2y-bx这样得到的直线方程y=a+bx称为线性回归方程,a,b是线性回归方程的系数.练一练:某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x681012y2356(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a.解:(1)如图:(2)i=14xiyi=6×2+8×3+10×5+12×6=158,x=6+8+10+124=9,y=2+3+5+64=4,i=14x2i=62+82+102+122=344,b=158-4×9×4344-4×92=1420=0.7,a=y-bx=4-0.7×9=-2.3,故线性回归方程为y=0.7x-2.3.3.最小二乘法应用利用最小二乘法估计时,要先作出数据的_______.如果________呈现一定的规律性,我们再根据这个规律性进行______.如果散点图呈现出__________,我们可以用____________估计出线性回归方程;如果散点图呈现出其他的__________,我们就要利用其他工具进行拟合.散点图散点图拟合线性关系最小二乘法曲线关系1.回归直线与样本点的中心有无关系?对于以(xn,yn)为样本数据而言,(x,y)为样本点的中心,根据最小二乘法原理,回归直线一定过样本点的中心.2.回归直线方程中,b有何意义?在回归直线方程y=a+bx中,b表示x每增加一个单位,y平均增加的单位数.当回归系数b>0时,x每增加一个单位,y就平均增加b个单位;当b<0时,x每增加一个单位,y就平均减少|b|个单位.典例精析规律总结课堂互动探究某种产品的广告费x(单位:百万元)与销售额y(单位:百万元)之间有一组对应数据如下表所示.x/百万元24568y/百万元3040605070(1)画出散点图;(2)求回归直线方程.【解】(1)散点图如图所示:(2)根据表格中的数据可求得x=5,y=50,其他数据如表:ixiyix2ixiyi1230460244016160356025300465036300587064560合计252501451380进而可以求得b=1380-5×5×50145-5×52=6.5,a=50-6.5×5=17.5.于是,线性回归方程为y=17.5+6.5x.【规律总结】求线性回归方程的步骤为:(1)计算平均数x,y;(2)计算x21+x22+…+x2n;(3)计算x1y1+x2y2+…+xnyn;(4)将上述有关结果代入公式:b=x1y1+x2y2+…+xnyn-nxyx21+x22+…+x2n-nx2,a=y-bx,求得b,a;(5)写出方程y=a+bx.班主任为了对本班学生的考试成绩进行分析,决定从全班25名女同学,15名男同学中随机抽取一个容量为8的样本进行分析.随机抽出8名,他们的数学成绩从小到大排序是:60、65、70、75、80、85、90、95,物理成绩从小到大排序是:72、77、80、84、88、90、93、95.(1)如果按性别比例分层抽样,男女同学分别抽取多少人?(2)若这8名同学的数学、物理成绩对应如下表:学生编号12345678数学成绩x6065707580859095物理成绩y7277808488909395根据上表数据用变量y与x的相关系数或散点图说明物理成绩y与数学成绩x之间是否具有线性相关性?如果具有线性相关性,求y与x的线性回归方程(系数精确到0.01);如果不具有线性相关性,请说明理由.参考数据:x=77.5,y≈85,i=18(xi-x)2=1050,i=18(yi-y)2≈457,i=18(xi-x)(yi-y)≈688,1050≈32.4,456≈21.4,550≈23.5.解:(1)应选女生25×840=5(人),男生15×840=3(人).(2)若以数学成绩x为横坐标,物理成绩y为纵坐标做散点图(图略),从散点图可以看出这些点大致分布在一条直线附近,并且在逐步上升,故物理成绩与数学成绩是高度正相关,设y与x线性回归方程y=bx+a,根据所给的数据,可以计算出b=6881050≈0.66,a=85-0.66×77.5=33.85,所以y与x的线性回归方程为y=0.66x+33.85.某医院用光电比色计检查尿汞时,得尿汞含量(毫克/升)与消光系数如下表:尿汞含量x246810消光系数y64134205285360(1)作散点图;(2)如果y与x之间具有线性相关关系,求线性回归方程;(3)估计尿汞含量为9毫克/升时的消光系数.【解】(1)散点图见下图.(2)x=6,y=209.6,其他数据如表:ixiyix2ixiyi12644128241341653636205361230482856422805103601003600合计3010482207774∴b=7774-5×6×209.6220-5×62=148640=37.15.a=209.6-37.15×6=-13.3,∴线性回归方程为y=-13.3+37.15x.(3)当x=9时,y=-13.3+37.15×9=321.05≈321,即估计尿汞含量为9毫克/升时消光系数约为321.【规律总结】用线性回归方程估计总体的一般步骤:(1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,用公式求出a、b并写出线性回归方程;(3)根据线性回归方程对总体进行估计.随着网络的普及,网上购物的方式已经受到越来越多的年轻人青睐,某家网络店铺商品的成交量x(件)与店铺的浏览量y(次)之间的对应数据如下表所示:x/件24568y/次3040506070(1)画出表中数据的散点图;(2)根据表中的数据,求出y关于x的回归直线方程;(3)当这种商品的成交量突破100件(含100件)时,预测这家店铺的浏览量至少为多少.解:(1)散点图如图所示.(2)根据散点图,变量x与y之间具有线性相关关系.数据列成下表:ixiyix2ixiyi1230460244016160355025250466036360587064560合计252501451390由上表计算出x=255=5,y=2505=50,代入公式得b=i=15xiyi-5xyi=15x2i-5x2=1390-5×5×50145-5×52=7,a=y-bx=50-7×5=15.故所求的线性回归方程是y=15+7x.(3)根据上面求出的线性回归方程,当成交量突破100件(含100件),即x=y-157≥100时,y≥715,所以预测这家店铺的浏览量至少为715次.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程y=bx+a,其中b=-20;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【错解】(1)x=16×(8+8.2+8.4+8.6+8.8+9)=8.5,y=16×(90+84+83+80+75+68)=80.∴a=bx-y=-20×8.5-80=-250.则回归直线方程为y=-250x-20.(2)设工厂获得的利润为L元,由题意得,L=x(-250x-20)-4(-250x-20)=-250x2+9980x+80.当且仅当x=-99802×-250=19.96时,L取得最大值.∴当单价定为19.96元时,工厂可获得最大利润.【错因分析】对公式记忆错误,将回归方程中的b与直线y=kx+b中的截距混淆.【正解】(1)x=16×(8+8.2+8.4+8.6+8.8+9)=8.5.y=16×(90+84+83+80+75+68)=80.所以a=y-bx=80+20×8.5=250,从而回归直线方程为y=-20x+250.(2)设工厂获得的利润为L元,依题意得,L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20(x-8.25)2+361.25.当且仅当x=8.25时,L取得最大值,故当单价定为8.25元时,工厂可获得最大利润.即学即练稳操胜券基础知识达标知识点一线性回归方程的意义1.变量y与x之间的线性回归方程()A.表示y与x之间的函数关系B.表示y与x之间的不确定性关系C.反映y与x之间真实关系的形式D.反映y与x之间的真实关系达到最大限度的吻合答案:D2.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y^=0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg解析:由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确;又线性回归方程必过样本中心点(x,y),故B正确;由线性回归方程中x的系数知,x每增加1cm,则其体重约增加0.85kg,故C正确;当该大学生身高为170cm时,其体重的估计值为58.79kg,不是准确的,故D不正确.答案:D3.下列说法正确的有()①线性回归方程适用于一切样本和总体;②线性回归方程一般都有局限性;③样本取值的范围会影响线性回归方程的适用范围;④根据线性回归方程得到的值是预报变量的精确值.A.①②B.②③C.③④D.①③解析:根据线性回归方程的概念和特征可作出判断:①④不正确,②③正确.答案:B知识点二求线性回归方程4.在一次试验中,测得(x,y)的四组值分别是(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的回归直线方程为()A.y=x+1B.y=x+2C.y=2x+1D.y=x-1解析:x=1+2+3+44=2.5,y=2+3+4+54=3.5,∵回归直线方程过样本中心点(2.5,3.5),代入验证知应选A.答案:A5.已知变量x,y具有线性相关关系,在某次试验中测得(x,y)的四组值为(0,2),(3,3),(-3,0),(6,5),求y与x之间的回归方程.解:由题意得x=0+3-3+64=1.5,y=2+3+0+54=2.5,x1y1+x2y2+x3y3+x4y4=0×2+3×3+(-3)×0+6×5=39,x21+x22+x23+x24=02+32+(-3)2+62=54,∴b=39-4×1.5×2.554-4×1.52=815,a=y-bx=2.5-815×1.5=1.7,∴回归方程为y=815x+1710.
本文标题:2019-2020学年高中数学 第一章 统计 8 最小二乘估计课件 北师大版必修3
链接地址:https://www.777doc.com/doc-8285737 .html