您好,欢迎访问三七文档
第三章统计案例3.1回归分析的基本思想及其初步应用第三章统计案例考点学习目标核心素养线性回归方程会利用散点图分析两个变量是否存在相关关系,会用最小二乘法求线性回归方程直观想象、数学运算、数据分析线性回归分析会用残差及R2来刻画线性回归模型的拟合效果数学运算、数据分析、数学建模非线性回归分析能记住建立回归模型的方法和步骤,能知道如何利用线性回归模型求非线性回归模型数学建模、数据分析问题导学预习教材P80~P89的内容,并思考下列问题:1.什么是回归分析?2.什么是线性回归模型?3.求线性回归方程的步骤是什么?4.如何进行线性回归分析和非线性回归分析?1.回归分析回归分析是对具有__________的两个变量进行统计分析的一种常用方法,回归分析的基本步骤是______________________,________________,并用回归直线方程进行预报.相关关系画出两个变量的散点图求回归直线方程2.线性回归模型(1)在线性回归直线方程y^=a^+b^x中,b^=∑ni=1(xi-x—)(yi-y—)∑ni=1(xi-x—)2,a^=__________,其中x—=__________,y—=__________,(x—,y—)称为______________,回归直线过样本点的中心.(2)线性回归模型y=bx+a+e,其中e称为__________,自变量x称为______变量,因变量y称为______变量.y—-b^x—1n∑ni=1xi1n∑ni=1yi样本点的中心随机误差解释预报3.刻画回归效果的方式方式方法计算公式刻画效果R2R2=________________R2越_________,表示回归的效果越好1-∑ni=1(yi-y^i)2∑ni=1(yi-y—)2接近于1方式方法计算公式刻画效果残差图e^i称为相应于点(xi,yi)的残差,e^i=________残差点__________地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度______,说明模型拟合精度越高,回归方程的预报精度越高残差平方和∑ni=1(yi-y^i)2残差平方和越____,模型的拟合效果越好yi-y^i比较均匀越窄小■名师点拨(1)对回归分析的理解回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法.按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析.(2)随机误差与残差随机误差是在建模的时候引入,用来解释由于数据本身具有测量误差而导致的最终结果与实际数值的偏差.而残差是回归分析得到的估计值与实际值的偏差.判断正误(正确的打“√”,错误的打“×”)(1)求线性回归方程前可以不进行相关性检验.()(2)在残差图中,纵坐标为残差,横坐标可以选为样本编号.()(3)利用线性回归方程求出的值是准确值.()×√×对于自变量x和因变量y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫做()A.函数关系B.线性关系C.相关关系D.回归关系解析:选C.对于自变量x和因变量y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫相关关系.已知回归方程y^=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是()A.0.01B.0.02C.0.03D.0.04解析:选C.因为残差e^i=yi-y^i,所以残差平方和为(4.9-5)2+(7.1-7)2+(9.1-9)2=0.03.如图是一组数据(x,y)的散点图,经最小二乘法计算,y与x之间的线性回归方程为y^=b^x+1,则b^=________.解析:x—=0+1+3+44=2,y—=0.9+1.9+3.2+4.44=2.6,将(2,2.6)代入y^=b^x+1,解得b^=0.8.答案:0.8在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x之间的一组观察值如下表.x(s)5101520304050607090120y(μm)610101316171923252946(1)画出散点图;(2)求y与x之间的线性回归方程;(3)利用线性回归方程预报时间为100s时腐蚀深度为多少.线性回归方程【解】(1)散点图如图所示.(2)从散点图中,我们可以看出y与x的样本点分布在一条直线附近,因而求回归直线方程有意义.x—=111(5+10+15+…+120)=51011,y—=111(6+10+10+…+46)=21411,∑11i=1xiyi=5×6+10×10+15×10+…+120×46=13910,∑11i=1x2i=52+102+152+…+1202=36750,所以b^=∑11i=1xiyi-11x—y—∑11i=1x2i-11x—2=13910-11×51011×2141136750-11×510112≈0.304.a^=y—-b^x—=21411-0.304×51011=5.36.故腐蚀深度与腐蚀时间之间的线性回归方程为y^=0.304x+5.36.(3)根据(2)求得的线性回归方程,当腐蚀时间为100s时,y^=5.36+0.304×100=35.76(μm),即腐蚀时间为100s时腐蚀深度为35.76μm.求线性回归方程的三个步骤(1)画散点图:由样本点是否呈条状分布来判断两个量是否具有线性相关关系.(2)求回归系数:若存在线性相关关系,则求回归系数.(3)写方程:写出线性回归方程,并利用线性回归方程进行预报说明.1.一位母亲记录了自己儿子3~9岁的身高数据(略),由此建立的身高与年龄的回归模型为y^=7.19x+73.93,用这个模型预报这个孩子10岁时的身高,则正确的叙述是()A.身高一定是145.83cmB.身高在145.83cm以上C.身高在145.83cm左右D.身高在145.83cm以下解析:选C.由回归模型可得y^=7.19×10+73.93=145.83,所以预报这个孩子10岁时的身高在145.83cm左右.2.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x与冶炼时间y(从炼料熔化完毕到出钢的时间)的数据(xi,yi)(i=1,2,…,10)并已计算出i=110xi=1598,i=110yi=1720,i=110x2i=265448,i=110xiyi=287640,试求冶炼时间y与钢水的含碳量x之间的回归方程.解:由i=110xi=1598,i=110yi=1720,可得x—=110i=110xi=159.8,y—=110i=110yi=172.故可得b^=i=110xiyi-10x—y—i=110x2i-10x—2=287640-10×159.8×172265448-10×159.82≈1.267.a^=y—-b^x—=172-1.267×159.8≈-30.47.故冶炼时间y与钢水的含碳量x之间的回归方程为y^=1.267x-30.47.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:x15.025.830.036.644.4y39.442.942.943.149.2(1)以x为解释变量,y为预报变量,作出散点图;(2)求y与x之间的回归方程,对于基本苗数为56.7时预报有效穗;(3)计算各组残差,并计算残差平方和;(4)求相关指数R2,并说明残差变量对有效穗的影响占百分之几?线性回归分析【解】(1)散点图如下.(2)由图看出,样本点呈条状分布,有比较好的线性相关关系,因此可以用回归方程刻画它们之间的关系.设回归方程为y^=b^x+a^,x—=30.36,y—=43.5,i=15x2i=5101.56,x—y—=1320.66,x—2=921.7296,i=15xiyi=6746.76.由b^=i=15xiyi-5x—y—i=15x2i-5x—2≈0.29,a^=y^-b^x—=43.5-0.29×30.36≈34.70.故所求的线性回归方程为y^=34.70+0.29x.当x=56.7时,y^=34.70+0.29×56.7=51.143.估计成熟期有效穗为51.143.(3)由于y=bx+a+e,,可以算得e^i=yi-y^1分别为e^1=0.35,e^2=0.718,e^3=-0.5,e^4=-2.214,e^5=1.624,残差平方和i=15e2i≈8.43.(4)i=15(yi-y—)2=50.18,所以R2=1-8.4350.18≈0.832.所以解释变量小麦基本苗数对有效穗约贡献了83.2%.残差变量贡献了约1-83.2%=16.8%.(1)该类题属于线性回归问题,解答本题应先通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.(2)刻画回归效果的三种方法①残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适;②残差平方和法:残差平方和i=1n(yi-y^i)2越小,模型的拟合效果越好;③相关指数法:R2=1-i=1n(yi-y^i)2i=1n(yi-y—)2越接近1,表明回归的效果越好.为研究质量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同质量的6个物体进行测量,数据如表所示:x51015202530y7.258.128.959.9010.911.8(1)作出散点图,并求线性回归方程;(2)求出R2;(3)进行残差分析.解:(1)散点图如图所示.因为x—=16×(5+10+15+20+25+30)=17.5,y—=16×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,i=16x2i=2275,i=16xiyi=1076.2.计算得b^≈0.183,a^≈6.285,所以所求线性回归方程为y^=6.285+0.183x.(2)列表如下:,yi-y^i0.050.005-0.08-0.0450.040.025yi-y—-2.24-1.37-0.540.411.412.31所以i=16(yi-y^i)2≈0.01318,i=16(yi-y—)2=14.6784.所以R2=1-0.0131814.6784≈0.9991,所以回归模型的拟合效果较好.(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与质量成线性关系.菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但采集上市时蔬菜仍存有少量的残留农药,食用时需要用清水清洗干净,下表是用清水x(单位:千克)清洗该蔬菜1千克后,蔬菜上残留的农药y(单位:微克)的统计表:x12345y5854392910非线性回归分析(1)令ω=x2,利用给出的参考数据求出y关于ω的回归方程y^=b^ω+a^.(a^,b^精确到0.1)参考数据:i=15ωi=55,i=15(ωi-ω—)(yi-y—)=-751,i=15(ωi-ω—)2=374,其中ωi=x2i,ω—=15i=15ωi.(2)对于某种残留在蔬菜上的农药,当它的残留量不高于20微克时对人体无害,为了放心食用该蔬菜,请估计至少需要用多少千克的清水清洗1千克蔬菜?(精确到0.1,参考数据5≈2.24)附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v^=α^+β^u的斜率和截距的最小二乘估计分别为β^=i=1n(ui-u—)(vi-v—)i=1n(ui-u—)2,α^=v—-β^u—.【解】(1)由题意得,ω—=11,y—=38.b^=i=15(ωi-ω—)(yi-y—)i=15(ω
本文标题:2019-2020学年高中数学 第三章 统计案例 3.1 回归分析的基本思想及其初步应用课件 新人教
链接地址:https://www.777doc.com/doc-8287833 .html