您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 高中数学人教版选修12同课异构教学课件11回归分析的基本思想及其初步应用精讲优练课型
第一章统计案例1.1回归分析的基本思想及其初步应用【自主预习】1.回归分析(1)概念:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2)步骤:画_______→求_________→用回归方程进行_____.散点图回归方程预报2.线性回归模型(1)在线性回归方程=+x中,=____________=___________,=______,其中=_______,=_______,(,)称为变量_____________,回归直线过样本点的中心.abybniii1n2ii1(xx)yy(xx)()aybxxnii11xnynii11ynxyniii1n22ii1xynxyxnx样本点的中心(2)线性回归模型y=bx+a+e,其中e称为_________,自变量x称为_____变量,因变量y称为_____变量.随机误差解释预报3.刻画回归效果的方式残差把随机误差的估计值称为相应于点(xi,yi)的残差残差图作图时纵坐标为_____,横坐标可以选为__________,或_________,或___________等,这样作出的图形称为残差图ie残差样本编号身高数据体重估计值残差图法残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度_____,说明模型拟合精度越高残差平方和残差平方和为___________,残差平方和_____,模型拟合效果越好n2iii1(y-y)越窄越小相关指数R2R2=1-_________,R2表示_____变量对_____变量变化的贡献率,R2越接近于1,表示回归的效果越好n2iii1n2ii1(y-y)(y-y)解释预报【即时小测】1.对于两个变量x,y,若当x取一定值时,y的取值具有一定的随机性,x,y之间的这种非确定性关系叫做()A.函数关系B.线性相关C.相关关系D.回归分析【解析】选C.根据相关关系的定义知选C.2.散点图在回归分析过程中的作用是()A.统计个体个数B.比较个体数据的大小C.研究个体分类D.粗略判断变量是否线性相关【解析】选D.根据散点图的意义及作用知选D.3.在建立两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的相关指数R2如下,其中拟合效果最好的模型是()A.模型1的相关指数R2=0.98B.模型2的相关指数R2=0.80C.模型3的相关指数R2=0.50D.模型4的相关指数R2=0.25【解析】选A.因为回归模型的相关指数R2的值越大,拟合效果越好.4.已知回归方程=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和等于________.【解析】(4.9-5)2+(7.1-7)2+(9.1-9)2=0.03.答案:0.03y【知识探究】探究点1线性回归分析1.相关关系是确定性关系吗?提示:相关关系是一种不确定性的关系.2.具有线性相关关系的两个变量,其散点图具有什么特征?提示:散点图中的点大部分分布在一个带形区域内.即分布在某条直线的附近.【归纳总结】对回归分析的三点说明(1)回归分析的前提是两个变量之间具有相关关系.(2)对两个变量之间数量变化进行一般关系的测定,确定一个相应的数学表达式,即线性回归方程,达到由一个已知量推测或控制另一个变量的值的目标,是统计的一个重要方法.(3)线性回归方程是根据样本数据得到的一个确定性的函数关系,是用来对未知变量进行预测的,为了预测的效果更好,减小误差,应在求线性回归方程时尽量多地选取样本,选择代表性较强的样本,使得预测值尽量地接近真实值.特别提醒:在对两个变量进行线性回归分析时,要首先结合观察数据画出散点图,确定它们之间具有线性相关关系后,再进行线性回归分析.探究点2非线性回归分析1.如何评价回归模型拟合效果的优劣?提示:计算相关指数R2的值.R2越接近于1效果就越好.2.对于非线性回归模型,如何处理?提示:对于非线性回归模型可转化为线性回归模型来研究.【归纳总结】1.数据拟合效果的比较对于给定的样本点(x1,y1),(x2,y2),…,(xn,yn),两个含有未知参数的模型(1)和(2)其中a和b都是未知参数,可以按如下的步骤来比较它们的拟合效果:21yfx,ae,Ee0,De22ygx,b,E0,D,①分别建立对应于两个模型的回归方程=f(x,)与=g(x,),其中和分别是参数a和b的估计值.②分别计算模型(1)和模型(2)的R12,R22.③若R12>R22,则模型(1)的拟合效果比模型(2)好;若R12<R22,则模型(1)的拟合效果不如模型(2).(1)ya(2)ybab2.常见的几种变形形式(1)幂函数曲线y=axb.两边取对数变形为lny=lna+blnx,令y′=lny.x′=lnx,a′=lna,从而得到y′=a′+bx′.(2)指数函数曲线y=aebx.两边取对数变形为lny=lna+bx,令y′=lny,a′=lna,从而得到y′=a′+bx.(3)负指数函数曲线y=两边取对数变形为lny=lna+,令y′=lny,x′=,a′=lna,得y′=a+bx′.(4)对数函数曲线y=a+blnx.令x′=lnx,得y=a+bx′.bxae.bx1x类型一线性回归模型【典例】1.(2016·东营高二检测)有下列说法:①线性回归分析就是由样本点去寻找一条直线方程,刻画这些样本点之间的关系的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性相关表示;③通过线性回归方程及其回归系数,可以估计和预报变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确说法的个数是()A.1B.2C.3D.4ybxab2.(2014·湖北高考)根据如下样本数据得到的回归方程为,则()x345678y4.02.5-0.50.5-2.0-3.0ybxaA.a0,b0B.a0,b0C.a0,b0D.a0,b03.某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:(1)画出散点图.(2)求y关于x的回归方程.x24568y3040605070【解题探究】1.典例1中,给定两个变量的一组样本点数据,都能进行线性回归分析吗?提示:不是,只有当它们具有线性相关关系时,才能进行线性回归分析,否则没有意义.2.典例2中,回归直线方程中,,的几何意义是什么?提示:是回归直线的斜率.是回归直线在y轴上的截距.baba3.典例3中,画散点图的目的是什么?如何求关于x的回归直线方程?提示:画散点图的目的是分析变量x,y之间是否存在线性相关关系;利用最小二乘法求y关于x的回归直线方程.【解析】1.选C.①反映的是最小二乘法思想,是正确的;②反映的是散点图的作用,是正确的;③反映的是求线性回归方程的目的,也是正确的;④不正确,在求回归方程之前,必须进行相关性检验,以体现变量的相关关系.故有3个正确说法.ybxa2.选A.由散点图及,的意义知A正确.3.(1)散点图如图所示.ba(2)列出下表,并用科学计算器进行有关计算.i12345xi(百万元)24568yi(百万元)3040605070xiyi60160300300560552iiii1i1x5y50;x145;xy1380;于是可得=50-6.5×5=17.5.于是所求的回归方程是=6.5x+17.55iii152221i1xy5xy13805550b6.5,14555x5xaybxy【方法技巧】1.求线性回归方程的三个步骤(1)算:根据数据计算(2)代:代入公式求,的具体数值.(3)求:由上面的计算结果求方程nn2iiii1i1x,y,x,xy.baybxa.2.求线性回归方程的关键点相关性的验证:求线性回归方程前必须判断两个变量是否线性相关,如果两个变量本身不具备相关关系,或者它们之间的相关关系不显著,那么即使求出回归方程也是毫无意义的.特别提醒:回归直线一定过样本点的中心(,),这在很多问题的求解中起着很重要的作用.yx【变式训练】已知一个回归直线方程=1.5x+45,xi∈{1,5,7,13,19},则=()A.53.5B.55.5C.58.5D.60.5yy【解析】选C.因为回归直线过样本点的中心(),又所以=1.5+45=1.5×9+45=58.5.x,y1571319x9.5yx类型二线性回归分析【典例】为研究质量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同质量的6个物体进行测量,数据如表所示:x51015202530y7.258.128.959.9010.911.8(1)作出散点图,并求线性回归方程.(2)求出R2.(3)进行残差分析.【解题探究】本例中如何进行残差分析?提示:通过残差表或残差图进行残差分析.【解析】(1)散点图如图所示.因为×(5+10+15+20+25+30)=17.5,×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,=2275,=1076.2.计算得≈0.183,≈6.285,所以所求线性回归方程为=6.285+0.183x.1x61y662ii1x6iii1xybay(2)列表如下:0.050.005-0.08-0.0450.040.025-2.24-1.37-0.540.411.412.31iiyyiyy所以所以所以回归模型的拟合效果较好.62iii1(yy)0.01318,62ii1(yy)14.6784.20.01318R10.9991,14.6784(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与质量成线性关系.【延伸探究】1.在条件不变的情况下,画出残差图.【解析】如图所示:2.当x=35时,估计y的值.【解析】当x=35时,=6.285+0.183×35=12.69.y【方法技巧】残差分析的思路(1)要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.(2)通过残差来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这种分析工作称为残差分析,可以借助残差图来进行观察.12ne,e,e…,【补偿训练】对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是()【解析】选A.用残差图判断模型的拟合效果,残差点比较均匀地落在水平带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,拟合精度越高.故选A.类型三非线性回归分析【典例】电容器充电后,电压达到100V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式U=Aebt(b0)表示,现测得时间t(s)时的电压U(V)如下表:t/s012345678910U/V100755540302015101055试求电压U对时间t的回归方程.(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)【解题探究】本例中如何对等式“U=Aebt”变形,使其符合线性回归分析?提示:对U=Aebt两边取对数得lnU=lnA+bt,令y=lnU,a=lnA,x=t,则y=a+bx,进而借助线性回归分析求解,最后回代便可.【解析】对U=Aebt两边取对数得lnU=lnA+bt,令y=lnU,a=lnA,x=t,则y=a+bx,得y与x的数据如下表:x012345678910y4.64.34.03.73.43.02.72.32.31.61.6根据表中数据作出散点图,如图所示,从图中可以看出,y与x具有较强的线性相关关系,由表中数
本文标题:高中数学人教版选修12同课异构教学课件11回归分析的基本思想及其初步应用精讲优练课型
链接地址:https://www.777doc.com/doc-5887617 .html