您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 高中数学人教版选修12同课异构教学课件11回归分析的基本思想及其初步应用探究导学课型
第一章统计案例1.1回归分析的基本思想及其初步应用【阅读教材】根据下面的知识结构图阅读教材,进一步掌握线性回归分析方法,了解判断线性回归模型的拟合效果的方法,初步认识解决非线性回归问题的方法.【知识链接】1.回归分析回归分析是对具有不确定性关系的两个变量进行统计分析的一种方法.2.线性回归分析步骤基本步骤为画散点图,求线性回归方程,用线性回归方程进行预报.主题一:回归分析的相关概念【自主认知】1.一台机器由于使用时间较长,生产的零件有一些会有缺陷.按不同转速生产出有缺陷的零件的统计数据如下:转速x(转/秒)1614128每小时生产有缺陷的零件数y(件)11985在平面直角坐标系中作出散点图.提示:散点图如图2.从散点图中判断x和y之间是否具有相关关系.提示:点分布在一条直线附近,所以有相关关系.3.若转速为10转/秒,能否预测机器每小时生产有缺陷的零件件数?提示:可以.根据散点图作出一条直线,求出直线方程后可预测.根据以上探究,完成以下填空.1.相关关系与函数关系相关关系是一种非确定性关系,_________是对具有相关关系的两个变量进行统计分析的一种常用方法,函数关系是一种_______关系.回归分析确定性2.在线性回归模型y=bx+a+e中,最小二乘估计和就是未知参数a和b的最好估计,其计算公式如下:其中,另外,______称为样本点的中心,回归直线一定过样本点中心.b________________,a_________,niii1n2ii1(xx)(yy)(xx)ybxnniii1i111xx,yy,nn(x,y)ba【合作探究】1.线性回归模型是函数关系吗?提示:y=bx+a+e与函数关系不同,在回归模型中,y的值由x和随机误差e共同确定,即x只能解释部分y的变化.因此有时我们把x称为解释变量,把y称为预报变量.2.回归分析中,利用线性回归方程求出的函数值一定是真实值吗?为什么?提示:不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动等.3.回归模型y=bx+a+e中e是什么,它有怎样的作用?提示:e是随机误差.它的主要作用是提供选择模型的准则以及在模型合理的情况下探求最佳估计值a,b的工具.【过关小练】1.下列有关回归直线方程=x+的叙述:①反映与x之间的函数关系;②反映y与x之间的函数关系;③表示与x之间的不确定关系;④表示最接近y与x之间真实关系的一条直线.其中正确的是()A.①②B.②③C.③④D.①④ybayy【解析】选D.=x+表示与x之间的函数关系,而不是y与x之间的函数关系,但它反映的关系最接近y与x之间的真实关系.故选D.ybay2.设变量y对x的线性回归方程为=2-2.5x,则变量x每增加一个单位时,y平均()A.增加2.5个单位B.增加2个单位C.减少2.5个单位D.减少2个单位【解析】选C.回归直线的斜率=-2.5,表示x每增加一个单位,y平均减少2.5个单位.yb主题二:线性回归分析【自主认知】1.在进行回归分析时由样本数据一般为什么先作出散点图?提示:作散点图的意义在于能直观明了地观察两变量间到底存在怎样的关系,从而确定回归模型.2.得到线性回归模型后为何要进行残差分析,其作用是什么?提示:得到线性回归模型后进行残差分析,可以判断原始数据中是否存在可疑数据,并检验模型的拟合效果,以便更准确地进行预报.根据以上探究,完成以下填空.刻画回归效果的形式(1)残差分析:①残差图:作图时纵坐标为_____,横坐标可以选为_________,或_________,或___________等,这样作出的图形称为残差图.②残差分析:残差点比较_____地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度_____,说明模型拟合精度越高,回归方程的预报精度越高.残差样本编号身高数据体重估计值均匀越窄(2)残差平方和:公式残差平方和为(yi-i)2.刻画方式残差平方和_____,模型拟合效果越好.yni1越小(3)相关指数R2:公式R2=1-_____________意义R2表示_____变量对于_____变量变化的贡献率.刻画方式R2越_____于1,表示回归的效果越好.n2iii1n2ii1(yy)(yy)解释预报接近【合作探究】1.要确定回归方程,需确定的量是什么?提示:要确定回归方程,关键是确定和的值.2.相关指数R2的作用是什么?提示:利用相关指数R2可以刻画数据拟合效果的好坏.在线性回归模型中,R2的值越接近1,说明残差平方和越小,即说明模型的拟合效果越好.ba【拓展延伸】非线性回归分析(1)非线性相关关系:样本点分布在某一条曲线的周围,而不是一条直线附近,我们就称这两个变量之间不具有线性相关关系而是非线性相关关系.(2)非线性回归方程线性化①y=axn(其中a,x,y均为正值)(幂函数型函数)lgy=lga+nlgx,令u=lgy,v=lgx,b=lga,则u=nv+b,图象为一直线.②y=cax(a0,c0)(指数型函数)lgy=xlga+lgc,令u=lgy,b=lgc,d=lga,则u=dx+b,图象为一直线.【过关小练】1.有下列数据:x123y35.9912.01下列四个函数中,模拟效果最好的为()A.y=3×2x-1B.y=log2xC.y=3xD.y=x2【解析】选A.当x=1,2,3时,分别代入求y值,离y最近的值模拟效果最好,知A模拟效果最好.2.已知方程=0.85x-85.7是根据女大学生的身高预报体重的回归方程,其中x,的单位分别是cm,kg,则该方程在样本(165,57)处的残差是.【解析】当x=165时,=0.85×165-85.7=54.55,所以方程在样本(165,57)处的残差是57-54.55=2.45.答案:2.45yyy【拓展延伸】1.对非线性回归分析的认识在大量的实际问题中,研究的两个变量不一定都呈线性相关关系,它们之间可能呈指数关系或对数关系或二次函数关系等非线性关系,可以通过变换(选择恰当的函数)化为线性关系得到回归直线方程,再通过相应变换得到非线性回归方程.2.判断残差图异常的两个依据(1)个别数据对应残差过大.(2)残差呈现不随机的规律性.【归纳总结】对线性回归分析的四点说明(1)由线性回归方程给出的是一个预报值而非精确值.(2)随机误差的主要来源①线性回归模型与真实情况引起的误差;②省略了一些因素的影响产生的误差;③观测与计算产生的误差.(3)残差分析是回归分析的一种方法.(4)用相关指数R2来刻画回归效果.R2越大,意味着残差平方和越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差.类型一:回归分析的概念【典例1】(1)有下列说法:①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归方程=x+,可以估计和观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个回归直线方程,所以没有必要进行相关性分析.其中正确命题的个数是()A.1B.2C.3D.4yba(2)某产品的广告费用x与销售额y的统计数据如下表广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元ybab【解题指南】(1)根据相关概念及其性质逐一判断得出结论.(2)利用回归直线方程过定点()求解.xy,【解析】(1)选C.①反映的正是最小二乘法思想,故正确.②反映的是画散点图的作用,也正确.③解释的是回归方程=x+的作用,故也正确.④是不正确的,在求线性回归方程之前必须进行相关性分析,以体现两变量的关系.(2)选B.易求得=3.5,=42,则将(3.5,42)代入=x+中得:42=9.4×3.5+,即=9.1,则=9.4x+9.1,所以当广告费用为6万元时销售额为9.4×6+9.1=65.5(万元).ybaxyybaaay【规律总结】回归分析的四个关注点(1)收集数据:随机抽取样本,确定数据,形成样本点.(2)画散点图:由样本点形成散点图,判断是否具有线性相关关系.(3)求回归直线方程:若线性相关,由最小二乘法确定回归直线方程.(4)看趋势:由回归方程观察变量的取值及变化趋势.【巩固训练】关于变量y与x之间的回归直线方程叙述正确的是()A.表示y与x之间的一种确定性关系B.表示y与x之间的相关关系C.表示y与x之间的最真实的关系D.表示y与x之间真实关系的一种效果最好的拟合【解析】选D.回归直线方程能最大可能地反映y与x之间的真实关系,故选项D正确.【补偿训练】下列说法正确的有()①回归方程适用于一切样本和总体;②回归方程一般都有时间性;③样本取值的范围会影响回归方程的适用范围;④回归方程得到的预报值是预报变量的精确值.A.①②B.①③C.②③D.③④【解析】选C.①回归方程只适用于我们研究的样本和总体.②我们所建立的回归方程一般都有时间性.③样本取值的范围会影响回归方程的适用范围.④回归方程得到的预报值是预报变量可能取值的平均值,并非精确值,故②③正确.类型二:线性回归分析【典例2】已知某商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:x1416182022y1210753(1)画出y关于x的散点图.(2)求出回归直线方程.【解题指南】正确利用求线性回归方程的步骤解答.5522iii1i155522iiiiii1i1i1x18,y7.4,x1660,y327,xy620,(yy)0.3,(yy)53.2).(参考数据:【解析】(1)画散点图:52ii1552iiii1i15iii1522ii12x18,y7.4,x1660,y327,xy620,xy5xy1.15.x5xayx28.1,1.15x28.1.所以bb所以回归直线方程为y【延伸探究】1.(改变问法)若本题条件不变,计算R2的值,并说明回归模型拟合程度的好坏.【解析】回归模型拟合效果很好.52iii1(yy)0.3,52ii152ii2i152ii1(yy)53.2,(yy)R10.994.(yy)2.(改变问法)在本题条件不变的情况下,画出残差图.【解析】【规律总结】建立回归模型的一般步骤【拓展延伸】残差图的分析方法(1)残差图的纵坐标为残差,横坐标通常可以是样本编号、解释变量或预报变量等,残差图是一种散点图.(2)残差散点图中的残差点比较均匀地落在水平的带状区域中,并且沿水平方向散点的分布规律相同,说明残差是随机的,所选择的回归模型建模是合理的,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.(关键词:残差点比较均匀地落在水平带状区域中)【补偿训练】甲、乙、丙、丁4位同学各自对A,B两变量做回归分析,分别得到散点图与残差平方和如下表:n2iii1(yy),甲乙丙丁散点图残差平方和115106124103哪位同学的试验结果体现拟合A,B两变量关系的模型拟合精度高?()A.甲B.乙C.丙D.丁【解析】选D.从散点图上来看,丁同学的散点图中的点更加近似在一条直线附近;从残差平方和来看,丁同学的最小,说明拟合精度最高.类型三:非线性回归分析【典例3】在一次抽样调查中测得样本的5个样本点,数据如下表:x0.250.5124y1612521求y与x之间的回归方程.【解题指南】先画散点图,再选择合适的回归方程求解.本题样本点不是线性相关的,因而可通过代换转化为线性相关的两个变量来求解.【解析】画出散点图,如图所示,观察可知y与x近似是反比例函数关系.设y=(k≠0),令t=,则y=kt.可得
本文标题:高中数学人教版选修12同课异构教学课件11回归分析的基本思想及其初步应用探究导学课型
链接地址:https://www.777doc.com/doc-5887613 .html