您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 高中数学31回归分析的基本思想及其初步应用第1课时教案新人教版选修23
§3.1回归分析的基本思想及其初步(1)【学情分析】:教学对象是高二理科学生,学生已经初步学会用最小二乘法建立线性回归模型的知识,并能用所学知识解决一些简单的实际问题。回归分析是数理统计中的重要内容,在教学中,要结合实例进行相关性检验,理解只有两个变量相关性显著时,回归方程才具有实际意义。在起点低的班级中注重让学生参与实践,结合画图表的方法整理数据,鼓励学生通过收集数据,经历数据处理的过程,从而认识统计方法的特点,达到学习的目的。【教学目标】:(1)知识与技能:回忆线性回归模型与函数模型的差异,理解用最小二乘法求回归模型的步骤,了解判断两变量间的线性相关关系的强度——相关系数。(2)过程与方法:本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线方程。(3)情感态度与价值观:从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲,培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。【教学重点】:1.了解线性回归模型与函数模型的差异;2.了解两变量间的线性相关关系的强度——相关系数。【教学难点】:1.了解两变量间的线性相关关系的强度——相关系数;2.了解线性回归模型与一次函数模型的差异。【教学过程设计】:教学环节教学活动设计意图一、创设情境问题一:一般情况下,体重与身高有一定的关系,通常个子较高的人体重比较大,但这是否一定正确?(是否存在普遍性)师:提出问题,引导学生判断体重与身高之间的关系(函数关系、相关关系)生:思考、讨论。问题二:统计方法解决问题的基本过程是什么?师:提出问题,引导学生回忆用最小二乘法求回归直线方程的方法。生:回忆、叙述回归分析的基本过程:⑴画出两个变量的散点图;⑵判断是否线性相关⑶求回归直线方程(利用最小二乘法)⑷并用回归直线方程进行预报复习回归分析用于解决什么样的问题。复习回归分析的解题步骤二、例题选讲探究活动:对于一组具有线性相关的数据(x1,y1),(x2,y2)……,(xn,yn),我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:^a=y+^bx,复习统计方法解决问题的基本过程。学生动手画散^b=niiiinixxyyxx121)())((其中x=n1niix1,y=n1niiy1.(x,y)称为样本点的中心。你能推导出这两个计算公式吗?从已经学过的知识我们知道,截距^a和斜率^b分别是使Q(α,β)=niiixy12)(取最小值时α,β的值。由于Q(α,β)=niii]xyxyx[y12)()(=niiiii}]xy[]xy]xyx[y]xyx{y122)()()(2)(=niii]xyx[y12)(+2niiixy]xyx[y1)()(+n(y-βx-α)2,注意到niiixy]xyx[y1)()(=(xy)niii]xyx[y1)(=(xy)[)(11xynxyniniii]=()xy[n)(xynxny]=0,所以Q(α,β)=niii]xyx[y12)(+n(xy)2=β2niixx12)(-2βniiiyyxx1))((+niiyy12)(点图,老师用EXCEL的作图工作演示,并引导学生找出两个变量之间的关系。学生经历数据处理的过程,并借助EXCEL的统计功能鼓励学生使用计算器或计算机等现代工具来处理数据。+n(2)xy=n(2)xy+niniiniiii]xxyyxx[xx121212)())(()(-niiniiixx]yyxx[1221)())((+niiyy12)(在上式中,后两项和α,β无关,而前两项为非负数,因此要Q取得最小值,当且仅当前两项的值均为0,即有β=niiniiixxyyxx121)())((,α=xy.这正是我们所要推导的公式。下面我们通过案例,进一步学习学习回归分析的基本思想及其应用。问题三:思考例1:从某大学中随机选取8名女大学生,其身高和体重数据如表所示。求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。编号12345678身高/cm165165157170175165155170体重/kg4857505464614359题目中表达了哪些信息?师:读例1的要求,引导学生理解例题含义。(例题含义:①数据体重与身高之间是一种不确定性的关系②求出以身高为自变量x,体重为因变量y的回归方程。③由方程求出当x=172时,y的值。生:思考、讨论、叙述自己的理解,归纳出题目中的信息。根据以前所学的知识,让学生自己动手求出回归方程求解过程如下:①画出散点图,判断身高x与体重y之间存在什么关系(线性关系)?②列表求出相关的量,并求出线性回归方程代入公式有848.025.16582187745.5425.165872315ˆ22121xnxyxnyxbniiniii712.8525.165849.05.54ˆxbya所以回归方程为712.85849.0ˆˆˆxxbay③利用回归方程预报身高172cm的女大学生的体重约为多少?当172x时,kgy316.60712.85172849.0ˆ引导学生复习总结求线性回归方程的步骤:第一步:作散点图—→第二步:求回归方程—→第三步:代值计算三、探究新知问题四:身高为172cm的女大学生的体重一定是60.316kg吗?(不一定,但一般可以认为她的体重在60.316kg左右.)师:提出问题,引导学生比较函数模型与线性回归模型的不同,并引出相关系数的作用。生:思考、讨论、解释解释线性回归模型与一次函数的不同从散点图可观察出,女大学生的体重y和身高x之间的关系并不能用一次函数ybxa来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系).在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同.这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果e(即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型引导学生了解线性回归模型与一次函数的不同40455055606570150155160165170175180ybxae,其中残差变量e中包含体重不能由身高的线性函数解释的所有部分.当残差变量恒等于0时,线性回归模型就变成一次函数模型.因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.问题五:如何衡量两个变量之间线性相关关系的强弱呢?相关系数:niniiiniiiyyxxyyxxr11221相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义;相关系数的绝对值越接近于0,两个变量的线性相关关系几乎不存在,它们的散点图越离散,通常当r大于75.0时,认为两个变量有很强的线性相关关系。问题六:例1中由体重与身高建立的线性相关关系有无意义?生:动手计算本例中两个变量之间的相关系数,798.0r,表明体重与身高有很强的线性相关关系,从而表明我们建立的回归模型是有意义的。引导学生在解决具体问题的过程中,通常先进行相关性的检验,确认两变量间的线性相关关系的强弱再求线性回归方程。结合实例的分析和研究,正确地进行相关性检验。四、巩固练习1.假设关于某设备的使用年限x和支出的维修费用y(万元),有如下表的统计资料。试求:使用年限x23456维修费用y2.23.85.56.57.0⑴画出数据的散点图;⑵若x与y呈线性相关关系,求线性回归方程y=bx+a的回归系数a、b;⑶估计使用年限为10年时,维修费用是多少?答案:⑴散点图如图:⑵由已知条件制成下表:i12345ix23456ix2.23.85.56.57.0iiyx4.411.422.032.542.02ix491625364x;5y;niix1290;niiiyx13.112巩固知识01234567802468xiyi于是有23.1103.1245905453.112ˆ2b08.0423.15ˆˆxbya⑶回归直线方程是08.023.1ˆxy,当10x时,38.1208.01023.1y(万元)即估计使用10年时维修费用是12.38万元。五、小结1.熟练掌握求线性回归方程的步骤;⑴画出两个变量的散点图;⑵判断是否线性相关;⑶求回归直线方程(利用最小二乘法);⑷并用回归直线方程进行预报。2.理解线性回归模型与一次函数的不同;一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.3.了解相关系数的计算与解释。相关系数:niniiiniiiyyxxyyxxr11221相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义;相关系数的绝对值越接近于0,两个变量的线性相关关系几乎不存在,它们的散点图越离散,通常当r大于75.0时,认为两个变量有很强的线性相关关系。反思归纳练习与测试1.设有一个回归方程为xy5.22ˆ,则变量x增加一个单位时,则(C)A.y平均增加5.2个单位B.y平均增加2个单位C.y平均减少5.2个单位D.y平均减少2个单位2.在画两个变量的散点图时,下面哪个叙述是正确的(B)A.预报变量在x轴上,解释变量在y轴上B.解释变量在x轴上,预报变量在y轴上C.可以选择两个变量中任意一个变量在x轴上D.可以选择两个变量中任意一个变量在y轴上3.已知x与y之间的一组数据:则y与x的线性回归方程为axbyˆˆˆ必过(D)A.(2,2)点B.(1.5,0)点C.(1,2)点D.(1.5,4)点4.已知两个相关变量x与y具有线性相关关系,当x取值1,2,3,4时,通过观测得到y的值分别为1.2,4.9,8.1,12.8,这组样本点的中心是(D)A.(2,4.9)B.(3,8.1)C.(2.5,7)D.(2.5,6.75)5.一位母亲记录了儿子3—9岁的身高,数据(略),由此建立的身高与年龄的回归模型为y=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是(C)x0123y1357A.身高一定是145.83cmB.身高在145.83cm以上C.身高在145.83cm左右D.身高在145.83cm以下6.在一次实验中,测得(x,y)的四组值分别是A(1,2)、B(2,3)、C(3,4)D(4,5),则y与x之间的回归直线方程为(A)A.1ˆxyB.2ˆxyC.12ˆxyD.1ˆxy7.有下列关系:⑴人的年龄与其拥有的财富之间的关系;⑵曲线上的点与该点的坐标之间的关系;⑶苹果的产量与气候之间的关系;⑷森林中的同一树木,其横截面直径与高度之间的关系;⑸学生与其学号之间的关系。其中有相关关系的是__________。答案:⑴⑶⑷8.许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时,收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的回归直线方程如下:6.48.0xy。斜率的估计等于
本文标题:高中数学31回归分析的基本思想及其初步应用第1课时教案新人教版选修23
链接地址:https://www.777doc.com/doc-5887411 .html