您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 医学试题/课件 > 回归分析的基本思想及其初步应用第3课时
§1.1回归分析的基本思想及其初步(三)【学情分析】:教学对象是高二文科学生,学生已经学会建立回归模型的基本步骤,并有检验回归方程的拟合精确度的方法,并能解决一些实际问题。两个变量不呈线性关系,不能直接利用线性回归方程建立两个变量的关系,通过探究使学生体会对回归模型的选择,非线性模型可以通过变换转化为线性回归模型,让学生直观的观察、思考,借助于线性回归模型研究呈非线性关系的两个变量之间的关系,并通过回归分析体会不同模型拟合数据的效果。【教学目标】:(1)知识与技能:了解回归模型的选择;进一步理解非线性模型通过变换转化为线性回归模型;体会不同模型拟合数据的效果。(2)过程与方法:从实例出发,求出相应的回归直线方程,从中也找出存在的不足,从而有进行回归分析的必要性,通过学习相关指数,用相关指数来刻画回归的效果,进而归纳出回归分析的一般步骤,并对具体问题进行回归分析,用于解决实际问题。(3)情感态度与价值观:任何事物都是相对的,但又有一定的规律性,我们只要从实际出发,不断探求事物的内在联系,就会找出其中的规律性,形成解决实际问题的方法和能力。【教学重点】:1、加深体会有些非线性模型通过变换可以转化为线性回归模型;2、了解在解决问题的过程中寻找更好的模型的方法。【教学难点】:1、了解常用函数的图像特点,选择不同的模型建模;2、通过比较相关指数对不同的模型进行比较。【课前准备】:课件【教学过程设计】:教学环节教学活动设计意图一、复习引入问题一:你能回忆一下建立回归模型的基本步骤?师:提出问题,引导学生回忆建立回归模型的基本步骤(选变量、画散点图、选模型、估计参数、分析与预测)生:回忆、叙述建立回归模型的基本步骤复习建立线性回归模型的基本步骤二、探究新知问题二:观察例2的图1.1-6中的散点图,红铃虫的产卵数y与温度x的图像特点:随着自变量的增加,因变量也随之增加。这些点可以除了可以看作是落在指数函数模型上,还可以认为它是落在什么函数的模型上?师:引导学生观察散点图的特点,并引导学生探究红铃虫的产卵数y与温度x还可能是什么关系。(二次函数模型)生:讨论、回忆一些常见函数图像的特点,判断红铃虫的产卵数y与温度x的可能关系样本点还可以看作是分布在二次函数曲线221cxcy的周围。引导学生根据散点图判断两个变量的关系,使学生了解不是任何两个变量都一定是只有一种关系。产卵数与温度的关系050100150200250300350202224262830323436温度产卵数y/个问题三:对模型221cxcy是否有办法求参数1c和2c的最小二乘估计?师:从简单的模型入手,逐步引导学生思考把原来两个变量的非线性关系转化为另外两个变量的线性关系生:观察模型,探究变换的方法并发表自己的意见。最后给出具体的方法。令2xt,建立y与t之间的线性回归方程21ctcy问题四:经过变换后这个模型都转化为线性回归模型,你如何得到这几个线性回归模型的参数估计?师:提出问题,引导学生分组讨论,启发学生把原变量的观测数据转化为新变量的数据,然后让学生给出每种线性回归模型的参数估计。生:以组为单位进行数据变换,求参数的最小二乘估计(可以用计算器)解答过程如下:令1cb,2ca,即btay分析y与t之间的关系,通过画散点图(如下图),变换后样本点的散点图0501001502002503003504005006007008009001000110012001300t=x^2y可看到y与t的散点图并不分布在一条直线的周围,即不宜用线性回归方程来拟合它,即不宜用二次曲线221cxcy来拟合y与x之间的让学生知道有时因变量与自变量的非线性关系经过变换后可以转化为两个新变量间的线性关系使学生进一步体会把因变量与自变量的非线性关系经过变换后转化为另外两个变量的线性关系的方法。使学生熟悉线性回归模型的参数估计的方法得出红铃虫的产卵数y与温度x关系,这个结论还可以用残差分析得到。为比较两个不同模型的残差,需建立相应的回归模型,让学生用线性回归模型拟合回归方程btay。所以543.202367.0ty因为2xt,即y关于x的二次回归方程为543.202367.02xy。问题五:指数回归模型与二次回归模型中哪个能更好地刻画红铃虫的产卵数y与温度x的关系?通过什么数据说明?师:提出问题,引导学生回忆评价线性回归模型拟合好坏的标准(相关指数、残差平方和),进一步引导学生探讨如何进行不同模型的比较,介绍计算模型相关指导数和残差平方和的方法,说明一般在参数个数一定的条件下,相关指数越大或残差平方和越小说明模型拟合得越好。生:讨论,提出自己的想法,计算每个模型的相关指数,并进行模型的比较。指数函数模型的相关指数98.0ˆ112122niiniiiyyyyR二次函数模型的相关指数的模型引导学生尝试进行不同模型的比较。编号1234567合计温度x/°C21232527293235192产卵数y/个71121246611532556927.42981.2866.511.219.233.157.1129.2292.1548.374-74.3-70.3-60.3-57.3-15.333.7243.700.5-0.21.8-9.18.9-14.232.920.62575518.44940.13634.43281.7233.71136.759396.778141.40.270.033.1083.7079.01200.321084.261450.681450.6878141.4y关于x的指数回归方程xniiiniiyye1212ˆˆniiyy12y843.3272.0ˆxeyiyˆiiiyyeˆˆ22ˆˆiiiyye编号1234567合计温度x/°C21232527293235192产卵数y/个711212466115325569t=x2441529625729841102412255414ti2194481279841390625531441707281104857615006254652870tiyi308758191312517496555061177603981256109180.367773.42981.2864652870610918-202.543tniit12niiiyt1y2121ˆznxzxnzxbniiniiixbzaˆˆ从相关指数的计算结果来看,指数函数模型的2R比二次函数模型的2R更接近于1,所以指数函数模型的回归效果好。再从残差图看:从图中可看出指数函数模型的残差点比较均匀地落在水平的带状域中,所以指数函数模型拟合精度较二次函数模型的高。通过学生自己动手计算感受,归纳判断模型拟合效果的方法:⑴可以通过变换后的散点图观察两个新变量之间是否存在线性回归方程;⑵通过残差分析比较两种模型的拟合效果。一般情况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另一个模型的小,而另一些样本点的情况则相反),故通过比较两个模型的残差的平方和的大小来判断模型的拟合效果。残差平方和越小的模型,拟合的效果越好。三、练习某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:x123510203050100200y10.155.524.082.852.111.621.411.301.211.15检验每册书的成本费y与印刷册数倒数x1之间是否具有线性相关关系,如有,求出y对x的回归方程。分析:本题是非线性回归分析问题,不妨设变量xu1,题意要求对u与y作相关性检验,如果它们具有线性相关关系,就可以进一步求出y对u的回归直线方程,这时,再回代xu1,就得到了y对x的回归曲线方程。解:首先作变量置换xu1,题目所给数据变成如下表所示的10对数据:u10.50.330.20.10.050.030.020.010.005y10.155.524.082.852.111.621.411.301.211.15然后作相关性检验。经计算得75.09998.0r,从而认为u与y之间具有线性相关关系,由公式得125.1a,973.8b,所以uy973.8125.1ˆ,最后回代xu1,可得到y对x的回归曲线方程xy973.8125.1ˆ四、小结1.强调要借助散点图的直观性、联想已学过的基本函数图像、以及知识间的联系,鼓励学生在建模中大胆尝试;2.用回归方程探究非线性回归问题的方法、步骤;3.残差分析的步骤、作用。4.梳理本节书的知识结构让学生整理解决本例的思路,鼓励学生探究建立更好的模型。练习与测试1.在两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数2R如下,其中拟合效果最好的模型是(A)A.模型1的相关指数2R为98.0B.模型2的相关指数2R为80.0C.模型3的相关指数2R为50.0D.模型4的相关指数2R为25.0问题背景分析线性相关系数散点图两个变量线性相关两个变量非线性相关非线性回归模型线性回归模型最小二乘法残差分析相关指数应用2.已知两个变量的回归模型为xy22,则样本点的(1,4.4)的残差是_____________________答案:0.43.残差平方和用数学符号表示为___________________,它代表了随机误差的效应;解释变量的效应值称为回归平方和,可以用相关指数2R来刻画回归的效果,其计算公式是___________________。显然,2R的值越大,说明残差平方和越小,也就是说模型的拟合效果越好。答案:niiiyy12ˆ;niiniiiyyyyR12122ˆ1。4.在研究硝酸纳的可溶性程度时,对不同的温度观测它在水中的溶解度,得观测结果如下表所示:温度(x)010205070溶解度(y)66.776.085.0112.3128.0则由此得到的回归直线的斜率是____________。答案:0.88095.已知线性相关的两变量x,y的三个样本点A(0,0),B(1,3),C(4,11),若用直线AB作为其预测模型,则其相关指数2R________。答案:xyAB3ˆ,7y,0ˆ1y,3ˆ2y,12ˆ3y7ˆ1yy,4ˆ2yy,5ˆ3yy0ˆ1e,0ˆ2e,1ˆ3e989.090112R6.已知线性相关的两变量x,y的三个样本点A(0,0),B(1,3),C(4,11),若用直线AB作为其预测模型,则点C的残差是________。答案:xyAB3ˆ,12ˆCy,1ˆCe。7.若一组观测值(x1,y1)、(x2,y2)、…、(xn,yn)之间满足yi=bxi+a+ei(i=1、2.…n)若ei恒为0,则R2为答案:1
本文标题:回归分析的基本思想及其初步应用第3课时
链接地址:https://www.777doc.com/doc-5875031 .html