您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 医学试题/课件 > 31回归分析的基本思想及初步应用(3)
城阳一中王凤梅2E(e)=0,D(e)=σy=bx+a+e1.线性回归模型:ˆˆˆybxaybxa是的估计值e=y-(bx+a)称为随机误差温故知新一.用心温故ˆˆˆ()niiibyy21=为残差平方和。Q(a,)ˆˆiiieyyii对于样本点(x,y)的随机误差的估计值程称相应残差ˆ.2e残差R2越大模型越好残差平方和越小精确度越高3.相关指数R2n2ii2i=1n2ii=1(y-y)R=1-(y-y)引例:从某大学中随机选出8名女大学生,其身高和体重数据如下表:编号12345678身高165165157170175165155170体重4857505464614359残差(1)求每个点(xi,yi)的残差(2)画出残差的散点图(3)求出相关指数R2,说明身高在多大程度上解释了体重的变化.二.探求新知-6.3732.6272.419-4.6181.1376.627-2.8830.382-8-6-4-22468O21346578910编号残差........③.R2=0.64,表明女大学生的身高解释了64%的体重变化。②残差点比较均匀地落在(以x轴为中心)水平带状区域内.模型较合适带状区域的宽度越窄,模型拟合精度越高,回归方程的预报精度越高.43210-1-2-3-401002003004005006007008009001000454035302520151050-5010203040506070809010025002000150010005000-500-10000102030405060708090100200150100500-50-100-1500102030405060708090100.............................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................(1)分析下列残差图,所选用的回归模型效果最好的是()牛刀小试(2)有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适。②相关指数R2来刻画回归的效果,R2值越大,说明模型的拟合效果越好。③比较两个模型的拟和效果,可以比较残差平方的大小,残差平方和越小的模型,拟合效果越好。正确的是()①②③建立回归模型的基本步骤画出散点图;确定回归方程类型;求出回归方程;利用相关指数或残差进行分析.确定解释变量和预报变量;被害棉花红铃虫喜高温高湿,适宜各虫态发育的温度为25℃一32℃,相对湿度为80%一100%,低于20℃和高于35℃卵不能孵化,相对湿度60%以下成虫不产卵。冬季月平均气温低于一4.8℃时,红铃虫就不能越冬而被冻死。创设情景1953年,18省发生红铃虫大灾害,受灾面积300万公顷,损失皮棉约二十万吨。因材施教温度xoC21232527293235产卵数y/个711212466115325例2现收集了一只红铃虫的产卵数y和温度xoC之间的7组观测数据列于下表:(1)试建立产卵数y与温度x之间的回归方程;并预测温度为28oC时产卵数目。(2)你所建立的模型中温度在多大程度上解释了产卵数的变化?问题呈现:画散点图假设线性回归方程为:选模型分析和预测当x=28时,y=19.87×28-463.73≈93选变量解:选取气温为解释变量x,产卵数为预报变量y。合作探究050100150200250300350036912151821242730333639方案1当x=28时,y=19.87×28-463.73≈93ˆˆˆybxa估计参数由计算器得:线性回归方程为ˆ19.87463.73yx0残差编号12345671020304050607080-10-20-30-40-50-6090100xy残差21723112521272429663211535325线性模型53.4617.72-12.02-48.76-46.5-57.1193.28ˆ19.87463.73yx271ˆˆˆ(,)()iiiQabyy19818.9相关指数R2≈0.7464所以,一次函数模型中温度解释了74.64%的产卵数变化。y=bx2+a变换y=bx+a非线性关系线性关系方案2问题1选用y=bx2+a,还是y=bx2+cx+a?问题3-200-1000100200300400-40-30-20-10010203040产卵数气温问题2如何求a、b?合作探究t=x2温度xoC21232527293235产卵数y/个711212466115325方案2解答平方变换:令t=x2,产卵数y和温度x之间二次函数模型y=bx2+a就转化为产卵数y和温度的平方t之间线性回归模型y=bt+a作散点图,并由计算器得:将t=x2代入线性回归方程得:y=0.367x2-202.54产卵数y/个0501001502002503003500150300450600750900105012001350tt温度21232527293235温度的平方t44152962572984110241225产卵数y/个711212466115325773.43t81.29y71594880iiity7214652870iity和t之间的线性回归方程为y=0.367t-202.54,当x=28时,y=0.367×282-202.54≈850残差编号12345671020304050607080-10-20-30-40-50-6090100xy残差21723112521272429663211535325二次函数模型47.69619.400-5.832-41.000-40.104-58.26577.9682ˆ0.367202.54yx271ˆˆˆ(,)()iiiQabyy15448.4相关指数R2=0.802所以二次函数模型中温度解释了80.2%的产卵数变化。问题2变换y=bx+a非线性关系线性关系2110cxyc问题1如何选取指数函数的底?-50050100150200250300350400450-10-50510152025303540产卵数气温指数函数模型方案3合作探究对数令,则就转换为z=bx+a对数变换:在中两边取常用对数得22111221lglg(10)lglg10lglg10lgcxcxyccccxcxc2110cxyc12lg,lg,zyacbc方案3解答00.40.81.21.622.42.8036912151821242730333639xz当x=28oC时,y≈44ˆˆ..xxzz01181665关于的线性回归方程为,温度xoC21232527293235产卵数y/个711212466115325温度xoC21232527293235z=lgy0.851.041.321.381.822.062.51产卵数y/个71121246611532527.42x1.569z71318.58iiixz7215414iix由计算器得:0.1181.665ˆ10xy0残差编号12345671020304050607080-10-20-30-40-50-6090100xy残差21723112521272429663211535325指数函数模型-0.19441.7248-9.18948.8521-14.121933.25730.1181.665ˆ10xy271ˆˆˆ(,)()iiiQabyy1471.5.2R0985相关指数指数回归模型中温度解释了98.5%的产卵数的变化0.4987最好的模型是哪个?-200-1000100200300400-40-30-20-10010203040产卵数气温-50050100150200250300350400450-10-50510152025303540产卵数气温-10001002003004000510152025303540产卵数线性模型二次函数模型指数函数模型比一比函数模型相关指数R2残差平方和线性回归模型二次函数模型指数函数模型最好的模型是哪个?0.74640.8020.98519818154481471编号编号编号1234567残差01020304050607080-10-20-30-40-50-6090100残差01020304050607080-10-20-30-40-50-609010012345671234567残差01020304050607080-10-20-30-40-50-6090100结论:无论从图形上直观观察,还是从数据上分析,指数函数模型是更好的模型。数学思想:数学方法:数形结合的思想,化归思想及整体思想数形结合法,转化法,换元法.数学知识:建立回归模型及残差图分析的基本步骤不同模型拟合效果的比较方法:相关指数和残差的分析.非线性模型向线性模型的转换方法课堂总结1.在画两个变量的散点图时,下面叙述正确的事()(A)预报变量在x轴上,解释变量在y轴上(B)解释变量在x轴上,预报变量在y轴上(C)可以选择两个变量中任意一个变量在x轴上(D)可以选择两个变量中任意一个变量在y轴上2.一位母亲记录了她儿子3到9岁的身高,数据如下表。年龄/岁3456789身高/cm94.8104.2108.7117.8124.3130.8139.0由此她建立了身高与年龄的回归模型,她用这个模型预测儿子10岁时的身高,则下面的叙述正确的是()(A)身高一定是145.83cm(B)身高在145.83CM以上(C)身高在145.83cm左右(D)身高在145.83cm以下ˆ73.937.19yx学以致用2R2R2R2R2R3.在建立两个变量x与y的回归模型中,分别选择了4个不同模型,它们的相关指数如下,其中拟和得最好的模型是()(A)模型1的相关指数为0.98为0.80为0.504.如果发现散点图中所有的样本点都在一条直线上,请回答下列问题:(1)解释变量和预报变量的关系是,残差平方和是_____________(2)解释变量和预报变量之间的相关系数是________(B)模型2的相关指数(C)模型3的相关指数(D)模型4的相关指数为0.252、通过互联网收集1993年至2003年每年中国人口总数的数据,建立人口与年份的关系,预测2004和2005年的人口总数,并计算与实际数据的误差。1、某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:X12345678910y10.155.524.082.852.111.621.411.301.211.15(1
本文标题:31回归分析的基本思想及初步应用(3)
链接地址:https://www.777doc.com/doc-3340580 .html