您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 医学试题/课件 > 高二数学3.1回归分析的基本思想及其初步应用(2)课件
ˆyy=bx+a+e其中a和b为模型的未知参数,e是y与之间的误差,通常e称为随机误差。2E(e)=0,D(e)=σy=bx+a+eˆˆˆnniiiii=1i=1nn222iii=1i=1(x-x)(y-y)x-nxyb==,(x-x)x-nxa=y-bxy所求直线方程叫做回归直线方程;其中ˆˆˆy=bx+a线性回归模型预报精度1.相关指数R22.残差enn22iii2i=1i=1nn22iii=1i=1(y-y)(y-y)R=1-=(y-y)(y-y)在含有一个解释变量的线性模型中R2=r2(相关关系)判断xi确定差异百分数随机误差,它的估计值为.e=y-ye=y-y对于样本点它们随机误差的估计值称相应残差.1122nn(x,y),(x,y),,(x,y)iiiiie=y-y=y-bx-an22iii=111σ=(y-bx-a)=Q(a,b)(n2)n-2n-2方差1)衡量预报精度2)确定样本的异常点.1)确定解释变量和预报变量;2)画出散点图;3)确定回归方程类型;4)求出回归方程;5)利用相关指数或残差进行分析.建立回归模型的基本步骤问题:一只红铃虫的产卵数y与温度x有关,现收集了7组观测数据,试建立y与x之间的回归方程温度x21232527293235产卵数y711212466115325解:1)作散点图;050100150200250300350202224262830323436温度产卵数从散点图中可以看出产卵数和温度之间的关系并不能用线性回归模型来很好地近似。这些散点更像是集中在一条指数曲线或二次曲线的附近。解:令则z=bx+a,(a=lnc1,b=c2),列出变换后数据表并画出x与z的散点图z=lnyx和z之间的关系可以用线性回归模型来拟合z=ax+b+e2cx1用y=ce模型;1)x21232527293235z1.9462.3983.0453.1784.194.7455.784z01234567010203040z2)用y=c3x2+c4模型,令,则y=c3t+c4,列出变换后数据表并画出t与y的散点图2t=x散点并不集中在一条直线的附近,因此用线性回归模型拟合他们的效果不是最好的。t44152962572984110241225y711212466115325y0501001502002503003500200400600800100012001400yˆˆ(1)0.272x-3.843(2)2y=e,y=0.367x-202.54ˆˆˆˆ(1)(1)0.272x-3.843iii(2)(2)2iiie=y-y=y-e,(i=1,2...7)e=y-y=y-0.367x+202.54,残差表编号1234567x21232527293235y711212466115325e(1)0.52-0.1671.76-9.1498.889-14.15332.928e(2)47.719.397-5.835-41.003-40.107-58.26877.965非线性回归方程二次回归方程残差公式在此处可以引导学生体会应用统计方法解决实际问题需要注意的问题:对于同样的数据,有不同的统计方法进行分析,我们要用最有效的方法分析数据。现在有三个不同的回归模型可供选择来拟合红铃虫的产卵数与温度数据,他们分别是:.,,212exyecyebaxyexc可以利用直观(散点图和残差图)、相关指数来确定哪一个模型的拟合效果更好。ebxcz2ety小结实际问题y=f(x)样本分析y=f(x)回归模型y=f(x)抽样作业:P104习题3.13
本文标题:高二数学3.1回归分析的基本思想及其初步应用(2)课件
链接地址:https://www.777doc.com/doc-5097426 .html