当前位置:首页 > 行业资料 > 其它行业文档 > 误差理论与数据处理-第九章回归分析
4-1第9章回归分析教学目的和要求:通过本章内容的教学,使学生掌握一元线性回归方程的求法、回归方程的方差分析与显著性检验方法;了解一元非线性回归方程的求解思路及回归曲线效果和不确定度评定;了解多元线性回归方程的求法和显著性检验与不确定度评定方法。主要内容:1.回归分析的基本概念:概念、回归分析的主要内容。2.一元线性回归:一元线性回归方程的求法、回归方程的方差分析与显著性检验、重复实验判断回归方程拟合性、回归直线的简便求法。3.一元非线性回归:回归曲线类型的选取和检验、化非线性回归为线性回归、回归曲线效果与不确定度评定。4.多元线性回归:二元线性回归方程的求法、多元线性回归、多元线性回归的显著性检验与不确定度评定。5.线性递推回归:回归系数的递推计算公式、计算步骤。第一节基本概念变量间的关系可分为函数关系和相关关系。本节介绍这两种关系,并对回归分析的一些基本概念作一个简要的介绍。变量间的函数关系1、是一一对应的确定关系2、设有两个变量x和y,变量x随变量y一起变化,并完全依赖于x,当变量x取某个数值时,y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,称y为因变量如以速度v作匀速运动的物体,走过的距离s与时间t之间,有如下的函数关系s=vt变量间的相关关系1、变量间关系不能用函数关系精确表达3、当变量x取某个数值时,变量y的值可能有几个2、一个变量的取值不能由另一个变量惟一确定如人的身高(y)与体重(x)之间的关系什么是回归分析?3、利用所求的关系式,根据一个或几个变量的值,预测或控制另一个变量的值,并要知道这种预测或控制可达到的精密度。一种处理变量间相关关系的数理统计方法。他主要解决以下几个问题1、从一组样本数据出发,确定变量之间的数学关系式2、对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著回归模型的类型回归模型一元回归线性回归非线性回归线性回归非线性回归多元回归一个自变量两个及两个以上自变量回归模型1、回答“变量之间是什么样的关系?”2、方程中运用1个数字的因变量1个或多个数字的或分类的因变量3、主要用于预测或估计第二节一元线性回归一元线性回归模型概念1、当只涉及一个自变量时称为一元回归,若因变量与自变量之间为线性关系时称为一元线性回归3、描述因变量如何依赖于自变量和误差项的方程称为回归模型。yx2、对于具有线性关系的两个变量,可以用一个线性方程来表示它们之间的关系yx由实验获得两个变量和的一组样本数据,,…,构造如下一元线性回归模型xy11(,)xy22(,)xy(,)nnxyiiiyabx一元线性回归模型概念模型中,是的线性函数部分加上误差项yxxy线性部分反映了由于的变化而引起的变化误差项是随机变量反映了除和之间的线性关系之外的随机因素对的影响是不能由和之间的线性关系所解释的变异性和称为模型的参数xyyxyab1、误差项是一个期望值为0的随机变量,即。对于一个给定的值,的期望值为()0Eixiy()iiEyabx2、对所有的值,的方差都相同ixi23、误差项是一个服从正态分布的随机变量,且相互独立。即i2~(0,)iN独立性意味着对于一个特定的值,它所对应的与其它值所对应的不相关ixijxj对于一个特定的值,它所对应的值与其它值所对应的不相关ixiyjxjy一元线性回归模型基本假定1、描述的平均值或期望值如何依赖于的方程称为回归方程yx2、简单线性回归方程的形式如下()Eyabx方程的图示是一条直线,因此也称为直线回归方程是回归直线在轴上的截距,是当时的期望值是直线的斜率,表示当每变动一个单位时,的平均变动值ay0xbxy回归方程概念要点1、总体回归参数和是未知的,必须利用样本数据去估计他们ab2、用样本统计量和代替回归方程中的未知参数和,这时就得到了经验的回归方程ˆaˆb3、一元线性回归的经验的回归方程ˆˆˆyabx是回归直线在轴上的截距是直线的斜率,它表示对于给定的的值,是的估计值,也表示当每变动一个单位时,的平均变动值ˆayˆbxyxˆyyab经验的回归方程2()ˆ()ˆxyxxlnxyxyblnxxxaybx2211112222221111111,,,()()()()nnnniiiiiiiiinnxxiyyiiinxyiiixxyyxxxyxynnnnlxxnxnxlyynynylxxyynxynxy式中根据最小二乘法的要求,可得和的计算公式ˆaˆb二、回归效果F检验偏差平方和的分解测量值之间的差异来源于两个方面12,,,nyyy由于自变量取值的不同造成的x除以外的其它因素(如对的非线性影响、测量误差等)的影响iyyxy对一个具体的观测值来说,变异的大小可以通过该实际观测值与其均值之差来表示x偏差平方和的分解图示0yxyy=yabx=+y_yy_yy_yˆˆ()()iiiiyyyyyy两端平方后求和得到222111ˆˆnnniiiiiiiyyyyyy总偏差平方和回归平方和残余平方和总回残总残回三个平方和的关系自由度1n总计算公式yyl总在总的偏离中除了对线性影响之外的其它因素而引起变化的大小xyy1回2ˆxyxyxxlbll回在总的偏差中因和的线性关系而引起变化的大小xyy2n总回残总回残总偏差平方和回归平方和残余平方和意义反映因变量的n个观测值与其均值的总偏差三个平方和的意义回归方程的显著性检验1、检验自变量和因变量之间的线性关系是否显著2、具体方法是将回归平方和和残余平方和加以比较,应用F检验来分析二者之间的差别是否显著如果是显著的,两个变量之间存在线性关系如果不显著,两个变量之间不存在线性关系2、计算检验统计量F回回剩剩12Fn回剩3、在给定显著性水平下,由分布表查得临界值。1,2Fn4、作出决策。若,拒绝,则认为该回归效果显著。反之,则不显著。1,2FFn即检验步骤1、提出假设线性关系不显著0:H0H估计残余标准误差4、残余标准差的计算公式2sn残xyy1、表征除了与线性关系之外其它因素影响值偏离的大小2、反映实际观测值在回归直线周围的分散状况3、从另一个角度说明了回归直线的拟合程度偏离回归残余总和平方和ˆxybl回yyl总总回残自由度11n2n标准差2sn残统计量2Fs回置信限1,2Fn0.10.050.01显著否显著否显著否方差分析表三、回归系数的不确定度与回归方程的稳定性回归系数的不确定度1、回归系数的不确定度是描述回归系数的分散性21ˆ()xxxUasnl1ˆ()xxUbsl2ˆˆabxxxssl2、回归系数和的标准不确定度的计算公式ˆaˆb3、回归系数和的协方差的计算公式ˆaˆb式中,是残余标准差s回归方程的稳定性1、回归值的波动大小,波动愈小,回归方程的稳定性愈好。ˆy2、回归值的波动大小的计算公式ˆy标准不确定度来表示。ˆyˆ()Uy21ˆ()xxxxUysnl回归值的波动大小不仅与剩余标准差s有关,而且还取决于试验次数n及自变量取值范围。提高回归方程中各估计量稳定性的方法(1)提高观察数据本身的准确度(2)尽可能增大观测数据中自变量的取值范围(3)增加观测次数(4)减小残余误差,即拟定合适回归方程使其尽可能合乎实际数据的变化规律四、回归预测值及其不确定度回归预测值及其不确定度xy1、利用估计的回归方程,对于自变量的一个给定值,求出因变量的一个估计值,就是回归的预测值0x0ˆy的标准不确定度来表述ˆyˆˆˆyabx21ˆ()xxxxuysnl2n的扩展不确定度来表述ˆyˆˆˆpyabxU1,2pn2、预测值与实际值之间存在偏差,因此给出预测值时,还必须给出其不确定度。有以下两种表示方式0ˆyy例题试对下表所列实验数据做直线拟合,并作方差分析和预测。ixiyixiyixiyixiy180200145165123110191205104100141135151180190220134135144160110130153145141125190190108110155160204235190210158130177185150170161145107115177205121125165195180240143160151135154150127135147155116100115120【解】直线拟合计算11150.09,158.283434iixxyy225453xxilxx32325xyiilxxyyˆˆ32.3aybx2ˆ50094,1.27yyixyxxlyybllˆ32.31.270yx故有直线拟合方差分析50094yyl总241037xyxxll回9057总回残282.516.8s偏离回归残余总和平方和自由度1标准差统计量2145.0Fs回置信限1,32F0.01高度显著41037905750094323316.8145.07.50预测对于,查分布表得232n0.01(32)2.74t0.05(32)2.04t0.10(32)1.69t21ˆ()2.88xxxxsuysnlnˆ()()pUtuy故有ˆ32.301.2707.89(0.99,32)yxpˆ32.301.2705.88(0.95,32)yxpˆ32.301.2704.87(0.90,32)yxp回归直线及预测区间100120y240220180140100140160180200xyx=32.30+1.27第三节一元非线性回归非线性回归分析5、比较不同模型拟合所得的原剩余平方和,选最小者即为所求。2、选择回归模型。根据实验数据散点图分布的特点以及所掌握的物理规律,选择可线化函数的模型。3、作线性化变量变换后,按一元线性回归问题计算待定的系数、原的剩余平方和。4、如果对拟合结果不满意,再选择其它模型,重复以上步骤。1、因变量与自变量之间不是线性关系yx几种常见的非线性模型指数函数1、基本形式:bxyae2、线性化方法两端取对数得lnlnyabx令lnyabxlnyy3、图像b>0<b0几种常见的非线性模型指数函数1、基本形式:2、线性化方法两端取对数得令lnyabx1lnyyxx3、图像bxyaelnlnyabx<b0b>0几种常见的非线性模型幂函数1、基本形式:byax2、线性化方法两端取对数得logloglogyabx令logyabxlog,logyyxx3、图像1<b0<b10<b<b_1=_11b<<0几种常见的非线性模型双曲线函数1、基本形式:1bayx2、线性化方法令yabx11,yxyx3、图像a1b>0<b0a>0几种常见的非线性模型S型曲线1、基本形式:1xyabe2、线性化方法令yabx1,xyxey3、图像_1a几种常见的非线性模型对数函数1、基本形式:lgyabx2、线性化方法令yabxlgxx3、图像b>0<b0第四节多元线性回归一、多元线性回归方程多元线性回归模型概念要点0111222iiimmimiybbxxbxxbxx11njjiixxn1、一个因变量与两个及两个以上自变量之间的回归2、描述因变量如何依赖于自变量和误差项的方程称为多元线性回归模型12,,,mxxx
本文标题:误差理论与数据处理-第九章回归分析
链接地址:https://www.777doc.com/doc-4672322 .html