您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 其它文档 > 试验设计与数据处理-李云雁-全套 第4章 回归分析
第4章试验数据的回归分析4.1基本概念(1)相互关系①确定性关系:变量之间存在着严格的函数关系②相关关系:变量之间近似存在某种函数关系(2)回归分析(regressionanalysis)处理变量之间相关关系的统计方法确定回归方程:变量之间近似的函数关系式检验回归方程的显著性试验结果预测4.2一元线性回归分析4.2.1一元线性回归方程的建立(1)最小二乘原理设有一组试验数据(如表),若x,y符合线性关系xx1x2……xnyy1y2……yn计算值与试验值yi不一定相等与yi之间的偏差称为残差:a,b——回归系数(regressioncoefficient)iyiyiyiiieyy——回归值/拟合值,由xi代入回归方程计算出的y值。iiyabx一元线性回归方程:残差平方和:112()02()0niiiniiiiQyabxaQyabxxb残差平方和最小时,回归方程与试验值的拟合程度最好求残差平方和极小值:222111()[()]nnneiiiiiiiiSSQeyyyabx正规方程组(normalequation):112111nniiiinnniiiiiiinabxyaxbxxy11112222111()()()()nnnniiiiiiiiiinnniiiiiinxyxyxynxybnxxxnxaybx解正规方程组:简算法:22211()()nnxxiiiiLxxxnx11()()nnxyiiiiiiLxxyyxynxyxyxxLbLaybx4.2.2一元线性回归效果的检验(1)相关系数检验法①相关系数(correlationcoefficient):描述变量x与y的线性相关程度定义式:xyxxyyLrLL②相关系数特点:-1≤r≤1r=±1:x与y有精确的线性关系r=1xyr=-1xyr<0:x与y负线性相关(negativelinearcorrelation)r>0:x与y正线性相关(positivelinearcorrelation)0<r<1xy-1<r<0xyr≈0时,x与y没有线性关系,但可能存在其它类型关系相关系数r越接近1,x与y的线性相关程度越高试验次数越少,r越接近1r=0xyr=0xy当,说明x与y之间存在显著的线性关系对于给定的显著性水平α,查相关系数临界值rmin③相关系数检验minrr(2)F检验①离差平方和总离差平方和:21()nTiyyiSSyyL221()nRxxxyiiSSyybLbL21()neiiiSSyyTReSSSSSS回归平方和(regressionsumofsquare):残差平方和:三者关系:②自由度SST的自由度:dfT=n-1SSR的自由度:dfR=1SSe的自由度:dfe=n-2三者关系:dfT=dfR+dfe③均方RRRSSMSdfeeeSSMSdf④F检验F服从自由度为(1,n-2)的F分布给定的显著性水平α下,查得临界值:Fα(1,n-2)若F>Fα(1,n-2),则认为x与y有明显的线性关系,所建立的线形回归方程有意义ReMSFMS⑤方差分析表4.3多元线性回归分析(1)多元线性回归形式试验指标(因变量)y与m个试验因素(自变量)xj(j=1,2,…,m)多元线性回归方程:12mbbb,,...,mmxbxbxbay...ˆ22114.3.1多元线性回归方程的建立偏回归系数:(2)回归系数的确定根据最小二乘法原理:求偏差平方和最小时的回归系数偏差平方和:22112211()(...)nniimmiiiQyyyabxbxbx0jQb0Qa根据:得到正规方程组,正规方程组的解即为回归系数。4.3.2多元线性回归方程显著性检验(1)F检验法总平方和:22211()nnTyyiiiiSSLyyyny211221()...nRyymmyiiSSyybLbLbL21()neiTRiiSSyySSSS回归平方和:残差平方和:F服从自由度为(m,n-m-1)的分布给定的显著性水平α下,若F>Fα(m,n-m-1),则y与x1,x2,…,xm间有显著的线性关系方差分析表:(2)相关系数检验法复相关系数(multiplecorrelationcoefficient)R:反映了一个变量y与多个变量(x1,x2,…,xm)之间线性相关程度计算式:R=1时,y与变量x1,x2,…,xm之间存在严格的线性关系R≈0时,y与变量x1,x2,…,xm之间不存在线性相关关系当0<R<1时,变量之间存在一定程度的线性相关关系R>Rmin时,y与x1,x2,…,xm之间存在密切的线性关系21eRTTSSSSRSSSSR一般取正值,0≤R≤14.3.3因素主次的判断(1)偏回归系数的标准化设偏回归系数bj的标准化回归系数为Pj:jjjjyyLPbLPj越大,则对应的因素(xj)越重要(2)偏回归系数的显著性检验计算每个偏回归系数的偏回归平方和SSj:SSj=bjLjySSj的大小表示了因素xj对试验指标y影响程度,对应的自由度dfj=1jjjeeMSSSFMSMS服从自由度为(1,n-m-1)的F分布如果若F<Fα(1,n-m-1),,则说明xj对y的影响是不显著的,这时可将它从回归方程中去掉,变成(m-1)元线性方程(3)偏回归系数的t检验计算偏回归系数jb的标准差:jebjjSSsLt值的计算:2jjjjjjjjjbeeejjbbbLSStFsMSMSMSL单侧t分布表检验:2(1,1)tnm→如果2(1,1)jttnm说明xj对y的影响显著,否则影响不显著,4.4.1一元非线性回归分析通过线性变换,将其转化为一元线性回归问题:直角坐标中画出散点图;推测y与x之间的函数关系;线性变换;用线性回归方法求出线性回归方程;返回到原来的函数关系,得到要求的回归方程4.4非线性回归分析4.4.2一元多项式回归任何复杂的一元连续函数都可用高阶多项式近似表达:212...mmyabxbxbx1122...mmyabXbXbX可以转化为多元线性方程:4.4.3多元非线性回归如果试验指标y与多个试验因素xj之间存在非线性关系,如二次回归模型:211mmjjjjjjkjkjijkyabxbxbxx4.5Excel在回归分析中的应用4.5.1“规划求解”在回归分析中应用解方程组最优化4.5.2Excel内置函数在回归分析中应用4.5.3Excel图表功能在回归分析中的应用4.5.4分析工具库在回归分析中应用
本文标题:试验设计与数据处理-李云雁-全套 第4章 回归分析
链接地址:https://www.777doc.com/doc-3270846 .html