您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 田间试验与统计方法11响应面设计.
第11章回归设计(响应面分析)及DESIGN-EXPERT优化BBDCCD主要内容11.1回归设计概述11.2Design-Expert的应用——BBD11.3Design-Expert的应用——CCD11.1回归设计概述回归设计(也称为响应曲面设计),目的是寻找试验指标与各因子间的定量规律,考察的因子都是定量的。它是在多元线性回归的基础上用主动收集数据的方法获得具有较好性质的回归方程的一种试验设计方法。11.1.1多项式回归模型在一些试验中希望建立指标y与各定量因子(又称变量)间相关关系的定量表达式,即回归方程,以便通过该回归方程找出使指标满足要求的各因子的范围。可以假定y与间有如下关系:这里是的一个函数,常称为响应函数,其图形也称为响应曲面;是随机误差,通常假定它服从均值为0,方差为的正态分布。在上述假定下,可以看作为在给定后指标的均值,即pzzz,,,21pzzz,,,21),,,(21pzzzfy),,,(21pzzzfpzzz,,,212),,,(21pzzzfpzzz,,,21),,,()(21pzzzfyE称z的可能取值的空间为因子空间。我们的任务便是从因子空间中寻找一个点z0使E(y)满足质量要求。当f的函数形式已知时,可以通过最优化的方法去寻找z0。在许多情况下f的形式并不知道,这时常常用一个多项式去逼近它,即假定:),,,(21pzzz),,,(00201pzzz(7.1.1)20jijiijjjjjjjjzzzzy这里各为未知参数,也称为回归系数,通常需要通过收集到的数据对它们进行估计。若用表示相应的估计,则称,,,,0ijjjj,,,,0ijjjjbbbbybbzbzbzzjjjjjjjijijij02为y关于的多项式回归方程。pzzz,,,21在实际中常用的是如下的一次与二次回归方程(也称一阶与二阶模型):jjjzbby0ˆˆ20jijiijjjjjjjjzzbzbzbby一般p个自变量的d次回归方程的系数个数为ddp11.1.2多元线性回归(14.1.1)是一个多项式回归模型,在对变量作了变换并重新命名后也可以看成是一个多元线性回归模型。1.回归模型设所收集到的n组数据为假定回归模型为:niyxxxiipii,,2,1),,,,,(21),0(~,,2,12110Niidnixxyiiippii各,记随机变量的观察向量为未知参数向量为不可观察的随机误差向量为结构矩阵那么上述模型可以表示为:nyyyY21p10n21npnppxxxxxxX1221111111),(~nnINXY20或),(~2nnIXNY2.回归系数的最小二乘估计估计回归模型中回归系数的方法是最小二乘法。记回归系数的最小二乘估计(LSE)为,应满足如下正规方程组:当存在时,最小二乘估计为在求得了最小二乘估计后,可以写出回归方程:今后称为正规方程组的系数矩阵,为正规方程组的常数项向量,为相关矩阵。在前述模型下,有),,,(10pbbbbYXXbX1XXYXXXb1ppxbxbby110ˆXXAYXB1XXC))(,(~12XXNb若记,那么)(1ijcXXCpjcNbjjjj,,2,1,0),,(~2在通常的回归分析中,由于C非对角阵,所以各回归系数间是相关的:2),(ijjicbbCov3.对回归方程的显著性检验对回归方程的显著性检验是指检验如下假设:H0:H1:不全为0检验方法是作方差分析。记则有平方和分解式其中为残差平方和,自由度为为回归平方和,自由度为当H0为真时,有对于给定的显著性水平,拒绝域为。021pp,,,21nixbxbbyippii,,2,1ˆ110,REniiniiiniiTSSyyyyyyS121212)ˆ()ˆ()(iiiEyyS2)ˆ(1pnfE2)ˆ(yySiRpfR)1,(),(~//pnpFffFfSfSFEREERR)1,(1pnpFF若记p+1维向量,那么)(jBBYXppniiiiiEBbBbBbyyyS1100122)ˆ(ETiRSSyyS2)ˆ(4.失拟检验当在某些点有重复试验数据的话,可以在检验回归方程显著性之前,先对y的期望是否是的线性函数进行检验,这种检验称为失拟检验,它要检验如下假设:H0:H1:当在上有重复试验或观察时,将数据记为其中至少有一个,记。此时残差平方和可进一步分解为组内平方和与组间平方和,其中组内平方和就是误差平方和,记为,组间平方和称为失拟平方和,记为,即:pxxx,,,21ppxxEy110ppxxEy110),,,(21ipiixxxnimjyxxxiijipii,,2,1,,,2,1),,,,(21,2imniimN1eSLfeESSSLfSnimjiijeiyyS121)(nNmfie)1(imjijiiymy11niiiiLfyymS12)ˆ(1pnfLf,,,,检验统计量为在H0为真时,,对于给定的显著性水平,拒绝域为当拒绝H0时,需要寻找原因,改变模型,否则认为线性回归模型合适,可以将Se与SLf合并作为SE检验方程是否显著。其中eeLfLfLffSfSF//),(~eLfLfffFF),(1eLfLfffFF5.对回归系数的显著性检验当回归方程显著时,可进一步检验某个回归系数是否为0,也即检验如下假设:此种检验应对j=1,2,…,p逐一进行。常用的检验方法是t检验或等价的F检验,F检验统计量为:其中是中的第j+1个对角元。记分子为,即,它是因子的偏回归平方和分母是模型中的无偏估计。,也称为的标准误,即其标准差的估计。0010jjjjHH:,:222ˆ/jjjjjcbtFjjc1)(XXjSjjjjcbS/2jx2EEfS/ˆˆjjcjb当H0j为真时,有。给定的显著性水平,当时拒绝假设H0j,即认为显著不为零,否则可以将对应的变量从回归方程中删除。注:当有不显著的系数时,一般情况下一次只能删除一个F值最小的变量,重新计算回归系数,再重新检验。通常要到余下的系数都显著时为止。),1(~EjfFF),1(1EjfFFj11.1.3回归分析对数据的处理由被动变主动古典的回归分析方法只是被动地处理已有的试验数据,对试验的安排不提任何要求,对如何提高回归方程的精度研究很少。后果:(1)盲目增加试验次数,而这些试验结果还不能提供充分的信息,以致在许多多因子试验问题中达不到试验目的。(2)对模型的合适性有时无法检验,因为在被动处理数据时在同一试验点上不一定存在重复试验数据。为了适应寻求最佳工艺、最佳配方、建立生产过程的数学模型等的需要,人们就要求以较少的试验次数建立精度较高的回归方程。为此,要求摆脱古典回归分析的被动局面,主动把试验的安排、数据的处理和回归方程的精度统一起来考虑,即根据试验目的和数据分析的要求来选择试验点,不仅使得在每一个试验点上获得的数据含有最大的信息,从而减少试验次数,而且使数据的统计分析具有一些较好的性质。这就是二十世纪五十年代发展起来的“回归设计”所研究的问题。回归设计的分类:根据建立的回归方程的次数不同,回归设计有一次回归设计、二次回归设计、三次回归设计等;根据设计的性质又有正交设计、旋转设计等。11.1.4因子水平的编码在回归问题中各因子的量纲不同,其取值的范围也不同,为了数据处理的方便,对所有的因子作一个线性变换,使所有因子的取值范围都转化为中心在原点的一个“立方体”中,这一变换称为对因子水平的编码。方法如下:设因子的取值范围为:,与分别称为因子的下水平与上水平。其中心也称为零水平:,因子的变化半径为,令,此变换式就称为“编码式”。jzjjjzzz21pj,,2,1jzjz1jz22/)(210jjjzzzpj,,2,12/)(12jjjzzpj,,2,1jjjjzzx0pj,,2,1例硝基蒽醌中某物质的含量y与以下三个因子有关:z1:亚硝酸钠(单位:克)z2:大苏打(单位:克)z3:反应时间(单位:小时)为提高该物质的含量,需建立y关于变量z1,z2,z3的回归方程。1.试验设计(1)确定因子取值范围,并对它们的水平进行编码本例的因子水平编码见下表。表因子水平编码表因子水平编码值z1z2z3上水平+19.04.53下水平-15.02.51零水平07.03.52变化半径Δj211确信或怀疑因素对指标存在非线性影响;因素个数2-7个,一般不超过4个;所有因素均为计量值数据;试验区域已接近最优区域;基于2水平的全因子正交试验。11.1.5响应曲面设计方法(ResponseSurfaceMethodology,RSM)适用范围中心复合试验设计(centralcompositedesign,CCD);Box-BehnkendesignBBD试验设计;响应曲面设计方法分类立方点轴向点中心点区组序贯试验旋转性基本概念11.1.5.1中心复合试验设计立方点(cubepoint)立方点:也称立方体点、角点,即2水平对应的“-1”和“+1”点。各点坐标皆为+1或-1。在k个因素的情况下,共有2k个立方点轴向点(axialpoint)轴向点:又称始点、星号点,分布在轴向上。除一个坐标为+α或-α外,其余坐标皆为0。在k个因素的情况下,共有2k个轴向点。中心点(centerpoint)中心点:亦即设计中心,表示在图上,坐标皆为0。三因素下的立方点、轴向点和中心点区组(block)也叫块。设计包含正交模块,正交模块可以允许独立评估模型中的各项及模块影响,并使误差最小化。但由于把区组也作为一个因素来安排,增加了分析的复杂程度。序贯试验(顺序试验)先后分几段完成试验,前次试验设计的点上做过的试验结果,在后续的试验设计中继续有用。旋转性(rotatable)设计旋转设计具有在设计中心等距点上预测方差恒定的性质,这改善了预测精度。α的选取在α的选取上可以有多种出发点,旋转性是个很有意义的考虑。在k个因素的情况下,应取α=2k/4当k=2,α=1.414;当k=3,α=1.682;当k=4,α=2.000;当k=5,α=2.378按上述公式选定的α值来安排中心复合试验设计(CCD)是最典型的情形,它可以实现试验的序贯性,这种CCD设计特称中心复合序贯设计(centralcompositecircumscribeddesign,CCC),它是CCD中最常用的一种。如果要求进行CCD设计,但又希望试验水平安排不超过立方体边界,可以将轴向点设置为+1及-1,则计算机会自动将原CCD缩小到整个立方体内,这种设计也称为中心复合有界设计(centralcompositeinscribeddesign,CCI)。这种设计失去了序贯性,前一次在立方点上已经做过的试验结果,在后续的CCI设计中不能继续使用。对于α值选取的另一个出发点也是有意义的,就是取α=1,这意味着将轴向点设在立方体的表面上,同时不改变原来立方体点的设置,这样的设计称为中心复合表面设计(centralcompositeface-centereddesign,CCF)。这样做,每个因素的取值水平只有3个(-1,0,1),而一般的CCD设计,因素的水平是5个(-α,-1,0,1,α),这在更换水平较
本文标题:田间试验与统计方法11响应面设计.
链接地址:https://www.777doc.com/doc-2203909 .html