您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 第七章-回归正交设计
第七章回归正交设计第一节正交设计的概念回归正交设计是将试验安排与数据的回归分析结合起来考虑.在试验中,通过适当地安排试验点,使得在每个试验点上获得的数据含有最大的信息,并且各自变量(因素)向量间满足正交性以便于回归分析.然后再用回归分析处理试验数据,将试验指标与被考察的各因素间的关系以回归方程表示出来.特别正交设计借助于正交表进行时,回归的正交设计兼容了正交试验设计与回归分析两者的优点,又避免了回归分析计算及分析麻烦的缺点,是一种优良的试验设计方法.回归平方和偏回归平方和第二节正交多项式回归当自变量(因素)等间距取值,求指标对因素的多项式回归可采用正交多项式回归.变换公式:新变量(可看成水平序号)=(原变量-左端点)/步长+1设指标y关于因素z有回归模型(1)ezczczccypp2210e)x(b)x(b)x(bbypp2211011zzzx作变量代换则x取值自然数1,2,…, n,有以下对应表原变量ZZ1Z1+△z1Z1+2△Z……Z1+(n-1)△Z新变量X123……n指标yy1y2y3……yn将回归模型重新表成(2))p,2,1(,axaaxax)x(,12211kkkkkkkkkkkl其中是l次待定系数多项式为满足正交设计条件,可推出x的以下各次正交多项式:…………………………………..,21)(1nxx,623)1()(222nnxnxx)()14(4)()()()(1222211xppnpxxxppp将回归模型最后表成(3))(xφb(x)φb(x)φbbypp22110)(xφb(x)φb(x)φbbypp22110)(xψλ(x)φjjjjjψλjj这儿通过取适当的,使的各个分量在正交多项式表(附表6)均为整数.的值也在正交多项式表中可查到.模型(3)是正交设计.方差来源平方和自由度平均平方和F显著性残差n-p-1总和lyyn-1)()()(21xpxxp次一次一次回归pypyyrlblblbS2211111ppypyylblblb2211eyslbF/111eyslbF/222epyppslbF/ryyeSlS1pnSSee方差分析表说明:检验所配各次多项式对y的贡献是否显著,对于不显著的高次项可以把它们从回归方程中剔除掉.如果检验的结果都显著,而所配多项式的精度还不够满意,则可继续增添更高次的项.例7.2.1为了考察维尼纶纤维在缩醛化工序中甲醛浓度z与纤维醛化度y之间的关系,对7种不同浓度各进行若干次实验,测得每种浓度的平均缩醛化度如下:甲醛浓度z(g/l)18202224262830缩醛化度y(%)26.928.328.728.929.630.030.4解设(1)作变换x=(z-18)/2+1=(z-16)/2(2)44332210ˆzczczczccy44332210ˆzczczczccy44332210ˆzczczczccy并可设).x(b)x(b)x(b)x(bbyˆ443322110多项式回归的计算k)k(1)k(2)k(3)k(4yy21-35-1326.9723.612-201-728.3800.893-1-31128.7823.6940-40628.9835.2151-3-1129.6876.16620-1-730.0900.007351330.4924.1614.8-4.00.9-4.52y=5883.7228846154n=7bi=liy/lii0.5286-0.047620.1500-0.02922biliy7.8230.190.1350.131i111/67/12kkiiyykl)(971.28y,314.8971.28772.5883yny2k22kyyl.035.0SS,279.8bSryyeiiyirll8.202y2iiiΦl方差分析方差来源平方和自由度平均平方和F显著性**(*)7.8230.1900.1350.131残差Se0.03520.0175总和lyy8.31464321QQQQ四次三次二次一次回归137.0135.0190.0716.7279.81111449.771.786.1003.447**分析:)2,1(F01.0)2,1(F05.0)2,1(F1.0查F分布表,得临界值=98.50,=18.51,=8.53.可见,一次项是高度显著的,=0.1时显著,三次项与四次项都不显著,二次项当因此,只需配到二次就行了。方程的显著性检验故方程也是高度显著的,,18)4,2(24.534/)(2/)(01.04321FQQSQQFe结果:当n=7时,根据表7.2.2的计算,得回归计算=22.628+0.2625z.或=)4(5286.0971.28)(ˆ110)1(xxbby216525.0857.26525.0857.26zx)128(04762.0ˆ)(ˆˆ2)1(22)1()2(xxyxbyy12216821604762.0ˆ2)1(zzy1401244762.0ˆ2)1(zzy.011905.08357.0961.152zz.12x8x)x()x(,4x)x()x(2222111SAS操作求指标对因素的多项式回归可以由SAS轻松地完成:当自变量(因素)等间距取值时,变换公式新变量(可看成水平序号)=(原变量-左端点)/步长+1使得水平序号有量的含意,此时用水平序号或原始数据在SAS中进行回归分析结果是一样的.例7.2.1中由正交多项式回归理论经过一系列计算可得y=15.961+0.8357z-0.011905z2,而利用SAS编程可直接计算得上述结论,请看演示(数据DataE721)dataE721;inputzy@@;t1=z;t2=z**2;t3=z**3;t4=z**4;cards;1826.92028.32228.72428.92629.62830.03030.4;procprint;run;dataE7211;inputw1-w4y@@;cards;-35-1326.9-201-728.3………………………….351330.4;procorthoregdata=E7211;modely=w1-w4;run;TheSASSystem16:19Monday,August12,20065TheORTHOREGProcedureDependentVariable:ySumofSourceDFSquaresMeanSquareFValuePrFModel48.27982683982.06995671120.140.0083Error20.03445887450.0172294372CorrectedTotal68.3142857143RootMSE0.1312609509R-Square0.9958554618StandardVariableDFParameterEstimateErrortValuePr|t|Intercept128.97142857142850.0496119761583.96.0001w110.528571428571420.024805988121.310.0022w21-0.047619047619040.0143217439-3.320.0798w310.149999999999990.05358705882.800.1074w41-0.029220779220770.0105773089-2.760.1099输出结果:结果:黄圈中的四个值依次为b0,b1,b2,b3,b4,利用变换式子x=(z-16)/2及代入模型(2),即得所求多项式回归方程(1).由于b0的p值.0001、b1的p值0.0022均小于0.01,所以一次项是高度显著的;b2的p值0.0798小于0.1,所以二次项是显著的;b3的p值0.1074、b4的p值0.1099均大于0.1,所以三次项与四次项都不显著,因此只需配到二次就行了..128)()(,4)()(2222111xxxxxxxdataE721;inputzy@@;t1=z;t2=z**2;t3=z**3;t4=z**4;cards;1826.92028.32228.72428.92629.62830.03030.4;procprint;run;dataE7211;inputw1-w4y@@;cards;-35-1326.9-201-728.3………………………….351330.4;procorthoregdata=E7211;modely=w1w2;run;TheSASSystem16:19Monday,August12,200616TheORTHOREGProcedureDependentVariable:ySumofSourceDFSquaresMeanSquareFValuePrFModel28.01333333334.006666666753.250.0013Error40.3009523810.0752380952CorrectedTotal68.3142857143注:经删去两不显著项后,p值减小,而剩余标准差虽增大却还是较小,模型更加高度显著了.第三节一次回归的正交设计kxik2-113-1014-113131表7.3.1不同水平的编码以下用SAS分析上例(数据E731)dataE731;inputx1-x3y;cards;11190.9811-184.541-1187.701-1-185.60-11185.40-11-182.63-1-1185.50-1-1-183.20;procregdata=E731;modely=x1-x3;run;dataE731;inputx1-x3y;cards;11190.9811-184.541-1187.701-1-185.60-11185.40-11-182.63-1-1185.50-1-1-183.20;procregdata=E731;modely=x1x3;run;删去不显著因子x2由于是正交设计,各项之间均正交,删去不显著项后,注意以下输出结果的几个变和不变.不变部分:1)St(与模型选择无关);2)保留项的回归参数和偏回归平方和(由于正交性).变化部分:1)被删项的偏回归平方和从模型平方和中转移到误差平方和中,模型和误差的自由度亦作相应调正;2)在模型显著性检验时,F比的分子即模型的均方差会变大(本例由13.9增大成20.7),检验的参照系即F比的分母误差的均方差会变小(本例由1.828减少成1.523)从而提高模型的显著性;3)对于保留项的显著性,F比的分子项的偏回归平方和不变,由于检验的参照系即F比的分母误差的均方差变小从而提高项的显著性(譬如x1的Pr从0.034变为0.018).输出部分结果对比如下:
本文标题:第七章-回归正交设计
链接地址:https://www.777doc.com/doc-1240855 .html