您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 商业计划书 > 正交试验设计的R语言实现
正交试验设计的R语言实现正交设计利用部分处理组合代表全面试验,能够大大减少试验实施的人力物力。但由此也减少了方差分析时的误差自由度,降低了均值检验的灵敏度。因此正交设计统计分析的重点不是方差分析,而是选择最优组合。本文以一个实例,介绍正交设计统计分析的一般方法。例题:为解决花菜留种问题,提高种子产量,对四个因素各两个水平设计了正交试验,结果列于下表,试进行方差分析并筛选最优组合。NO.ABA×BCA×CDyield111111135021112223253122112425412222142552121222006212211250722112127582212123751.方差分析首先对所有因素效应进行初步方差分析,R语言函数为aov()。R代码:a=factor(c(1,1,1,1,2,2,2,2))b=factor(c(1,1,2,2,1,1,2,2))ab=factor(c(1,1,2,2,2,2,1,1))c=factor(c(1,2,1,2,1,2,1,2))ac=factor(c(1,2,1,2,2,1,2,1))d=factor(c(1,2,2,1,2,1,1,2))yield=c(350,325,425,425,200,250,275,375)data=data.frame(a,b,c,d,ab,ac,yield)result=aov(yield~a+b+c+d+ab+ac)summary(result)程序运行结果:由上表可知,各项变异来源的F值均不显著,这是由于各因素均为2水平,导致试验误差的自由度过小,仅为1,因此达到显著的临界F值过大。解决这个问题的根本办法是增加试验的重复数,也可以将小于1的变异项(即D和A×B)合并为误差项,从而提高假设检验的灵敏度。具体操作如下:result_1=aov(yield~a+b+c+ac)summary(result_1)程序运行结果:以上结果可知,A、B和AC互作达到显著水平,而C因素不显著。一般只有达到显著时才有必要选择最优组合。2.选择最优组合由于产量越大越好,因此选择方差分析显著的因素中产量较大的处理。虽然C因素不显著,但AC互作表现显著,因此可在选择A处理的基础上进一步选择C。D因素由于不显著,故不做选择。Freq_a-tapply(yield,data[,1],mean)Freq_b-tapply(yield,data[,2],mean)data=data[data$a==1,]Freq_ac-tapply(data$yield,data[,6],mean)freq=c(Freq_a,Freq_b,Freq_ac)data.frame(treatment=c(a1,a2,b1,b2,a1c1,a1c2),mean=freq)#作图plot(freq,pch=16,col=2,axes=F)axis(1,0:7,c(NA,a1,a2,b1,b2,a1c1,a1c2,NA))axis(3,0:7,c(NA,a1,a2,b1,b2,a1c1,a1c2,NA))axis(2,seq(190,450,10))axis(4,seq(190,450,10))lines(Freq_a)lines(3:4,Freq_b)lines(5:6,Freq_ac)程序运行结果:A因素中,选择产量均指较大的a1处理,B因素选择均值较大的b2处理,在选择a1处理的基础上,选择均值较大的a1c1处理,即C因素选择c1处理,由于D因素无差异,故最优组合为A1B2C1D1或A1B2C1D2。本试验中A1B2C1D1组合的产量为425,但A1B2C1D2并未出现在本试验中,因此还需另外设计试验验证上述组合是否为最优组合。作图结果:Indexfreqa1a2b1b2a1c1a1c2a1a2b1b2a1c1a1c2280300320340360380280300320340360380
本文标题:正交试验设计的R语言实现
链接地址:https://www.777doc.com/doc-5339182 .html