您好,欢迎访问三七文档
方差分析•方差分析是根据试验结果进行分析,鉴别各个因素对试验结果的影响程度。•例如–在化工产品中,某些因素直接影响着产品的数量和质量(如原料成分、原料剂量、催化剂、反应温度、压力、浓度、时间、设备、人员素质等)–环境对生产力的影响(噪声、湿度、温度等)–研究四种不同的药物对儿童咳嗽的治疗效果。……方差分析又如–美国三大汽车公司(A,B,C)生产有五种不同的车型,试分析汽车的油耗情况。ⅠⅡⅢⅣⅤA20.321.218.218.618.5B25.724.719.319.320.7C24.023.120.619.821.4不同公司间产品的油耗量有无差异?汽车型号的油耗量有无差异?一、基本原理•试验指标Y,样本y1,y2,…,yn影响试验指标的因素记A,B,C,…每个因素下又分几种状态,记为A1,A2,…Ar或B1,B2,…,Bs例如,Y——小麦产品,因素A——温度,有如下状态(4个水平):40℃(A1),60℃(A2),80℃(A3),100℃(A4)四种状态称为水平。一、基本原理在每种状态下,又测得n个数据,即样本。以上表格反映的是单因素方差分析的数据结构。40℃(A1)y11,y12,…,y1n60℃(A2)y21,y22,…,y2n80℃(A3)y31,y32,…,y3n100℃(A4)y41,y42,…,y4n一、基本原理设Y——小麦产量,A——温度(4),B——品种(3),AB40℃(A1)60℃(A2)80℃(A3)100℃(A4)B1y111,…,y11ny121,…,y12ny131,…,y13ny141,…,y14nB2y211,…,y21ny221,…,y22ny231,…,y23ny241,…,y24nB3y311,…,y31ny321,…,y32ny331,…,y33ny341,…,y34n以上表格反映的是双因素方差分析的数据结构。思考:多因素方差分析的数据结构。二、单因素方差分析1、数据结构模型假定21~(,)N22~(,)N2~(,)rNA1A2………Ar211,ys222,ys2,rrys数据准备水平2(,),1,...,,1,2,...,iijiiyNirjn独立同分布于模型假定111121,,nyyy211121,,nyyy11121,,rnyyy二、单因素方差分析2、数据形态12345345678910ValuesColumnNumber二、单因素方差分析10;riiin易证:()iije,1,2,...,,1,2,...,;iijieirjn()ijiijye分解思想111,,rriiiiiiinnnn2~(,),1,...,,1,2,...,ijiiyNirjn其中2、数学模型2(0,)~,ijijNee且诸相互独立;二、单因素方差分析,(1,2,)iiir其中为未知参数。2,1,2,...,,1,2,...,;~(0,),ijiijiijijyeirjneNe且诸相互独立;归纳:A1y11,y12,…,y1nA2y21,y22,…,y2n………Aryr1,yr2,…,yrn数据结构表3、方差分析01212:...(...0)rrH或112:,,...,rH中至少存在一对不等对问题H0,提出一种称为方差分析的检验方法。,11,1,,iniijjiyyirn11111inrriiijiijyyynnn记11,()riiiiiEyEynn无偏易证2211()inrTijijSyy22.1()rAiiiSnyy2211()inrEijiijSyy记总离差平方和:组间差平方和:组内差平方和:222TAESSS12345345678910ValuesColumnNumber21niiinS若SA2显著地大于SE2,说明组间差异显著大于组内差异,那么H0可能不成立。理论上可以证明:当H0成立时,说明:2221)~(1)TSn2223)~(1)ASr2222)~(1),iiinSn221rEiiiSnS222~()ESnr222TAESSS22/(1)~(1,)/()AESrFFrnrSnr由F分布的定义知:22/(1)AASSr22/()EESSnr记22~(1,)AESFFrnrS则在给定显著性水平α的情况下,关于H0的拒绝域为:01{(1,)}KFFrnr1{(1,)}PFFrnr表2.2单因素方差分析表DF2S2Sp1r2AS2AS22AESFSnr2ES2ES1n2TS方差来源(自由度)(平方和)(均方差)F值P值因素A随机误差总和2TS1n单因素方差分析表2221rAiiiSnyny222111inrrEijiiijiSyny222TAESSS具体计算如下:算例1:载重汽车销售量分析•某公司为了研究三种内容的广告宣传对载重汽车销售量的影响,他们进行了调查统计。以广告不同内容形式的广泛宣传后,按寄回的广告上的订购数计算,一年四个季度的销售量情况如下表:季度一季度二季度三季度四A1A2A3163176170185184198179190206191218224试分析广告内容对载重汽车销售量的影响,并指出哪一种广告内容最佳?程序如下:A=[163184206;176198191;170179218;185190224];p=anova1(A)计算结果:123160170180190200210220ValuesColumnNumberbox图形查表:F0.95(2,9)=4.26和p=0.00390.05结论:拒绝H0.•使用Matlab软件计算第一列•使用excel软件计算•统计分析ii进一步问:哪一种宣传内容较好呢?因为第i种广告内容效应的计算为:它的估计值为:可以计算:ˆiiyy112233173.5190.3316.83;187.75190.332.53;209.75190.3319.42;ˆˆˆyyyyyy计算结果表明:效应值α3最大,说明广告A3引起的销售量最多。算例2:治疗某疾病的药物疗效比较•设有五种治疗某疾病的药,欲比较它们的疗效。现抽取了30个病人,将他们分成5组,每组6人,同组病人使用一种药,并记录病人从开始服药到痊愈所需的时间(天),具体数据如下表:药物A治疗所需要的天数A1A2A3A4A55,8,7,7,10,84,6,6,3,5,66,4,4,5,4,37,4,6,6,3,59,3,5,7,7,60H125•使用Matlab软件计算:计算结果:box图形查表:F0.95(4,25)=2.76和p=0.01360.05结论:拒绝H0.12345345678910ValuesColumnNumber•统计分析根据方差分析,得出结论是:药物治疗某种疾病有显著差异,进一步问:哪一种药物治疗效果较好呢?水平ni均值标准差167.51.64322651.2649364.33331.0328465.16671.472566.16672.0412三、双因素方差分析1、数据结构(有重复和无重复)2(,),1,...,,1,2,...,,1,...,ijkijijyNirjskn独立同分布于BAB1B2……BsA1y111,…,y11ny121,…,y12n……y1s1,…,y1sn………………………Aryr11,…,yr1nyr21,…,yr2n……yrs1,…,yrsn交互效应三、双因素方差分析2、数学模型211110000~(,),,,ijkijkijijijkijkrsrsijijijijeyeeN且各相互独立111111,,1,rssijiijiiijjrjijjjirssr其中()ijijij它为因素A、B的交互效应值2~(,)ijkijyNijijke三、双因素方差分析3、问题0112021203:...0:...0:0,1,...,,1,...,rsijHHHirjs,22222TABABESSSSS同理可推导分解公式和统计量的计算公式:221111111(),rsnrsnTijkijkijkijkSYYYYrsn111111,snrniijkjijkjkikYYYYsnrn222211(),()rsAiBjijSsnYYSrnYY22111()rsnEijkijijkSYY2211()rsABijijijSYYYY三、双因素方差分析有交互作用的双因素方差分析表方差来源平方和自由度均方差F值p值因素A因素B交互效应A×B误差总和2ABS2BS2AS2ES2TS2AS2BS2ABS2ES1r1s(1)(1)rs(1)rsn1rsn22/AEAFSS22/BBEFSS22/ABEABFSS1()AApApPFF1()BBpBpPFF1()ABABpABpPFF输入的数据形式:例5.3.2选择:输出结果:ABAB误差正交设计•正交(试验)设计是最常用的一类试验设计方法。主要解决多因素的方差分析。•例如,有5个因子,每个因子下面有5个水平,无重复,则全面试验的组合数为:55=3125。•如果重复进行试验呢?一、正交表特点:1)每列字符“1”,“2”出现的频数是4;2)任两列出现字符“(1,1),(1,2),(2,1),(2,2)”的频数为2;Ln(r1×r2×…×rm)试验次数列数第2列水平数111112221333212322322311313232233311思考:正交表的符号:给定参数ri,m,n,是否一定存在正交表?1111112222211222221131212321214122142112下面两个表是否是正交表?表符是什么?全面实验:27次正交实验:9次特点:每个面分布3个点,每条线上分布1个点,充分体现均匀性,具有代表性。例:考虑因素A,B,C,每个因素三个水平。B1B2B3A1A2A3C1C2C3L9(34)L27(37)的全面试验次数2187,正交实验只需要27次。二、利用正交表安排试验•安排试验例1为了提高某种化工产品的得率(单位:%),想通过试验确定有关三个因素的一个较好方案。三个因素的水平如下:(假设不考虑交互因素)二、利用正交表安排试验•步骤:选择正交表L9(34)正交表的列数应该大于因子数,因子水平要与表的符号数一致。如果要考虑交互作用,则应选择正交表L27(37)。表头设计把三个因子随意安排在三列上,假定分别安放在前三列上。二、利用正交表安排试验制定具体的试验方案二、利用正交表安排试验(无交互作用)按设计方案进行试验y1y2∶·∶y9思考:若重复试验呢?样本三、方差分析计算2121,,1,2,,rjjlljjnQKhhrSQPjm222221234TSSSSS计算公式:91iiKy21PKn212,niiTQySQP极差:602436→ACB三、正交表的方差分析欲考察每个因子在各水平下的效应是否有显著差异等价于检验以下问题:123123123000:::OAOBOCHHH333111000,,iiijjj
本文标题:方差分析(-)
链接地址:https://www.777doc.com/doc-3656004 .html