您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > 统计培训教材31方差分析
方差分析-1方差分析(ANOVA)方差分析-2主要内容•变异•方差分析–假设检验–假设–模型•ANOVA模型–单因子方差分析(One-WayANOVA)–双因子方差分析(Two-WayANOVA)–多因子方差分析(Multi-FactorANOVA)方差分析-3变异的类型固有变异•由许多不可避免的小因素累积而成的变异•通常也叫噪声(noise)特殊变异•a)不适当地调教机器b)操作错误c)原材料有缺陷方差分析-4方差分析(ANOVA)方差分析(ANOVA)是R.A.Fisher在进行农业试验时发展起来的对实验数据的变异性进行分析的一套统计方法。方差分析做法:通过试验,以观察某一种或多种因素的变化,对试验结果的观察数值是否有显著影响,从而选取最优方案。例:在化工生产中,影响结果的因素有:配方、设备、温度、压力、催化剂、操作人员等。需要通过观察或试验判断哪些因素是重要的,有显著影响的,哪些因素是不重要的,没有显著影响的。方差分析-5方差分析(ANOVA)•试验中考虑的因素只有一个,即只有一个因素在变,其他因素保持不变,这种试验称为单因素方差分析(One-WayANOVA)。•试验中考虑的因素有两个,这种试验称为双因素方差分析(Two-WayANOVA)。•试验中考虑的因素有k个,这种试验称为k因素方差分析(k-WayANOVA)。方差分析-6ANOVA的应用因素所处的状态,称为水平(Level)。例如,温度是一个因素,可在50℃,60℃,70℃三个水平下做试验。ANOVA可用于•估计每个变异来源对总变异的贡献。•明确各效应的显著性•估计过程中的随机误差或噪声•计算方差的成份方差分析-7ANOVA—假设检验H0:1=2==r所有总体均值相等H1:至少有两个总体的均值不等ANOVA通过比较组间差和组内差来进行F-检验:如果,则拒绝原假设。.22*内间组内差组间差Fwithinbetween*,;FF方差分析-8ANOVA—假设检验4321201510FactorLevelResponseN(1,1²)N(2,2²)N(3,3²)N(4,4²)N(groups,between²)方差分析-9ANOVA—假设•观察值相互独立.•各水平的数据服从正态分布,即因子水平i~N(i,i²)•各水平的方差相同,即1²=2²==r²方差分析-10ANOVA—模型•固定效应模型(ANOVAI)–因子水平是指定的–相关结论只能对指定的因子水平而言•随机效应模型(ANOVAII)–因子水平是随机抽取的–结论对整个处理总体有效•混合效应模型(ANOVAIII)有些因子是固定的,有些因子是随机的方差分析-11ANOVA—模型一个k–WayANOVA模型,是指试验中包含有k个因素.k–WayANOVAI:k个因素;所有因素效应固定k–WayANOVAII:k个因素;所有因素效应随机k–WayANOVAIII:k个因素;有些因素效应固定,有些因素效应随机注意:当k大于等于2时,还要考虑各因素之间的相互作用(或交互效应)(Interaction).方差分析-12我们要观察的一个input变量(因子)有多个样本时,我们实际上在实施单因子实验(SingleFactorExperiment).我们要分析对象的因子是否有水平间的差异•确定3个供应商的平均交货期是否有差异•确定某个机器的设定值在5个水平间变化时,零件的尺寸是否不同现在开始做第一次实验!…观察.OnewayANOVA的概念(1)–概要方差分析-13OneANOVA的概念(2)–例题考虑如下情景:一个产品开发工程师要研究某个电阻焊接系统中5种不同的电流设置对焊接强度的影响她要研究的电流范围为15-19安培。她将调查5个水平的输入变量(因子):15A,16A,17A,18A和19A。她将对每个水平进行5次实验输出:焊接强度输入:电流这是一个具有5个水平的单因子实验(电流)该实验的结果参考下页.方差分析-14이용접기에대해당신은어떤전류세기를선택하겠는가?그결론은얼마나신뢰할수있다고말할수있는가?OneANOVA的概念(3)–例题存在电流对焊接强度的影响吗?对于这个设备使用哪个电流,你的结论是什么?为什么?电流Meanof强度191817161522201816141210MainEffectsPlot(datameans)for强度方差分析-15输入结果DATA的designmatrix同下.实习:打开窗口Mont52.mtw制作各列数据的dotplot.使用对所有变量相同的格式(SCALE)!OneANOVA的概念(3)–例题强度电流242118151291516171819Dotplotof强度vs电流方差分析-16各均值的95%置信区间(CI)如下.DATAStack后StatANOVAIntervalPlot对电流和焊接强度的关系做什么结论?这结论的置信度是怎样?OnewayANOVA的概念(3)–例题电流强度1918171615252015105IntervalPlotof强度vs电流95%CIfortheMean方差分析-1725201510StrengthDotplotforStrength25201510Dotplotfor15-191516171819设定假设!!!OneANOVA的概念(4)–假设Ha:至少有一个水平产生不同过程H0:数据只描述一个过程的自然散布你认为答案是什么?为什么?方差分析-18OneANOVA的概念(5)–假设•此设计的数学模型是:Ho假设处理项是零数学模型假设常规假设0:Ha0=s:Hok至少一个不同至少一个:Ha:Hok4321Yti=μ+τt+εti其中:yti=来自处理t的单个响应μ=总平均值τt=处理tεti=随机误差方差分析-19OneANOVA的概念(6)–变量选定输入变量作为一个因子。在单因子设计中,因子被当作特征变量处理,即使它可能是间隔值或比率。如果因子自然为连续型的,可以把它分类成子群。-例如,我可以采用低和高来度量生产线的压力值。-我们可以作中值分离(MedianSplit)来把因子分成两个水平:低和高。-对于我们的例子,因为电流是连续型变量,我们把它分成5个等级。输出一般以间隔值或比率范围来度量(合格率,温度,电压,等等)输出变量可以是分离型或间隔/比率变量方差分析-20ANOVA的原理(1)–总变动因子A的水平是I个,各水平的反复数都是m次,则数据矩阵排列成下面的样子因子的水平A1A2A3A4A5A6…Al实验的反复x11x21x31x41x51x61…xl1x12x22x32x42x52x62…xl2x13x23x33x43x53x63…xl3x14x24x34x44x54x64…xl4x15x25x35x45x55x65…xl5x1mx2mx3mx4mx5mx6m…xlm合计T1T2T3T4T5T6…TlT均值x1x2x3x4x5x6…xlx方差分析-21总均值是用右边的公式求.nTlmTx利用各个DATA和总均值把总均值分解为两个,同下表示.左边和右边平方时同下.ijxx)()()(xxxxxxiiijijxxxxxxxxxxilimjiijlimjilimjiijlimjij111121121122ANOVA的原理(2)–总变动xx方差分析-22上面的第三项变为如下.liilimjiijiilimjiijxxxxxxxxxx1111100limjilimjiijlimjijxxxxxx112112112SS(total)SS(error)SS(factor)同样第8页式从写如下,这意义的略写SS(SumofSquares)来表示.ANOVA的原理(3)–总变动方差分析-23SS(total)的自由度是,T1lmSS(factor)的自由度是,A1lSS(error)的自由度是,Ellm因此EATANOVA的原理(4)–自由度在一个系统中不影响其他变量能够独立移动的数Ex)a*b*c=4这式中变量的自由度是2.假如a,b定为1,2,c必须是2.即能够自然的移动的变量。自由度是?自由度的计算方差分析-24因子(factor)平方和(SumofSquares)自由度(DegreeofFreedom)均值平方(MeanSquare)F值AErrorTotalijiAxxSS2limjijTxxSS1121lmT)1(mlE1lAAAASMSEEESMSEAMSMSF0limjijExxSS112ANOVA的原理(5)–方差分析表方差分析表的制作对错误的均值平方因子,利用A的均值平方的大小观察A效果的大小.•F越大A效果越大.(利用F分布确认P-value)方差分析-25ANOVA的原理(6)–F分布F分布的参考自由度k1,k2的变量的F值的F(k1,k2:α)按α的大小占有面积(发生概率).α(显著水平)F(k1,k2)F(k1,k2:α)方差分析-26F-分布65432100.70.60.50.40.30.20.10.0ScoresProb10%1%5%方差分析-27Exercise某个coating工程认为反应温度对生产的产品的强度有影响,所以对反应温度变化强度有什么变化,还有温度在什么水平时强度最好,进行了实验.反应温度设为因子水平,各温度反复3回,总共12回实验数据随机整理.这结果同下表.制作方差分析表(ANOVAtable).(参考Excelsheet.)200度210度220度230度8.448.599.348.928.368.919.418.928.288.609.698.74合计平均实验反复ANOVA的原理(7)–例题方差分析-28因子(factor)平方和(SumofSquares)自由度(DegreeofFreedom)均值平方(MeanSquare)F值AErrorTotalANOVAtableANOVA的原理(8)–例题F分布表中F是(3,8:0.05)=4.07,F(3,8:0.01)=7.59.那么A是显著水平1%中是否采用零假设?还是推翻?----------要推翻.方差分析-29ANOVA的原理(9)–统计的假定输出的总体方差在给定因子所有水平上都相等(方差均一性(TestforEqualVariance)。我们可以用StatANOVATestforEqualVariance程序来检验这个假设。响应均值是独立的,并服从正态分布。-如果使用随机化和适当的样本数,这个假设一般有效。-警告:在化学过程中,均值相关的风险很高,应永远考虑随机化。残差(数学模型的误差)是独立的,其分布是均值=0,方差为恒量的正态分布。方差分析-30单一因子实验分析•实验结果移动到MINITABWorksheet.•数据有没有异常点利用管理图进行确认.(稳定性分析)•利用StatANOVATestforEqualVariance进行等方差检验.方差同一时实施(p-value0.05)ANOVA.•用StatANOVAOne-way进行分析.•所有的数据在1列时(Stacked):One-way•按水平别数据分几列时(Unstacked):采用One-way(Unstacked..).•解释F-ratio.F-value高p-value显著水平时(一般5-10%)推翻零假设(Ho).•推翻零假设时,利用StatANOVAMainEffectsPlot或StatANOVAIntervalPlot对均值差异利用区间图说明.•利用Minitab的Anova视窗中的残差项目(残
本文标题:统计培训教材31方差分析
链接地址:https://www.777doc.com/doc-985345 .html