您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > Minitab单因素方差分析
方差分析方差分析实际工作中这样的问题:几种不同的原料对产品质量有无显著影响这里考察的对象:原料称为因素把因素所对应的状态称为水平当考察的因素只有一个时,称为单因素问题。Minitab方差分析(analysisofvariance简称ANOVA).Minitab方差分析•例考察温度对某一化工产品的得率的影响,选了五种不同的温度,同一温度作了三次试验,测得的结果如下:温度6065707580得率909796848492939683868892938882平均得率9094958584Minitab•要分析不同的温度对得率的影响,考虑如下的问题:同一温度下的得率不一样,差异原因称为试验误差;•温度的不同引起的得率的差异称为条件误差。方差分析Minitab当我们要问温度对得率到底有无确切的影响时,由于上述多种误差原因的存在,就不能随意回答.方差分析Minitab方差分析的功能:分析实验数据中不同来源的变异对总变异的贡献大小,确定实验中的自变量是否对因变量有重要影响。方差分析的方法:检验各总体的均值是否相等来判断分类型自变量(因素)对数值型因变量是否有影响。方差分析Minitab方差分析•方差分析与回归分析的区别:当研究的是两个数值型变量的关系时是回归分析.•回归分析沿水平轴的自变量是数值型变量,而方差分析中是分类变量。Minitab方差分析•在因素只有一个时不一定要采用方差分析,可以采用t-检验和z-检验•t-检验和z-检验不能用于多于2个样本的数据.此时就要采方差分析。•方差分析有单因素与多因素的区分。Minitab单因素方差分析理论基础单因素方差分析单因子试验的一般概述(记号)在一个试验中只考察一个因子A及其r个水平A1,A2,…,Ar.在水平Ai下重复mi次试验,总试验次数n=m1+m2+…+mr.记yij是第i个水平下的第j次重复试验的结果,这里i——水平号,j——重复号.经过随机化后,所得的n个试验结果列于下表.单因子试验的数据:因子A的水平数据和均值1A111211myyy1112111myyyT111/mTy2A222221myyy2222212myyyT222/mTy……rArrmrryyy21rrmrrryyyT21rrrmTy/Minitab单因素方差分析单因子试验的三项基本假定A1.正态性。在水平Ai下的数据yi1,yi2,…,yimi是来自正态总体的一个样本,i=1,2…,r.A2.方差齐性。r个正态总体的方差相等,即.A3.随机性。所有数据yij都相互独立.),(2iiN222221r单因子试验所涉及的多个正态总体Minitab单因素方差分析单因子试验的统计模型其中是因子A的第i个水平下第j次试验结果;是因子A的第i个水平的均值,是待估参数;是因子A的第i个水平下第j次试验误差,它们是相互独立同分布的随机变量.由此可知:单因子试验的三项基本假定用到试验数据yij上去,可得到如下统计模型:iijiijmjriy,,2,1,,2,1,,),0(2Nijyiij),(~2iijNyMinitab单因子方差分析单因子方差分析问题就是在方差相等情况下对多个正态均值是否彼此相等的一个假设检验问题.rH...:210,不全相等诸iH:1.若在显著性水平上拒绝0H,则称因子A在水平上是显著的,简称因子A显著.否则称因子A不显著.检验上述假设的关键在于总平方和的分解.Minitab单因子方差分析总平方和的分解公式单因子试验共有rmmmn21个数据,总平均值:riiirimjijymnynyi11111,imjijiiymy11.总偏差平方和TS:1)(112nfyySTrimjijTi,.可把TS分解为如下两个平方和riiirimjiijrimjiiijTyymyyyyyySii12112112.)()()()(Minitab单因子方差分析AETSSSMinitab2111122112)()()()()(rimjrimjiiijiiijrimjijTiiiyyyyyyyyyyS单因子方差分析总平方和的分解公式其中第一个平方和rimjiijiyy112)(称为组内平方和内S,又称为误差平方和eS,其自由度rnfe.第二个平方和riiiyym12.)(称为组间平方和间S,又称为因子A的平方和AS,其自由度1rfA.Minitab单因子方差分析均方和平方和除以自己的自由度称为均方和,亦可称均方,记为MS.误差的均方和与因子A的均方和分别为rnSMSee,1rSMSAA.定理在单因子方差分析的三个基本假定下,有2)()(rnSEe,riiiAmrSE122)()1()(.其中)(11yEmnriii.Minitab单因子方差分析F检验可以证明:在原假设0H成立下,两个均方和之比服从F分布,即),1(~rnrFMSMSFeA.此F是用来检验原假设0H成立与否的检验统计量.当原假设H0成立时,两个均方和都是2的无偏估计,其比值F不会过大.当原假设H0不成立时,分子的均方和AMS是2的有偏估计,其比值会较大.拒绝域应为cFW,对给定的显著性水平,其中c可由F分布的1分位数),1(1rnrF确定.Minitab单因素方差分析方差分析表来源平方和自由度均方和F比因子AriiiAyymS12)(1rfA1rSMSAAeAMSMSF误差erimjiijeiyyS112)(rnfernSMSee——和TrimjijTiyyS112)(1nfT————当),1(1rnrFF时,拒绝原假设0H,即认为诸正态均值间有显著差异;当),1(1rnrFF时,保留原假设0H,因为尚无发现诸均值r,,,21间有显著差异的迹象,只好保留0H.Minitab例2:茶是一种饮料,它含有叶酸(folacin),这是一种维他命B。如今要比较各种茶叶中的叶酸含量。现选定绿茶,这是一个因子,用A表示。又选定四个产地的绿茶,记为A1,A2,A3,A4,它是因子A的四个水平。为测定试验误差,需要重复。我们选用水平重复数不等的不平衡设计,即A1,A2,A3,A4分别制作了7,5,6,6个样品,共有24个样品等待测试。单因素方差分析Minitab单因素方差分析•采用随机化试验方法,填写试验结果.因子A的水平数据(毫克)样本均值1A7.96.26.68.68.910.19.68.272A5.77.59.86.18.47.503A6.47.17.94.55.04.05.824A6.87.55.05.36.17.46.35Minitab10987654A1A2A3A4四个产地绿茶叶酸含量的打点图(dotplot)图上○表示叶酸含量,–线表示样本均值。下述一些直观的印象是重要.•图中每种绿茶的叶酸含量有高有低.•从样本均值看,A1与A2的叶酸含量偏高一些.•从样本极差看,A1,A2,A3的极差接近,A4的略小一点。单因素方差分析Minitab例5在例4中已求得绿茶叶酸含量的各平方和,现把它们移到方差分析表中,继续进行统计分析.来源平方和自由度均方和F比因子A23.5037.833.75误差e41.77202.09和T65.2723•若取显著性水平=0.05.查表可得10.3)20,3(95.0F.•由于F3.10,故应拒绝原假设0H,即认为四种绿茶的叶酸平均含量有显著差异.•从方差分析表上还可以获得2的无偏估计2ˆ=2.09,09.2ˆ=1.45.单因素方差分析Minitab单因素方差分析诸均值的参数估计•诸i的点估计:iiyˆ,ri,,2,1.•诸i的1区间,可利用t分布获得,具体如下:iimrnty/ˆ)(2/1,ri,,2,1,其中)(2/1rnt是自由度为n-r的t分布的2/1分位数.上述四种绿茶的叶酸平均含量的点估计分别为35.6ˆ82.5ˆ50.7ˆ27.8ˆ4321,,,.其中1A的叶酸平均含量最高,其均值1的95%的置信区间为:1975.01/ˆ)20(mty=14.127.87/45.10860.227.8故均值1的95%的置信区间是[7.13,9.41].Minitab单因素方差分析小结单因子方差分析的主要内容是如下三项:•三项基本假设;•总平方和分解式;•方差分析表.单因子方差分析的主要结果也有三项:•判断诸水平均值r,,,21间有无显著差异;•给出诸水平均值i的无偏估计和1置信区间;•给出方差2的无偏估计.Minitab多重比较多重比较•r个水平均值是否彼此相等?用方差分析方法.•假如r个均值不全相等,哪些均值间的差异是重要的?用多重比较.r,,,21Minitab多重比较同时比较任意两个水平间有无显著差异的问题称为多重比较问题.譬如,r=3时,同时检验如下三个假设:322303113021120:,:,:HHH的检验问题就是多重比较问题的一个例子.这里的关键是“同时”两字.若r较大,要同时检验2r个假设,问题就复杂起来了.多重比较的检验法则很多,一般分为二类:(1)重复数相等的情况;(2)重复数不等的情况.Minitab多重比较重复数相等情况的多重比较(T法)•考察因子A的r个水平,每个水平下重复数均为m.假设诸试验数据),(~2iijNy,mjri,...,2,1,,,2,1.•同时考虑如下2r个假设的检验问题,ijH0:ji,rjiji,,2,1,,.•样本均值iy应是i的很好估计,若ijH0为真,jiyy不应过大,过大就应拒绝ijH0.Minitab多重比较重复数相等情况的多重比较(T法)因此在同时考虑上述假设ijH0时,“诸ijH0中至少有一个不成立”就构成多重比较的拒绝域jijicyyW.•经计算,对给定显著性水平,可得mMSfrqcee/),(1其中),(1efrq是统计量),(efrq的抽样分布的1分位数,可从给定的表中查得.Minitab多重比较重复数不等情况的多重比较(S法)•考察因子A的r个水平均值,每个水平下的重复数分别为rmmm,,,21,且有),(~2iijNy,imjri,...,2,1,,...,2,1.•当jiijH:0成立时,有),1(~)(112eejijiijfFMSmmyyF且ijF不应过大,过大应拒绝ijH0.同时考察2r个假设ijH0时,至少有一个假设不成立就构成该多重比较的拒绝域:cFcFWijjijiijmax.Minitab多重比较重复数不等情况的多重比较(S法)•Scheffe证明了),1(~1maxeijjifrFrF.则对给定显著性水平,取定临界值),1()1(1efrFrc.它等价于如下命题:若记ejieijMSmmfrFrc11),1()1(1•判断:当ijjicyy时,拒绝ijH0,否则保留ijH0.Minitab多重比较的Minitab参数设置•个别误差率与全族误差率(显著性水平)与多重比较关联的类型I误差率(假设检验第I类错误的概率)通常用于确定方差分析中的特定因子水平之间的显著差异。Minitab•个别误差率单一比较错误地断定实测差异与原假设显著不同的最大概率。此概率等于为假设检验选择的显著性水平。•全族误差率由多个比较组成的过程错误地断定至少有一个实测差异与原假设显著不同的最大概率。全族误差率基于个别误差率和比较次
本文标题:Minitab单因素方差分析
链接地址:https://www.777doc.com/doc-412706 .html