您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > 方差分析及MATLAB实现
第1章方差分析(analysisofvariance)§1单因素方差分析1.1数学模型1.2统计分析1.3方差分析表1.4Matlab实现§2双因素方差分析2.1数学模型2.2无交互影响的双因素方差分析2.3有交互影响的双因素方差分析2.4Matlab实现2012年中国石油大学(华东)理学院数学第1章方差分析•在工农业生产和科学研究中,经常遇到这样的问题:影响产品产量、质量的因素很多,我们需要了解在这众多的因素中,哪些因素对影响产品产量、质量有显著影响.为此,要先做试验,然后对测试的结果进行分析.方差分析就是分析测试结果的一种方法.•在方差分析中,把在试验中变化的因素称为因子,用A、B、C、...表示;因子在试验中所取的不同状态称为水平,因子A的r个不同水平用A1、A2、...、Ar表示.2012年中国石油大学(华东)理学院数学§1单因子方差分析§1.1基本概念与数学模型为了考察某个因素A对试验指标(即随机变量X)的影响,在试验时,保持其他因素不变,而仅让因素A改变,这种试验称为单因子(单因素)试验.设试验结果如下表:水平观测值A1x11x12...x1n1A2x21x22…x2n2……………Arxr1xr2…xrnr2012年中国石油大学(华东)理学院数学•例:为寻求适应本地区的高产油菜品种,今选了五种不同品种进行试验,每一品种在四块试验田上得到在每一块田上的亩产量如下:品种田块A1A2A3A4A51256244250288206222230027728021232802902303152204298275322259212•我们要研究的问题是诸不同品种的平均亩产量是否有显著差异.2012年中国石油大学(华东)理学院数学•试验的目的就是要检验假设H0:μ1=μ2=μ3=μ4=μ5是否成立.若是拒绝,那么我们就认为这五种品种的平均亩产量之间有显著差异;反之,就认为各品种间产量的不同是由随机因素引起的.方差分析就是检验假设的一种方法.•在本例中只考虑品种这一因子对亩产量的影响,五个不同品种就是该因子的五个不同水平.由于同一品种在不同田块上的亩产量不同,我们可以认为一个品种的亩产量就是一个总体,在方差分析中总假定各总体独立地服从同方差正态分布,即第i个品种的亩产量是一个随机变量,它服从分布N(μi,σ2),i=1,2,3,4,5.2012年中国石油大学(华东)理学院数学•设在某试验中,因子A有r个不同水平A1,A2,...,Ar,在Ai水平下的试验结果Xi服从正态分布N(μi,σ2),i=1,2,...,r,且X1,X2,...,Xr间相互独立.现在水平Ai下做了ni次试验,获得了ni个试验结果Xij,j=1,2,...,ni这可以看成是取自Xi的一个容量为ni的样本,i=1,2,...,r.•实际上,方差分析是检验同方差的若干正态总体均值是否相等的一种统计方法.•在实际问题中影响总体均值的因素可能不止一个.我们按试验中因子的个数,可以有单因子方差分析,双因子分析,多因子分析等.例中是一个单因子方差分析问题.2012年中国石油大学(华东)理学院数学设试验结果如下表:水平观测值A1x11x12...x1n1A2x21x22…x2n2……………Arxr1xr2…xrnr2012年中国石油大学(华东)理学院数学•由于Xij~N(μi,σ2),故Xij与μi的差可以看成一个随机误差εij~N(0,σ2).这样一来,可以假定Xij具有下述数据结构式:,,...,2,1,111rinnnniiriiriii•为了今后方便起见,把参数的形式改变一下,并记称μ为一般平均,αi为因子A的第i个水平的效应.Xij=μi+εij,i=1,2,...,r;j=1,2,...,ni其中诸εij~N(0,σ2),且相互独立.要检验的假设是H0:μ1=μ2=…=μr2012年中国石油大学(华东)理学院数学•在这样的改变下,单因子方差分析模型中的数据结构式可以写成:所要检验的假设可以写成:iijiijnjriX,...,2,1;,...,2,1,0...:210rH•为了导出检验假设的统计量,下面我们分析一下什么是引起诸Xij波动的原因.riiin102012年中国石油大学(华东)理学院数学•平方和分解公式:引起诸Xij波动的原因有两个:一个是假设H0为真时,诸Xij的波动纯粹是随机性引起的;另一个可能是假设H0不真而引起的.因而我们就想用一个量来刻划诸Xij之间的波动,并把引起波动的两个原因用另两个量表示出来,这就是方差分析中常用的平方和分解法.rinjijTiXXS112)(rinjijiXnX111其中令之间的波动反映之间的偏差平方和来与样本总平均通常用.ijijXXX§1.2统计分析2012年中国石油大学(华东)理学院数学rinjiiijrinjijTiiXXXXXXS112112)..()(则其中交叉乘积项iinjiijriiirinjiijXXXXXXXX1111.)().(2).(.)(211.iniijjiXXn令riiirinjiijXXnXXi12211).(.)(0.).().(21iiriiXtXXX).(.)(2).(.)(11112112XXXXXXXXirinjiijrinjirinjiijiii2012年中国石油大学(华东)理学院数学22111(.)(.).inrrEijiAiiijiTEASXXSnXXSSS记则为一平方和分解式个下面我们来看各式的意义111,.inrijijXXn是所有数据的平均值称总平均值为1.,.1iniijjiXXin是从第个总体中抽得的样本平均值为组平均值称2012年中国石油大学(华东)理学院数学211()(,,.)inrTijijSXX表示所有数据与总平均值的离差平方和是描述全部数据离散程度的一个指标称为总偏差平方和总离差平方和211(.().),,inrEijiijSXX表示每个数据与其组平均值的离误差偏差差平方和反映了试验中的随平方和组内离差平机误称方和差为21((.),.)(),rAiiiSnXXA表示组平均值与总平均值的离差平方和反映了各总因子体因子的不同水偏差平方平均值之和组间离差间的差异程度平方和称为2012年中国石油大学(华东)理学院数学检验统计量的构造:.),,(~,0...:2210且相互独立一切为真时当NXHijn2112)1()(SnXXSrinjijTi)1(~)1(2222nSnST故.2是全体样本的样本方差其中S2012年中国石油大学(华东)理学院数学对于各组样本有212.)1()(iinjiijSnXXi组样本的样本方差是第组样本的样本容量是第其中iSinii2因此rinSniii,,2,1),1(~)1(222.,,,22221相互独立且各组样本方差rSSS分布的可加性知及由21)1(riinrn)(~)1(21222rnSnSriiiE2012年中国石油大学(华东)理学院数学121221212212:,,...,(0,1),,,...,,,...~()...~(),1,2,...,,,...,.()njnjkkjjkXXXnNQXXXfQQQnfCochranffnQfjkQQQ设为个相互独立的随机变量是某些的线性组合的平方和其自由度分柯赫伦分解定别为如果且且理则相互独立2012年中国石油大学(华东)理学院数学.,,)/()1/(,,0...:,0210不真可以认为假设值过大时当也不应太大从而的值不应太大为真时故当假设异程度均值之间的差反映的是因子不同水平由于HFrnSrSFSHSEAArA.)1(~,)()1(122222相互独立与且故有条件全部满足可知柯赫伦分解定理的及由于EAAEATSSrSrnrnSSS2012年中国石油大学(华东)理学院数学),1(~)/()1/(,0...:,210rnrFrnSrSFHEAn为真时当由此可知.,.,,),1(,,001下无显著差异间在显著性水平认为因子各水平否则接受下有显著差异著性水平认为因子各水平间在显拒绝假设时当对给定的显著性水平按照显著性检验程序HHrnrFF•一般,当FF0.01时,称因子的影响高度显著,记为“**”;当F0.01F≥F0.05时,称因子的影响显著,记为“*”;当F<F0.05时,称因子无显著影响,即认为因子各水平间无差异.检验过程:2012年中国石油大学(华东)理学院数学2222..11112222....111,,,1111/(1)/()iiinnrrTijijrijijrriiAAiiiiETAEAEriiinSXnXXTfnnXXSnXTfrnnnSSSfnrSrFSnrnn若因子的每一水平所进行的试验次数不等设在第个水平下试验了次则在具体计算时可用下式,其中为试验的总...111,,.iinnriijijjijXXTX次数§1.3方差分析表2012年中国石油大学(华东)理学院数学方差分析表(ANOVATABLE)方差来源平方和自由度均方和F值显著性因子影响SAr-1SA/(r-1)随机误差SEn-rSE/(n-r)总和STn-1F试验计算表各水平的试验号水平12…ni和xi.和平方x2i.1x11x12…x1n12x21x22…x2n2……………rxr1xr2…xrnr2012年中国石油大学(华东)理学院数学•例:为寻求适应本地区的高产油菜品种,今选了五种不同品种进行试验,每一品种在四块试验田上得到在每一块田上的亩产量如下:品种田块A1A2A3A4A51256244250288206222230027728021232802902303152204298275322259212•我们要研究的问题是诸不同品种的平均亩产量是否有显著差异.2012年中国石油大学(华东)理学院数学计算表各水平的田块品种1234和和平方A125622228029810561115136A224430029027511091229881A325027723032210791164241A428828031525911421304164A5206212220212850722500•解:先列表计算2012年中国石油大学(华东)理学院数学412.2514155359228.1370784)(201iiijijxx5141251411395472523620,4,5ijijijijxxntr这里2.246878.13707841395472TS7.131958.1370784553592241AS5.114917.131952.24687ATESSS2012年中国石油大学(华东)理学院数学89.4)15,4(06.3)15,4(36.2)15,4(99.095.090.0FFF查表知方差分析表方差来源平方和自由度均方和F值显著性因子影响13195.743298.925随机误差11491.515766.1总和24687.2194.31**.89.4)15,4(31.4)15,4(06.399.095.0有显著差异所以不同品种的亩产量因此FFF2012年中国石油大学(华东)理学院数学例:下面给出了随机选取的,用于计算器的四种类型的电路的响应时间(以毫秒计).表:电路的响应时间类型I类型II类型III类型IV19152220182040
本文标题:方差分析及MATLAB实现
链接地址:https://www.777doc.com/doc-3439004 .html