您好,欢迎访问三七文档
第八章单因素方差分析?=:210H如,平均数差异的假设检验如何进行关于两样本的。的t检验法答:常采用第五章里讲)?(3a假设检验个样本的平均数差异的a现在,如何进行?两两进行t检验的。评论:这种方法是不行:主要原因有三原因(1):检验的工作量大个21)a(a就有两两组合,当有a个样本平均数,平均数的差。=45个平均数的差。291010时,就有例如,a程序太繁琐。要进行45次t检验,检验法,换句话说,采用两两t原因(2):检验的I型错误增大,从而检验的可靠性低210μ只有一个,即μ2时,Ha3132210=μ,μ=μ,μ=μ有3个,即μ3时,Ha5432210=μμ,,=μ,μ=μ有10个,即μ5时,Haα=0.95被接受的概率为1,H2时只作一次假设检验a00.05定)=1-0.95为真时,但却被我们否型错误(HI0=0.8574=0.95)被接受的概率为(13时作3次检验,Ha3300.142674型错误=1-0.85I=0.5987=0.95)1被接受的概率为(5时作10次检验,Ha101000.401387型错误=1-0.59I。这样的检验是不可靠的,型错误的概率大大增大检验的I的增大,通过以上分析,随着a原因(3)检验统计量的精确性低212122221121112)1()1(nnnnsnsnxx检验的统计量是t。样本的的估计,它只用了两个差σ这部分是对原始数据方2数据的估计有待改善。所以,我们认为对σ。估计σ有被全部同时的利用来但我们有a个样本,没22确性有待提高。因此,两两t检验的精:统计分析方法应使用一种更为合理的的假设检验,3)个样本平均数差异进行关于a(a方差分析方差分析的定义:将试验数据的总变异分解成不同来源的变异,从而评定不同来源的变异的相对重要性的一种统计方法。数据间总变异=不同处理引起的变异+随机误差引起的变异譬如,调查不同品种小麦的产量。产量数据之间的变异可分解为由不同品种引起的变异和由随机误差引起的变异。方差分析的基本思路:将数据的总变异分解为不同处理引起的变异和随机误差引起的变异;通过F检验,比较不同处理引起的变异和随机误差引起的变异的相对大小:如果不同处理引起的变异明显比随机误差引起的变异大,则说明不同处理确实有显著差异;如果不同处理引起的变异明显不比随机误差引起的变异大,则说明不同处理没有显著差异。方差分析术语因素:可能影响实验结果,且在试验中被考察的原因或原因组合,有时也可称因子。水平:因素在试验或观测中所处的状态。处理:实验中实施的因子水平的一个组合。固定因素:该因素的水平可准确控制,且水平固定后,其效应也固定。例如温度,化学药物的浓度,动植物的品系,等等。随机因素:该因素的水平不能严格控制,或虽水平能控制,但其效应仍为随机变量。农家肥的效果,等等。误差:除了实验中所考虑的因素之外,其他原因所引起的实验结果的变化。它可分为系统误差和随机误差系统误差:误差的组成部分,在对同一被测量的多次测试中,它保持不变或按某种规律变化。它的原因可为已知,也可为未知,但均应尽量消除。随机误差:误差的组成部分,在对同一被测量的多次测试中,它受偶然因素的影响而以不可预知的方式变化。它无法消除或修正。主要内容单因素方差分析多重比较一、单因素方差分析1.单因素方差分析的典型数据及其符号ijx2.描述的数学模型3.平方和的分解及其计算4.自由度的确定及均方的计算5.均方期望与统计量F1.单因素方差分析的典型数据及其符号例如:5个小麦品系株高的调查资料品系株号IIIIIIIVV164.664.567.871.869.2265.365.366.372.168.2364.864.667.170.069.8466.063.766.869.168.3565.863.968.571.067.5组总和ix组平均数ix326.565.3322.064.4336.567.3354.070.8343.068.6x=1682单因素:品种;单因素的5个水平(也称处理):I,II,III,IV,V。每个水平设置了5个重复推广到一般情况,a个处理的单因素方差分析数据重复数(j)处理(组别)(i=1,2,...,a)12…i…a1x11x21…xi1…xa12X12x22…xi2…xa23X13x23…xi3…xa3┇j┇┇x1j┇┇x2j┇┇…┇┇xij┇…┇┇xaj┇nx1nx2n…xin…Xan组总和组平均数x1.x2.……xi.……xa.x..几个常用符号说明:njijixx1iixnx1ainjijxx11njiijixxnS122.)(11xanx1和。”表示对一个下标的求注意:“2.描述ijx的数学模型ijiijijxx:可表示成的总体平均数,其中,μ为全体试验值产生的影响。表示处理i对试验结果为第i个处理的效应,αia1iii是常数。且每个α0,α不同处理,则有如果我们只研究这a个.xi..x.x1.x2.xa。为第i个处理的平均数ii固定效应模型。称为噪声)的试验的随机误差(也是ijijx。),0(2Nij布相互独立且服从正态分我们假定这是方差分析的条件。因此,方差分析假定),,(2iijNx~方差分析检验的假设为都相等不是所有的iAaHH::210即,0:0:210都等于不是所有的iAaHH:模型等同于ijiijx方差分析的目的是分析不同处理引起的变异是否显著,从而得出不同处理是否有显著差异。3.平方和的分解及其计算总变异不同处理引起的变异误差引起的变异总平方和SST=处理平方和SSA+误差平方和SSeaiainjiijiainjijxxxxnxx11122211)()()(,即:证明211211])()[()(ainjiijiainjijxxxxxx])())((2)[(1122ainjiijiijiixxxxxxxxaiaiainjiijnjiijiixxxxxxxxn1111212)(])()[(2)(aiainjiijixxxxxxnnjiij111220)()()(1平方和的简易求法CxSSainjijT112CxnSSaiiA121ATeSSSSSS称为校正数其中,2anxC,4.自由度的确定及均方的计算每个平方和都有一个自由度自由度确定的经验规则:自由度是计算该平方和时可以自由变化的量的数目自由度的准确意义是对平方和进行归一化时需要的一个参数,是我们构造假设检验所用统计量的一个组成部分TainjijTdfxxSS的自由度,记为总平方和112)(xxanij个离均差计算该量时,需要。这一条件的约束化,但受到每个离均差可以自由变0)(11ainjijxx11-目资料中所有观测值的数所以,自由度andfTAaiiAdfxxnSS的自由度,记为处理平方和12)(,共a个量计算该量时,需要xxi。这一条件的约束但受到0)(1aiixx11-处理的数目所以,自由度adfAeainjiijedfxxSS的自由度,记为误差平方和112)(,个量共计算该量时,需要anxxiij。),,2,1(0)(1aixxnjiij但受到a个条件的约束ATedfdfaandf所以,自由度,理均方,和误差均方由度便得到总均方,处各平方和除以相应的自即分别记为,,,eATMSMSMSTTTdfSSMSAAAdfSSMSeeedfSSMSeATMSMSMS注意:*。=。,,,:,自由度和均方如下表。试求各平方和场,其稻谷产量盆,随机置于同一盆栽盆,共有每个处理各不施氮肥施尿素施碳酸氢氨水两种不同工艺流程的氨分别施用和处理盆栽试验,设置了5个例一,有一水稻施肥的2045454321AAAAA处理A1A2A3A4A5产量2427313221302428332228212533162626302821合计1089811412680。4重复数n5,验资料,处理数a解:这是一个单因素实如下:平方和和自由度的计算526x8.138334552622=anxC校正数1912.4028.1383314326213024112222andfCCxSSTainjijT-+++总平方和412.3018.1383314135]8012611498108[4111222222adfCCxnSSAaiiA处理平方和154191012.3012.402ATeATedfdfdfSSSSSS误差平方和17.21192.402TTTdfSSMS所以,总均方30.7542.301AAAdfSSMS处理均方73.615101eeedfSSMS误差均方5.均方期望与统计量F所构造的。计量是根据均方的期望方差分析中所使用的统),0(~,2Nxijijiij模型为回顾一下:方差分析的0:0210不等于至少有一个待检验的假设为iAaHH===:aiiAeanMSEMSE12221)()(+:可以证明常称为处理效应aiia122,11。与的大小的大小就可以反映出因此,通过比较iAeMSMS;的差异不大与各相差不大,就可以认为与如果0ieAMSMS。0不可能全为各明显的大,就可以认为比如果ieAMSMS:的证明2)(eMSE])([1)(112ainjiijeeexxEaandfSSEMSE]))(([1112ainjiiijiEaan])([1112ainjiijEaan])2([11122ainjiiijijEaan][111122ainjaiiijnEaan][122aanaan2即构造F统计量和为了比较,,eAeAMSMSMSMS分布),(~eAdfdfeAFMSMSF所以进行上侧检验不可能小于因为,eAMSMS拒绝域为:),(eAdfdfF著差异。得出各处理之间没有显反之,我们接受差异;得出各处理之间有显著定落入拒绝域中,我们否当,,00HHMSMSFeA将上述讨论归纳成方差分析表为单因素方差分析表变异来源平方和自由度均方F均方期望处理SSAa-1MSAF=MSA/MSeσ2+nηα2误差SSean-aMSeσ2总和SSTan-1例二(接例一),建立方差分析表并进行方差分析,以判断5种不同栽培方式的水稻产量是否有显著差异解:方差分析表为变异来源平方和SS自由度均方F统计量处理301.2475F=75/6.73=11.18误差101156.73总和402.219拒绝域为因为,056.3)15,4(05.0F056.3有显著差异的。栽培方式的水稻产量是,得出不同们否定H落在拒绝域内,所以我因为018.11F如果差异显著,则在方差分析表里的F值上标记“*”。如果差异极显著,则在方差分析表里的F值上标记“**”。拒绝域为时所以,在,,=89.4)15,4(01.001.0F89.4有极显著差异。栽培方式的水稻产量是,得出不同以我们否定H再次落在拒绝域内,所因为018.11F变异来源平方和SS自由度均方F统计量处理301.247511.18误差101156.73总和402.219差分析的F检验显
本文标题:第8章方差分析
链接地址:https://www.777doc.com/doc-2112757 .html