您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 第6章方差分析 (2)
数学建模及其软件实现1第6章方差分析方差分析是R.A.Fister发明的,用于两个及两个以上样本均数差别的显著性检验.由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素.方差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小.6.1单因素方差分析我们把在实验中或在抽样时发生变化的“量”称为因素或因子.方差分析的目的就是分析因子对实验或抽样的结果有无显著影响.如果在实验中变化的因素只有一个,这时的方差分析称为单因素方差分析;在实验中变化的因素不只一个时,就称多因素方差分析.双因素方差分析是多因素方差分析的最简单情形.因子在实验中的不同状态称作水平.如果因子A有r个不同状态,就称它有r个水平.我们针对因素的不同水平或水平的组合,进行实验或抽取样本,以便了解因子的影响.当方差分析的影响因子不唯一时,必要注意这些因子间的相互影响.如果因子间存在相互影响,我们称之为“交互影响”;如果因子间是相互独立的,则称为无交互影响.互影响有时也称为交互作用,是对实验结果产生作用的一个新因素,分析过程中有必要将它的影响作用也单独分离开来.6.1.1单因素方差分析的模型假设设某单因素A有r种水平:1A,2A,…,rA,在每种水平下的试验结果服从正态分布2(,)iN(1,2,,ir).在各水平下分别独立做了in(1,2,,ir)次试验,所得数据见表,其中ijx表示表示第i种水平下第j个试验数据.判断因素A对试验结果是否有显著影响.这里我们假定各种水平下的试验结果有相同的标准差.单因素方差分析问题可以归结为以下的假设检验:012:rH1:H12,,,r不全相等表6-1单因子试验表6.1.2单因素方差分析的原理如何检验统计假设0H?一般情况下,1,2,,r不全相同将反映在ijx(1,2,,;ir1,2,,)ijn取值的大小不同上,这时离差211()inrTijijSxx也比较大.其中111inrijijxxn,1riinn.但是我们还不能只从TS比较大就断定1,2,,r不全相同,因为在1,2,,r全相同时,由于试验中的随机误差影响,TS也可能取比较大的值.为了区别这两种情况,先把离差TS作一个分解.令11iniijjixxn水平试验值均值1A111121,,,nxxx1x2A221222,,,nxxx2xrA12,,,rrrrnxxxrx第6章方差分析22112112211111122111()()()()2()()()()iiiiiinrTijijnrijiiijnnnrrrijiiijiiijijijnrrijiiiijiSxxxxxxxxxxxxxxxxnxx(5.1)记上式分解的第一项为eS,第二项为AS.211()inreijiijSxx,1()rAiiiSnxx有TAeSSS即总离差TS等于组内误差eS与组间离差AS之和.下面分析eS:对任一指定的1ir,21()inijijxx是水平iA下试验数据的离差,是由随机因素造成的.eS是所有水平下离差的和,因而也是由随机因素造成的.形成AS除了随机因素外,如果1,2,,r不全相同,这个差异也要从AS反映出来,一般AS取比较大的值.因此,将AS和eS比较,如果AS不太大,我们只能认为AS是由试验的随机误差形成的,从而接受0H;如果AS太大,我们便有理由怀疑AS完全是由试验的随机误差形成的,认为1,2,,r不全相同,从而拒绝0H.我们将用形如AeScS的判别区域,c由预先给定的信度确定.给定后,需要计算统计量AeSS在0H为真时的分布.可以证明,在0H为真时,(1,)1AeSnrFrnrrS.即1AeSnrrS服从参数为1r和nr的F分布.只需从F分布表,查(1,)Frnr,使((1,))PFrnr.其中(1,)Frnr.最后得到的检验方法是:若(1,)1AeSnrFrnrrS,就拒绝0H,否则接受0H图6-1.(4,10)F时的F曲线和0.05时的临界值6.1.3单因素方差分析表对上一小节的分析进行总结,得到单因素方差分析表6-2.表6-2单因素方差分析表数学建模及其软件实现3差异源离差(平方和)df均方离差F组间离差1()rAiiiSnxxr-11AASSr/AeSS组内误差211()inreijiijSxxn-reeSSnr总和TAeSSSn-1若0.01(1,)FFrnr,称因素A对试验结果有非常显著的影响,用“**”号表示;若0.050.01(1,)(1,)FrnrFFrnr,则因素A对试验结果有显著的影响,用“*”号表示;若0.05(1,)FFrnr,则因素A对试验结果的影响不显著.6.2利用SPSS进行单因素方差分析6.2.1SPSS方差分析对数据的要求应用方差分析对数据进行统计推断之前应注意样本分布的正态性,即偏态分布样本不宜用方差分析.对偏态分布的样本应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态分布的数据后再进行方差分析.在方差分析的F检验中,是以各个实验组内总体方差齐性(方差相等)为前提的,因此,按理应该在方差分析之前,要对各个实验组内的总体方差先进行齐性检验.如果各个实验组内总体方差为齐性,而且经过F检验所得多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体平均数的差异归因于各种实验处理的不同所致;如果各个总体方差不齐,那么经过F检验所得多个样本所属总体平均数差异显著的结果,可能有一部分归因于各个实验组内总体方差不同所致.但是,方差齐性检验也可以在F检验结果为多个样本所属总体平均数差异显著的情况下进行,因为F检验之后,如果多个样本所属总体平均数差异不显著,就不必再进行方差齐性检验.在使用SPSS进行方差分析时,要求因子变量值为整数,而因变量应为定量变量(区间测量级别).SPSS对于偏离正态的样本数据也是稳健的.各组数据应来自方差相等的总体.6.2.2SPSS方差分析过程用SPSS进行方差分析时,选项如图.图6-2SPSS方差分析的选项这些选项的含义如下:描述性:计算每组中每个因变量的个案数、均值、标准差、均值的标准误、最小值、最大值和95%的置信区间.固定和随机效果:显示固定效应模型的标准差、标准误和95%置信区间,以及随机效应模型的标准误差、95%置信区间和成分间方差估计.方差同质性检验:计算Levene统计量以检验组间方差是否相等.该检验独立于正态分布的假设.Brown-Forsythe:指采用Brown-Forsythe分布的统计量进行的各组均值是否相等的检验.第6章方差分析4Brown-Forsythe分布也近似于F分布,但采用Brown-Forsythe检验对方差齐性没有要求,所以当因变量的分布不满足方差齐性的要求时,采用Brown-Forsythe检验比F检验更稳妥。Welch:采用Welch分布的统计量进行的各组均值是否相等的检验.Welch分布近似于F分布,采用Welch检验对方差齐性也没有要求,所以当因变量的分布不满足方差齐性的要求时,采用Welch检验比方差分析更稳妥.均值图:显示一个绘制子组均值的图表(每组的均值由因子变量的值定义).缺失值选项给出了对缺失值的处理方式.例6-1表6-3是关于开发新的DVD播放器的调查数据文件.营销团队调查并记录被调查者的人口统计信息及其对问题的回答.不同年龄段的人们对DVD的评价打分是否不同?表6-3关于DVD播放器的调查数据年龄性别关注组价格易用性外观支持度功能总分年龄组202154576271191284721031118259461010391182110864103811812667101039126241048510372281676931035226118891054022622997510402302384721031237226996434335239674103633614477610343351598861041336168854530337118891094433612510910104434416746710344401156761034444221078810434432379810104444414785101040441159910910474412710551010454512194931035551148876534547253687103454822108671041563129673103566014648910376291534819252331474849323351566829313611154829286202699748371222149948341562163718256221465777321312383557282271449737302441696757344512573837285471269727315数学建模及其软件实现5201345696301291269716292362388826323552310882634654159553628621136771526120267483527128255482524227164875529251248663528563256573526639118982431442239753428451167564426562148385428623146883328123251047332714916866332655123596432754713439232155316967432962711410911252502165711205562346521186612294751266其中“价格得分”、“易用性得分”、“外观得分”、“支持度得分”、“功能得分”都分为10级,值为1至10;“年龄组”分为6级,分别对应10—24岁、25—31岁、32—38岁、39—45岁、46—52岁、53—59岁.解SPSS操作步骤如下:(1)建立数据文件,并导入数据.变量视图如下:图6-3例6-1的数据文件(2)菜单栏点击“分析”,选择“比较均值”,选择“单因素Anova”,打开“单因素方差分析”主对话框.(3)从左边源变量框中选取变量“总体评价”,然后按向右箭头,所选取的变量“得分”进入“因变量列表”框中.从左边源变量框中选取变量“年龄组”,然后按向右箭头,所选取的变量“年龄组”进入“因子”框中.如图6-4.第6章方差分析6图6-4变量选取结果(4)点击对话框中的“选项”,勾选“描述性”和“方差同质检验”.(5)在主对话框中,单击“确定”提交.(6)输出结果及结果分析.表6-4描述结果描述总体评价均值的95%置信区间N均值标准差标准误下限上限极小值极大值18-241331.924.9581.37528.9334.92263925-311231.085.6641.63527.4834.68244032-381035.805.3081.67932.0039.60304439-451038.006.6002.08733.2842.72284746-521229.256.0471.74625.4133.09204153-591128.555.2981.59824.9932.101837总数6832.226.359.77130.6833.761847表6-5方差齐性检验结果方差齐性检验总体评价Levene统计量df1df2显著性.574562.720表6-6方差分析表ANOVA总体评价平方和df均方F显著性组间733.2745146.6554.601.001组内
本文标题:第6章方差分析 (2)
链接地址:https://www.777doc.com/doc-5963115 .html