您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 第五章-方差分析110603
1第五章方差分析在农业、商业、医学、社会学、经济学等诸多领域的数量分析研究中,方差分析发挥了极为重要的作用1了极为重要的作用。这种从数据差异入手的分析方法,有助于人们从另一个角度发现事物的内在规律。方差分析有关术语方差分析中,所要检验的对象称为因素因素或因子(factor)因素的不同表现称为水平水平(level)或处理(treatment)每个因子水平下选得到的样本数据称为观测值观测值。2例:消费者协会想要了解不同行业投诉次数是否有显著差异?因素——水平——观测值——行业(控制变量)每个行业下的投诉次数的样本数据(观测变量)零售、旅游、航空、家电是“行业”这一因素的具体表现单因素4水平实验1.检验多个总体均值是否相等通过分析数据的误差判断各总体均值是否相等2.研究分类型自变量对数值型因变量的影响个或多个分类型自变量方差分析(ANOVA--AnalysisofVariance)3一个或多个分类型自变量两个或多个(k个)处理水平或分类3.有单因素方差分析和双因素方差分析单因素方差分析:涉及一个分类的自变量双因素方差分析:涉及两个分类的自变量方差分析的基本思路检验由单一因素影响的多组样本的某一个因变量均值是否有有显著差异。通过比较各个类别的组内(Withi)4通过比较各个类别的组内(Withingroup)差异和类别之间的组间(Betweengroup)差异大小确定变量之间是否有关。方差分析的基本思想和原理(两类误差)1.系统误差因素的不同水平(不同总体)下,各观察值之间的差异比如,不同行业之间的被投诉次数之间的差异这种差异可能是由于抽样的随机性所造成的,也可能是由于行业本身所造成的后者所形成的误差是由系统性因素5于行业本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差2.随机误差因素的同一水平(总体)下,样本各观察值之间的差异比如,同一行业下不同企业被投诉次数是不同的这种差异可以看成是随机因素的影响,称为随机误差1.数据的误差用平方和(sumofsquares)表示2.组内平方和(withingroups)因素的同一水平(同一个总体)下样本数据的平方和比如,零售业被投诉次数的误差平方和方差分析的基本思想和原理(误差平方和)6比如,零售业被投诉次数的误差平方和组内平方和只包含随机误差3.组间平方和(betweengroups)因素的不同水平(不同总体)下各样本之间的平方和比如,四个行业被投诉次数之间的误差平方和组间平方和既包括随机误差,也包括系统误差2方差分析基本思想明确观测变量(Dependent)和控制变量(Factor)观测变量值的变动受控制变量和随机变量两方面影响SST=SSA+SSE观测值总离差平方组间离差平方和组内离差平方和7由控制变量引起由误差引起组内差异小,组间差异大,说明控制变量给观测变量带来显著影响,即两个变量相关组内差异大,组间差异小,说明观测值的变动是由随机变量引起的,观测变量的的变动不是控制变量引起的,控制变量没有给观测值带来显著影响,即两变量不相关组内差异小,组间差异大,说明控制变量给观测变量带来影响吗?两个变量相关or不相关?组内差异大,组间差异小,观测值的变动是不是控制变量引起的?两变量相关or不相关?变量说明knixxSST2)(SST=SSA+SSE观测值总离差平方和组间离差平方和组内离差平方和由控制变量引起由误差引起系统误差随机误差8ijijxxSST11)(kiiixxnSSA12)(kinjiijjxxSSE112)(个水平下的样本数控制变量第个样本值水平下第控制变量控制变量水平数injixkiij消费者对四个行业的投诉次数行业观测值零售业1旅游业2航空公司3家电制造业4125766683931494451举例说明各变量923456766494034534439294556514921344051657758样本均值样本容量ni7655总均值869565.47235877...6657491x353x482x594xx构造检验的统计量(计算均方MS)1.组间方差:SSA的均方,记为MSA,计算公式为1kSSAMSA2.2.组内方差:SSE的均方,记为MSE,计算公式为knSSEMSE10将MSA和MSE进行对比,即得到所需要的检验统计量F当H0为真时,二者的比值服从分子自由度df1为k-1、分母自由度df2为n-k的F分布,即),1(~knkFMSEMSAF当组间方差较大时,说明分组有意义,两变量相关当组内方差较大时,说明随机误差影响大,两变量不相关方差分析的基本假设前提观测变量各总体应服从正态分布观测变量个总体的方差应相同11单因素方差分析OneWayANOVA①提出H0假设:控制变量不同水平下观测变量各总体的均值无显著差异即:1=2=…=k若有一个不相等,即拒绝原假设12若有个不相等,即拒绝原假设②选择检验统计量(F统计量)③计算检验统计量的观测值和概率p④给出显著水平α,判断:如果p值≤α,则拒绝H0;反之,接受H03SPSSOneWayANOVA步骤①提出原假设H0控制变量不同水平下观测变量各总体的均值无显著差异即:1=2=…=k②选用适当的统计分析方法13操作:Analyze-CompareMeans-OneWayANOVA③读分析结果p即sig.④给出显著水平α,做判断:检验后的拒绝概率p值≤α(显著性水平)?通常α为0.05,或0.01若满足,落在拒绝域反之,接受原假设单因素方差分析消费者对四个行业的投诉次数行业例例1:1:为了对几个行业的服务质量进行评价,消费者协会在四个行业分别抽取了不同的企业作为样本。最近一年中消费者对总共23家企业投诉的次数如下表数据文件:单因素方差分析-不同行业服务质量14行业观测值零售业旅游业航空公司家电制造业12345675766494034534468392945565131492134404451657758单因素方差分析SPSS检验例1:①假设:不同行业的平均投诉次数没有差异②统计方法:Analyze-CompareMeans-OneWayANOVA15ypy③拒绝概率p=0.039④给定显著水平α=0.05,p0.05,拒绝原假设即不同行业的平均投诉次数有明显差异输出结果(1)Descriptives服务质量售NMeanStd.DeviationStd.ErrorLowerBoundUpperBound95%ConfidenceIntervalforMeanMinimumMaximum16749.000010.801234.0824839.010558.989534.0066.00648.000013.594125.5497733.733862.266229.0068.00535.000010.416334.6583322.066447.933621.0049.00559.000012.747555.7008843.171874.828244.0077.002347.869613.758652.8688841.919953.819321.0077.00零售业旅游业航空公司家电制造业Total若现实此结果,需在分析时选择:options-statistics-descriptive输出结果(2)ANOVA投诉次数1456.6093485.5363.407.039270800019142526BetweenGroupsWithinGroupsSumofSquaresdfMeanSquareFSig.17SST(4164.609)=SSA(1456.609)+SSE(2708.000)组间方差MSA(485.536)组内方差MSE(142.526)Sig=0.0390.05,在显著水平=0.05下,拒绝无差异假设,即各个行业的服务质量的均值有差异具体差异可参看描述统计表(1)或均值图(3)2708.00019142.5264164.60922WithinGroupsTotal7060输出结果(3)若显示此结果,需在分析时选择:Option-MeansPlot18行业家电制造业航空公司旅游业零售业Meanof投诉次数5040304单因素方差分析例2:对“休闲调查1”中,以“文化程度”作为影响因素,确定不同文化程度的被调查者的平均家庭月收入是否有显著差异。①原假设:不同文化程度的家庭月收入没有差异19①原假设:不同文化程度的家庭月收入没有差异②统计方法:Analyze-CompareMeans-OneWayANOVA③拒绝概率sig.=0.000④给定显著水平α=0.05,sig.0.05,拒绝原假设即不同文化程度其家庭月收入有明显差异输出结果Descriptives家月收入3610.00101.48958.595357.89862.11500700没读过书小学NMeanStd.DeviationStd.ErrorLowerBoundUpperBound95%ConfidenceIntervalforMeanMinimumMaximum20201066.90451.281100.909855.691278.11380230090928.34692.60173.007783.281073.413175400731008.95400.12046.831915.591102.303362500311091.68487.83287.617912.741270.625002629341358.85499.61285.6831184.531533.186603000311349.06658.206118.2171107.631590.5050040002821071.76579.79434.5261003.801139.723175400小学初中高中中专、技校大专大学本科及以上Total输出结果分析ANOVA家月收入797778761329631.1324.228.0008.6E+07275314485.6479.4E+07281BetweenGroupsWithinGroupsTotalSumofSquaresdfMeanSquareFSig.21组间方差(MEA):1329631.132组内方差(MSE):314485.647F统计量:4.228=1329631.132/314485.647显然,组间(不同文化程度)方差明显大于组内(抽样)方差且sig.=0.0000.05,不同文化程度分组对收入有影响即不同文化程度,家庭月收入有差异9.4E07281单因素方差分析进一步分析方差齐性检验多重比较检验其他检验22方差齐性检验是对控制变量不同水平下各观测变量总体方差是否相等进行分析。理论上如不满足总体方差无差异的前提要求,就不能认为各总体分布相等。23认为各总体分布相等。SPSS单因素方差分析中,方差齐性检验采用了方差同质性(HomogeneityofVariance)检验方法。零假设是变量总体方差无差异方差齐性检验OneWayANOVA-Options-HomogeneityofVarianceTest多重比较检验多重比较是对各个水平下观测变量总体均值的逐对比较单因素方差分析只能判断控制变量是否对观测变量产生显著影事后多重比较则拒绝如果则无法拒绝如果单因素方差分析中00,,HαpHαp24响。如控制变量确实对观测变量产生显著影响,还应进一步确定,控制变量的不同水平对观测变量的影响程度如何,其中哪个水平的作用明显不同于其他水平,哪个水平的作用是不显著的等。如:确定了不同广告形式(电视、报刊等)对销售额有影响,还要了解那种对销售额的影响最明显,哪种不十分明显。掌握这些信息更有利于实施相应的策略拉动销售额5多重比较检验多重比较检验的H0假设是相应水平下各观测变量的均值不存在显著差异。运用的检验方法有L
本文标题:第五章-方差分析110603
链接地址:https://www.777doc.com/doc-5667570 .html