您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > SPSS单因素和多因素方差分析法.
第5章SPSS的方差分析5.1方差分述析概念在上节课中我们讨论了如何对一个总体及两个总体的均值进行检验,如我们要确定两种销售方式的效果是否相同,可以对零假设进行检验。但有时销售方式有很多种,这就是多个总体均值是否相等的假设检验问题了,所采用的方法是方差分析。5.1.1方差分析的概念43210:H方差分析中的术语因素与处理(FactorandTreament)水平(Level)单元(Cell)因素的主效应和因素间的交互效应均值比较协方差分析1.因素与处理因素(Factor)是影响因变量变化的客观条件;例如影响农作物产量的因素有气温、降雨量、日照时间等;处理(Treatments)是影响因变量变化的人为条件。也可以通称为因素。如研究不同肥料对不同种系农作物产量的影响时农作物的不同种系可称为因素,所施肥料可视为不同的处理。一般情况下Factors与Treatments在方差分析中可作相同理解。在要求进行方差分析的数据文件中均作为分类变量出现。即它们的值只有有限个取值。即使是气温、降雨量等平常看作是连续变量的,在方差分析中如果作为影响产量的因素进行研究,就应该将其数值用分组定义水平的方法事先变为具有有限个取值的离散变量2.水平因素的不同等级称作水平。例如,性别因素在一般情况下只研究两个水平:男、女。应该特别注意的是在SPSS数据文件中,作为因素出现的变量不能是字符型变量,必须是数值型变量。例如性别变量SEX,定义为数值型,取值为0、1。换句话说,因素变量的值实际上是该变量实际值的代码,代码必须是数值型的。可以定义值标签F、M(或Fema1e、ma1e)来表明0、1两个值的实际含义,以便在打印方差分析结果时使用。使结果更加具有可读性。3.单元(Ce11)在方差分析中Cell指各因素的水平之间的每个组合。例如研究问题中的因素有性别Sex,取值为1、2;有年龄,分三个水平1(10岁)、2(11岁)、3(12岁)。两个变量的组合共可形成六个单元:[1,1]、[1,2]、[1,3]、[2,1]、[2,2]、[2,3],代表两种性别与三种年龄的六种组合。4.因素的主效应和因素间的交互效应如果一个因素的效应大小在另一个因素不同水平下明显不同,则称两因素间存在交互作用序号销售方式12345水平均值方式一778681888383方式二959278968990方式三717668817474方式四808479708279总均值81.5表5-1某公司产品销售方式所对应的销售量5.1.2方差分析的基本思想在表5-1中,要研究不同推销方式的效果,其实就归结为一个检验问题,设为第i(i=1,2,3,4)种推销方式的平均销售量,即检验原假设是否为真。从数值上观察,四个均值都不相等,方式二的销售量明显较大。从表5-1可以看到,20个数据各不相同,这种差异可能是由以下两方面的原因引起的。一是推销方式的影响,不同的方式会使人们产生不同消费冲动和购买欲望,从而产生不同的购买行动。这种由不同水平造成的差异,称之为系统性差异。43210:H二是随机因素的影响。同一种推销方式在不同的工作日销量也会不同,因为来商店的人群数量不一,经济收入不一,当班服务员态度不一,这种由随机因素造成的差异,我们称之为随机性差异。两个方面产生的差异用两个方差来计量:1,变量之间的总体差异,即水平之间的方差。2,水平内部的方差。注:前者既包括系统性差异,也包括随机性差异;后者仅包括随机性差异。12345.1.3方差分析的基本假设(1)各样本的独立性。即各组观察数据,是从相互独立的总体中抽取的。(2)要求所有观察值都是从正态总体中抽取,且方差相等。在实际应用中能够严格满足这些假定条件的客观现象是很少的,在社会经济现象中更是如此。但一般应近似地符合上述要求。水平之间的方差(也称为组间方差)与水平内部的方差(也称组内方差)之间的比值是一个服从F分布的统计量F=水平间方差/水平内方差=组间方差/组内方差5.2SPSS在单因素方差分析中的应用单因素方差分析也叫一维方差分析,它用来研究一个因素的不同水平是否对观测变量产生了显著影响,即检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。1.使用条件应用方差分析时,数据应当满足以下几个条件:在各个水平之下观察对象是独立随机抽样,即独立性;各个水平的因变量服从正态分布,即正态性;各个水平下的总体具有相同的方差,即方差齐;2.基本原理方差分析认为:SST(总的离差平方和)=SSA(组间离差平方和)+SSE(组内离差平方和)如果在总的离差平方和中,组间离差平方和所占比例较大,说明观测变量的变动主要是由因素的不同水平引起的,可以主要由因素的变动来解释,系统性差异给观测变量带来了显著影响;反之,如果组间离差平方和所占比例很小,说明观测变量的变动主要由随机变量因素引起的。SPSS将自动计算检验统计量和相伴概率P值,若P值小于等于显著性水平α,则拒绝原假设,认为因素的不同水平对观测变量产生显著影响;反之,接受零假设,认为因素的不同水平没有对观测变量产生显著影响。3.多重比较检验问题多重比较是通过对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异。4.各组均值的精细比较多重比较检验只能分析两两均值之间的差异性,但是有些时候需要比较多个均值之间的差异性。具体操作是将其转化为研究这两组总的均值是否存在显著差异。这种比较是对各均值的某一线性组合结构进行判断,即上述检验可以等价改写为对进行统计推断。这种事先指定均值的线性组合,再对该线性组合进行检验的分析方法就是各组均值的精细比较。显然,可以根据实际问题,提出若干种检验问题。121()2341()2One-way过程就是单因素简单方差分析过程,它在Analyze菜单中的CompareMeans过程组中,用One-wayANOVA菜单项调用,可以进行单因素方差分析、均值多重比较和相对比较。One-wayANOVA过程要求因变量属于正态分布总体;如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程;如果几个因变量之间彼此不独立,应该用GLM过程。5.2.4实例进阶分析:股票基金的费用比率1.实例内容Money杂志报告了股票和债券基金的收益和费用比率。10种中等规模的资本股票基金、10种小额资本股票基金、10种混合型股票基金和10种专项股票基金的费用比率的数据见表5-5所示(单位:%)。(1)请检验这4种类型股票基金之间的平均费用比率的差异性。(2)混合型股票基金的费用比率是其他三种类型基金费用比率的平均水平吗?2.实例操作Step01:打开或建立数据文件5-2.sav,选择菜单栏中的【Analyze(分析)】→【CompareMeans(比较均值)】→【One-WayANOVA(单因素ANOVA)】命令,弹出【One-WayANOVA(单因素ANOVA)】对话框。这里“rate”变量表示基金的费用比率;“fund”变量表示基金的类型,其中,“1”表示中等规模的资本股票基金,“2”表示小额资本股票基金,“3”表示混合型股票基金,“4”表示专项股票基金。Step02:在【候选变量】列表框中选择“rate”变量作为因变量,将其添加至【DependentList(因变量列表)】列表框中。Step03:在【候选变量】列表框中选择“fund”变量作为水平值,将其添加至【Factor(因子)】列表框中。Step04:单击【Contrasts】按钮,弹出【One-WayANOVA:Contrasts(单因素ANOVA:对比)】对话框。勾选【Polynomial(多项式)】复选框,激活【Degree(度)】下拉菜单,默认选择【Linear(线性)】选项,表示要进行均值的精细比较。接着在【Coefficients(系数)】文本框中依次输入线性多项式的系数“1”、“1”、“-3”和“1”,并单击【Add(添加)】按钮确认设置。再单击【Continue】按钮,返回主对话框。Coefficients:为多项式指定各组均值的系数。因素变量分为几组,输入几个系数,多出的无意义。如果多项式中只包括第一组与第四组的均值的系数,必须把第二个、第三个系数输入为0值。如果只包括第一组与第二组的均值,则只需要输入前两个系数,第三、四个系数可以不输入。多项式的系数需要由读者自己根据研究的需要输入。Step05:单击【PostHoc】按钮,弹出【PostHoc(两两比较)】对话框。由于这里已计划好对这4组均值进行两两比较,则在其对话框中勾选【LSD】复选框。单击【Continue】按钮,返回主对话框。LSD(最小显著差异法):用t检验完成各组均值间的配对比较。对多重比较误差率不进行调整;Step06:单击【Options】按钮,在弹出的对话框中勾选【Descriptive(描述性)】复选框表示输出描述性统计量,选择此项,会计算并输出:观测量数目、均值、标准差、标准误、最小值、最大值、各组中每个因变量的95%置信区间;勾选【Homogeneity-of-variance(方差同质性)】复选框表示输出方差齐性检验表;勾选【Meanplot(均值图)】复选框表示输出各水平的均值折线图。再单击【Continue】按钮,返回主对话框。Step07:单击【One-WayANOVA(单因素ANOVA)】对话框中的【OK】按钮,完成操作。3.实例结果及分析(1)描述性统计量表SPSS的结果报告中首先输出了描述性统计量,如表5-6所示。首先,中等规模的资本股票基金的平均费用比率(1.440)最低,而专项股票基金的平均费用比率(2.000)最高,但各类型基金的平均值差距不大。其次,从标准差大小来看,中等规模的资本股票基金(0.3806)最低,而混合型股票基金(0.7379)最高。最后,表5-6还列出了各种类型基金的最大值、最小值及95%水平的置信区间。(2)方差齐性检验表5-7是方差齐性检验结果表。表中显示Levene统计量等于2.086。由于概率P值0.119大于显著性水平0.05,故认为这四种类型基金费用比率的方差是相同的,满足方差分析的前提条件。(3)单因素方差分析表表5-7为单因素方差分析表。可以看到,费用比率总的离差平方总和为13.320;不同基金的组间离差为1.772;组内离差为11.548;它们的方差比分别为0.591和0.321,相除得F统计量的观测值为1.841,对应的概率P值为0.157。这里显著性水平为0.05,由于P值大于显著性水平0.05,所以接受零假设,认为不同类型基金的费用比率没有显著性差异。第一栏:方差来源;第二栏:离均差平方和;第三栏:自由度第四栏:均方差(第二栏与第三栏之比);第五栏:F值(组间均方与组内均方之比);第六栏:F值对应的概率即P值(4)多重比较检验结果表5-8显示了两两基金之间费用比率均值比较结果。表中的星号表示在显著性水平0.05的条件下,相应的两组均值存在显著性差异。表中第四列MeanDifference表示两两不同基金费用比率差值的均值。第六列是进行t检验的概率P值,可以通过比较P值大小来判断两两基金之间的费用比率是否有显著差异。从结果来看,只有第一种和第四种基金费用比率的概率P值(0.033)小于显著性水平。因此这四种基金中,只有它们之间的费用比率存在显著性差异,其他基金的费用比率之间都没有显著差异。(5)方差分析的精细比较案例中第二问要比较第三类基金的费用比率和其他基金之间的关系,其实就是要进行均值之间的多项式比较。表5-9首先列出了均值线性组合的系数,其实就是软件操作中第四步输入的数值。表5-10列出了多项式比较结果。SPSS分别给出了方差齐性和方差不齐性的检验统计量和概率P值。本案例中不管方差齐性还是不齐性,其概率P值都显著大于0.05,这说明了零假设成立,即混合型股票基金的费用比率是其他三种类型基金费用比率的平均水平。(6)均值折线图图5-11显示了这四类基金费
本文标题:SPSS单因素和多因素方差分析法.
链接地址:https://www.777doc.com/doc-2859936 .html