您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 应用统计学:经济与管理中的数据分析8
第八章试验设计与方差分析初步•试验设计与方差分析概述•因素试验设计与方差分析•配对比较试验设计与方差分析•随机化区组设计与方差分析•二因素无交互作用设计与方差分析•二因素有交互作用设计与方差分析•用EXCEL实现方差分析§8.1试验设计与方差分析概述一、基本术语在试验设计中,响应就是试验的观察或结果。影响响应的因素,称为因素。处理(treatment)是指因素水平的组合。重复是指试验中的每一种处理应施加于多个试验单元(experimentunit),而不应仅仅施加于一个试验单元。所谓试验单元是指试验的载体。重复又分为不同单元重复(replication)和同单元重复(repetition)。§8.1试验设计与方差分析概述二、方差分析的基本思想方差分析的基本思想就是比较不同处理之间的差异是否比处理内的差异大得很多,如果是,可能会倾向于认为处理之间有显著差异。将每个处理中的观察值用该处理的均值替代,然后求此时的总平方和,即得到处理间平方和(Treatmentsumofsquares),英文也称FactorAsumofsquares,所以简记为SSA。它描述了处理间差异程度,须注意的是,它还同时考虑了不同处理的试验单元个数。用每个处理组的观察值与该处理组本身的均值求差,称为处理内误差。所有处理内误差的平方和称为误差平方和(errorsumofsquares,简记为SSE)。它描述了处理内部的差异。§8.1试验设计与方差分析概述方差分析恒等式(ANOVAidentity)SSTSSASSE1=1+((NkNk(总自由度)处理间自由度)处理内自由度)注:N表示总观测值数量,总自由度为N-1;k表示水平的个数,处理间差异的自由度为k-1;处理内差异的自由度为N-k。§8.2单因素试验设计与方差分析一、单因素设计的方差分析其中检验统计量:2...12.11()/(1)()/()ikiiiknijiijnyykFyyNk§8.2单因素试验设计与方差分析二、多重比较多重比较方法中,以Fisher提出的最小显著差异方法(LeastSignificantDifference,LSD)最为常用。LSD检验通常使用t统计量其中,是RootofMeanSquareErrors的缩写,亦即表8-2中MSE的平方根。这样,是的标准误。这个t统计量服从自由度为N-K的t分布。..~()1/1/jiijjiyyttNkRMSEnn1/1/jiRMSEnn..jiyy§8.2单因素试验设计与方差分析三、影响最大的处理在因素A影响显著的情况下,因素A的第i个处理的效应,记作,反映了因素A的第i个水平对试验指标的影响,其计算公式如下:其中,是指第i个处理组的均值参数;是所有处理组混合在一起的均值参数。效应值最大(或最小)的处理是影响最大的处理。可以用下式进行无偏估iiiii...ˆiiyy§8.3配对比较试验设计与方差分析分区组配对比较试验设计,可看成是区组大小为两的随机化区组设计。在每个含有两个同质性单元的区组内,将两种处理随机地分配给两个单元。配对比较的方差分析,对于配对试验的检验,当然可以使用本书第七章第三节第二小节给出的小样本检验方法。也可以使用方差分析的方法对配对试验中处理间的差异进行检验。§8.3配对比较试验设计与方差分析【例8-3】天穹公司欲对两种培训方案进行取舍。为了排除学习效应,采用配对比较的试验方法。首先以学历背景、从业年限、历史业绩、职位、性别、性格类型为筛选指标,确定出8对员工,保证每一对员工在上述筛选指标上的表现非常接近。然后,在每一对员工中(也就是一个区组中的两个同质性单元)随机分配两种培训方案。下表给出了每个区组在不同培训方案之后绩效评分的提高值。§8.3配对比较试验设计与方差分析从方差分析的视角来看,配对试验的水平;区组数量为8。这是一个随机化区组试验设计的特殊情形,利用下一节随机区组设计的方差分析表,可以得到例8-3的方差分析表如下:处理间的统计量是13.29,远远大于在5%显著水平上的临界值5.59。因此,拒绝两种培训方案无差异的假设。§8.4随机化区组设计与方差分析一、随机化区组试验设计随机区组设计(randomizedblockdesign)的基本步骤就是选择一系列区组之后,在每个区组中将待比较的处理随机地分配给每个试验单元。一般的,每个区组内的试验单元的个数等于处理的个数或者是处理个数的整数倍。这样,可以保证处理得以随机地分配到相等数量的试验单元上。§8.4随机化区组设计与方差分析二、随机化区组设计的方差分析对于含有k个处理、b个区组(每个区组的大小均为k)的随机化区组设计,它的方差分析表如表8-9所示:§8.4随机化区组设计与方差分析三、随机化区组设计的多重比较处理间无差异的零假设被拒绝后,应对不同处理做两两多重比较。适用于随机区组设计多重比较的t统计量如下:..~((1)(1))1/1/jiijyyttbkRMSEbb§8.4随机化区组设计与方差分析【例8-4】为了确定某种肥料何时使用效果最好,选择了植物园中4个区组,这四个区组各自的日照、植株、土壤等情况是经过精选的以保证各个区组中的6棵花株是同质的。在同一个生长季中,对每个区组中的6棵花株随机分配以下6种处理:在苗期施肥、在开花早期施肥、在开花初盛期施肥、在开花全盛期施肥、在成熟期施肥、不施肥。最后观测果实的甜度,得到表8-10的数据。分析不同时期施肥对果实的甜度是否无差异。§8.4随机化区组设计与方差分析可以得到本例的方差分析表如下:下表给出了例8-4的多重比较结果显著水平为5%、自由度为15的t分布的临界值为2.1315。表中标示*的处理之间有显著的差异。§8.5二因素无交互作用设计与方差分析一、二因素无交互试验设计假设响应受到A和B两个因素的影响,两个因素分别有r和s个水平。将两个因素的不同水平组合在一起就形成处理,总共有种处理。二因素无交互试验就是给每一种处理随机分配一个试验单元,观测试验结果。因此,两因素无交互作用的试验设计也被称为无重复的二因素试验。这类试验主要用来回答:因素A的r个水平均值之间是否存在显著差异,因素B的s个水平均值之间是否存在显著差异。目的是要检验这两个因素对实验结果所起的作用有多大。§8.5二因素无交互作用设计与方差分析二、二因素无交互试验方差分析二因素无交叉试验的方差分析的基本思路是将总平方和分解成因素A的水平间差异、因素B的水平间差异以及处理内的误差项。它们的计算公式如下:§8.5二因素无交互作用设计与方差分析为检验因素B的影响是否显著,采用下面的统计量:其中检验统计量的构造和及其分布如下:~1,11AMSAFFrrsMSE~1,11BMSBFFsrsMSE§8.6二因素有交互作用设计与方差分析一、二因素有交互试验设计要将因素之间的交互作用体现出来,需要增加二因素试验的自由度。采用的办法就是重复。具体地,重复上一节中的二因素无交互试验n(n2)次。在每一次重复中,将r*s个试验单元随机地分配给r*s个处理。、§8.6二因素有交互作用设计与方差分析二、二因素有交互试验的方差分析延续二因素无交互作用试验的方差分析思路,容易想到有交互作用的双因素方差分析的基本思路是将总平方和分解成因素A的水平间差异、因素B的水平间差异、因素A和B的交互作用造成的差异以及处理内的误差项四项。它们的计算公式如下:二、二因素有交互试验的方差分析其中,检验统计量如下:为检验因素A的影响是否显著,采用下面的统计量:为检验因素B的影响是否显著,采用下面的统计量:为检验交互作用的影响是否显著,采用下面的统计量:~1,1AMSAFFrrsnMSE~1,1BMSBFFsrsnMSE~11,1ABMSABFFrsrsnMSE§8.7用EXCEL实现方差分析一、单因素方差分析【例8-7】某饲料生产公司想要确定他们生产的4种不同的饲料的效果,用这4种饲料分别喂养19头牛,经过一段时间后,19头牛的重量变化数据如表8-17所示。问这四种饲料是否显著不同?§8.7用EXCEL实现方差分析用EXCEL对上例进行单因素方差分析的具体步骤如下。第1步:单击【工具】下拉菜单,点击【数据分析】,如下图所示第2步:在弹出窗口中选择【方差分析:单因素方差分析】,然后选择【确定】,如下图所示。§8.7用EXCEL实现方差分析第3步:当对话框出现时:在【输入区域】方框内键入数据单元格区域A2:D6;在【分组方式】选项中的选择取决于数据的组织形式,如果你的数据是一列为一组,则选择“列”,如本例中的情况,反之则选择“行”。在【】方框内键入0.05(可根据需要确定);在【输出选项】选择输出区域(这里我们选择新工作表组);结果如下图:§8.7用EXCEL实现方差分析单击【确定】之后,得到如下图所示的结果§8.7用EXCEL实现方差分析二、无交互作用的双因素方差分析无交互作用双因素方差分析的类型,用EXCEL分析的步骤如下。第1步:单击【工具】下拉菜单,点击【数据分析】。第2步:在弹出窗口中选择【方差分析:无重复双因素方差分析】,然后选择【确定】如下图所示。§8.7用EXCEL实现方差分析图8-7【数据分析】对话框第3步:当对话框出现时:在【输入区域】方框内键入数据单元格区域A1:D9;在【】方框内键入0.05(可根据需要确定);在【输出选项】选择输出区域(这里我们选择新工作表组)。得到下图所示界面:§8.7用EXCEL实现方差分析单击【确定】之后,得到下图所示的结果图8-7§8.7用EXCEL实现方差分析三、有交互作用的双因素方差分析第1步:单击【工具】下拉菜单,点击【数据分析】。第2步:在分析工具中选择【方差分析:可重复双因素方差分析】,然后选择【确定】,如下图所示。§8.7用EXCEL实现方差分析第3步:当对话框出现时:在【输入区域】方框内键入数据单元格区域A1:E9;在【】方框内键入0.05(可根据需要确定);在【每一样本的行数】方框中键入每一水平组合下重复试验的次数,在本例中为2;在【输出选项】选择输出区域(这里我们选择新工作表组)。得到下图所示界面:§8.7用EXCEL实现方差分析单击【确定】之后,可以得到下图所示结果本章小结一、方差分析方法一般用于多总体均值检验。其基本思想是根据方差(变异)的不同来源将总平方和和自由度分解为两个或多个部分,这些组成部分解释某个因素、某几个因素的作用或因素间交互作用以及随机误差。在正态总体和方差齐性的假设下,可以通过构造F统计量进行检验。二、区组是试验设计中发挥核心作用的概念之一。一组同质性单元称为一个区组。区组设计的优势在于能最大限度地消除非处理因素造成的差异,从而可以将处理的影响清楚地表达出来。因此,随机区组设计使用较多,它的基本步骤就是选择一系列区组之后,在每个区组中将待比较的处理随机地分配给每个试验单元。配对比较设计可看成是区组大小为2的随机化区组设计。本章小结三、二因素试验设计根据两个因素相互之间是否有交互作用而分为无交互作用(也称无重复试验)和有交互作用试验设计。在无交互作用的双因素方差分析中,总平方和分解为三部分:因素A的组间平方和、因素B的组间平方和和随机误差的平方和。在存在交互作用的双因素方差分析中,总平方和除了各因素与随机误差的平方和之外,还包括因素间交互作用的平方和。
本文标题:应用统计学:经济与管理中的数据分析8
链接地址:https://www.777doc.com/doc-6425359 .html