您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > 邓畏平-第七章方差分析
第七章方差分析案例分析某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上随机收集了前一时期该饮料的销售情况,见下表。试分析饮料的颜色是否对销售量产生影响。超市无色粉色橘黄色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8水平单元因素因素是指所要研究的变量,它可能对因变量产生影响。在本例中,要分析不同颜色对销售量是否有影响,所以,销售量是因变量,而颜色是可能影响销售量的因素。如果方差分析只针对一个因素进行,称为单因素方差分析。如果同时针对多个因素进行,称为多因素方差分析。水平水平指因素的具体表现,如四种颜色就是因素的不同取值。有时水平是人为划分的,比如质量被评定为好、中、差。单元单元指因素水平之间的组合。如销售方式一下有五种不同的销售业绩,就是五个单元。方差分析要求的方差齐性就是指的各个单元间的方差齐性。要辨别随机误差和包装方式这两个因素中哪一个是造成销售量有显著差异的主要原因,这一问题可归结于判断三个总体是否具有相同分布的问题,从而有以下三种情况:假设1:四组数据来自来自具有相同均值的正态总体(假设方差相等);假设2:四组数据来自具有相同均值与方差的正态总体;假设3:四组数据来自具有相同方差的总体。实践中,人们通常只对假设1、假设2进行统计检验,特别是假设1的检验,即人们通常所说的“单因素方差分析”。单因素方差分析的基本假定1、各个水平的数据是从相互独立的总体中抽取的(独立性);2、各个水平下的因变量服从正态分布(正态性);3、各水平下的总体具有相同的方差(方差齐性)。方差齐性检验(Levene检验)不全相等,,,::242322211242322210HH对于正态性而言,只要不是严重的偏态,在样本量较大的情况下结果都很稳定;对方差齐性问题,只要所有组中的最大、最小方差之比小于3,那么检验结果也是非常稳定的。基本思想方差分析的基本思想就是从不同角度计算出有关的均值与方差,然后通过组内方差与组间方差的对比,在一定统计理论指导下分析条件误差与随机误差,进而分解或判断出实验观察数据中必然因素和偶然因素(随机)的影响大小(统计意义上的显著性)。分析步骤一、建立假设二、构造检验F统计量(水平均值、总均值、离差平方和、均方)三、判断与结论1、计算4个水平均值和总平均值jjjjjjjjxxxxxxxxxxxx444433332222111146.3144.2656.2932.2752.277.285.26总均值ijiijiixxxxxxxxx69.28446.3144.2656.2932.274208.327.317.285.264321211inkijijSSTxx2、计算三个离差平方和之总离差平方和)计算公式为:(差;包括系统误差和随机误)(散状况;)反映全部观察值的离(平方和;的离差与总平均值)全部观察值(4321SSTxxij组间平方和SSA22111inkkiiiijiSSAxxnxx)计算公式如下:(差和系统误差;)该平方和包括随机误(产生的差异大小;)反映了不同水平作用(的离差平方和;与总平均值)各组平均值(43211xx组内平方和SSE(1)每个水平或组的各样本数据与其组平均值的离差平方和;(2)反映的是水平内部数据的离散状况,实质上是随机因素带来的影响,又称为误差平方和;(3)该平方和反映的是随机误差的大小;(4)计算公式为211inkiijijSSExx三个平方和的关系22211111iinnkkkiijiiijijiijxxnxxxxSST=SSA+SSEdf自由度():n-1=(k-1)+(n-k)3、计算两个均方差MS(1)SSA的均方也称组间方差,记为MSA,计算公式为1kSSAMSA自由度组间平方和(2)SSE的均方也称组内方差,记为MSE,计算公式为knSSEMSE自由度组内平方和4、构造统计量F1.将MSA和MSE进行对比,即得到所需要的检验统计量F;2.当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为n-k的F分布,即:),1(~knkFMSEMSAFF分布与拒绝域1SSAKSSEnkF1212{,,}()()PFnnFnnF分布F(k-1,n-k)0拒绝H0不能拒绝H0FASSAF如果因素的各水平对总体的影响显著,那么相对较大,因而也较大。统计决策根据给定的显著性水平,P值,拒绝原假设,即颜色对饮料的销售量有显著性影响。单因素方差分析表(基本结构)方差来源平方和SS自由度df均方MSF值P值(P-Value)F临界值(Fcrit)组间组内总和SSASSESSk-1n-kn-1MSAMSEMSEMSA【例题2】、某次方差分析所得到的一张不完全的方差分析表如下,据此回答问题:差异源SSdfMSFP-Value组间A2CD1.34E-05组内0.000192B0.000016总合0.00124514①、求A,B,C,D的值。②、说明此方差分析的原假设和备择假设。③、在显著水平为α=0.10时,说明方差分析的结果是什么。多重比较多重比较方法有十几种,Fisher提出的最小显著差异方法(LeastSignificantDifference,简写为LSD)使用最多,该方法可用于判断到底哪些均值之间有差异。LSD方法是对检验两个总体均值是否相等的t检验方法,它来源于第六章公式:2111nnsyxtp补充作业题某次方差分析所得到的一张不完全的方差分析表如下,据此回答问题:回答下列问题:1、求A,B,C,D的值。2、说明此方差分析的原假设和备择假设。3、满足方差齐性的要求吗?4、在显著水平为α=0.05时,说明方差分析的结果是什么。5、哪些行业之间的服务质量存在显著性差异?
本文标题:邓畏平-第七章方差分析
链接地址:https://www.777doc.com/doc-5728499 .html