您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 实验设计与数据分析-81页PPT精品文档
试验设计与数据分析2019年2月修订版本4.0qblinsxu.edu结束•HOWWETEACHISALSOWHATWETEACH,HOWWELEARNISALSOWHATWELEARN.•我们教育的方式本身也是我们教育的内容;我们学习的方式本身也是我们学习的内容。目录•第一章绪论•第二章常用统计分布•第三章参数估计•第四章假设检验•第五章方差分析•第六章回归分析•第七章试验设计•第八章非参数统计分析•第九章主成分分析和因子分析•第十章科技绘图•第十一章常用统计软件多个样本均数间的两两比较?•用方差分析的方法•为什么不能用t检验或µ检验?第五章方差分析5.1方差分析的引入假设检验讨论了检验两个总体均值是否相等的问题,但对于多个总体的均值比较,如果仍用假设检验,就会变得非常复杂。总体如果收集了若干个(比如说k个)样本,欲知道它们各自所来自的总体的平均数是否都相等,需要使用方差分析方法。在这里,被测验的假设是HO:1=2=…=kvsHA:并非所有i都相等表5-1每组含n个观察值的k组样本的数据符号(i=1,2,…,k;j=1,2,…,n)组号观察值总和平均数方差1x11x12…x1j…x1nT11x21s2x21x22…x2j…x2nT22x22s…………………………ixi1xi2…xij…xinTiix2is…………………………kxk1xk2…xkj…xknTkkx2ksTx方差分析(ANOVA:analysisofvariance)能够解决多个均值是否相等的检验问题。方差分析要检验各个水平的均值是否相等,采用的方法是比较各水平的方差。方差分析实际上是用来辨别各水平间的差别是否超出了水平内正常误差的程度5.2怎样得到F统计量水平间(也称组间)方差和水平内(也称组内)方差之比是一个统计量。实践证明这个统计量遵从一个特定的分布,数理统计上把这个分布称为F分布。即注意:组间方差(SSB)+组内方差(SSw)=总方差(SST)F=组间方差/组内方差/(1)/()BWSSgFSSng其中,g-1,n-g分别是F统计量分子分母的自由度F分布的特征从F分布的式子看出,F分布的形状由分母和分子两个变量的自由度确定,因此F分布有两个参数。F分布的曲线为偏态形式,它的尾端以横轴为渐近线趋于无穷。自由度(25,25)自由度(5,5)自由度(30,100)方差分析的前提不同组样本的方差应相等或至少很接近水平1水平2水平1组内方差远远超过两水平组间方差,我无法分离这两种差别!方差分析的应用条件各样本是相互独立的随机样本各样本来自正态分布或其他连续型分布各样本方差相等,即方差齐。多个均值比较时,当零假设为真时,的组间估计和组内估计应该很接近,即其比值应接近于1。而当零假设不成立时,的组间估计将偏大,从而两者的比值会大于1,因此我们构造形如深入理解F统计量(1)22F=组间方差/组内方差的检验统计量,在一定的置信水平下,将这个值和某个临界值作比较,就可以得出接受还是拒绝零假设的结论。深入理解F统计量(2)F统计量实际上是用来比较组间差异与组内差异的大小,造成这种差别既有抽样的随机性,也可能包含系统因素的影响。组间差异是用各组均值减去总均值的离差的平方再乘以各组观察值的个数,最后加总组内差异则是各组内部观察值的离散程度21()gjBjjnXXSS211)(jjWngijjiXSSX深入理解F统计量(3)总离差组内方差组间方差211()jngTijjiSSXX21()gjBjjnXXSS211)(jjWngijjiXSSXjigjijjXXX第个水平中的第个个体水平的个数总体的均值第个水平的样本均值深入理解F统计量(4)上述组间差异与组内差异必须消除自由度不同的影响对SSW,其自由度为n-g,因为对每一种水平,该水平下的自由度为观察值个数-1,共有g个水平,因此拥有自由度个数为对SSB,其自由度为g-1,g为水平的个数。/(1)/()BWSSgFSSnggjj=1g(n-1)=n-g5.3检验方差假设一般检验步骤对于k个总体均值是否相等的检验:012:kH1:H总体均值不全相等/(1)/()BWSSgFSSng检验统计量为:给定显著性水平α的拒绝域:cr0F(g-1,n-g)F,H如果则拒绝其中,g-1,n-g分别是F统计量分子分母的自由度/(1)/()BWSSgFSSngFcrF的抽样分布拒绝域接受域如果F值显著或极显著,否定了无效假设HO,表明各总体平均数间存在显著或极显著差异,但并不意味着每两个平均数间的差异都显著或极显著,也不能具体说明哪些平均数间有显著或极显著差异,哪些差异不显著。下一张主页退出上一张多重比较因而,有必要进行两两平均数间的比较,以具体判断两两处理平均数间的差异显著性。统计上把多个平均数两两间的相互比较称为多重比较(multiplecomparisons)。多重比较的方法甚多,常用的有最小显著差数法(LSD法)和最小显著极差法(LSR法)。多重比较结果的表示法各平均数经多重比较后,应以简明的形式将结果表示出来,常用的表示方法有以下两种。1、三角形法此法是将多重比较结果直接标记在平均数多重比较表上。p值大于0.05者不显著,在差数的右上方标记“ns”,或不标记符号;介于0.05与0.01之间者显著,在差数的右上方标记“*”;小于0.01者极显著,在差数的右上方标记“**”。2、标记字母法此法是先将各处理平均数由大到小自上而下排列;然后在最大平均数后标记字母a,并将该平均数与以下各平均数依次相比,凡差异不显著标记同一字母,直到某一个与其差异显著的平均数标记字母b;下一张主页退出上一张再以标有字母b的平均数为标准,与上方比它大的各个平均数比较,凡差异不显著一律再加标b,直至显著为止;再以标记有字母b的最大平均数为标准,与下面各未标记字母的平均数相比,凡差异不显著,继续标记字母b,直至某一个与其差异显著的平均数标记c;……;如此重复下去,直至最小一个平均数被标记、比较完毕为止。这样,各平均数间凡有一个相同字母的即为差异不显著,凡无相同字母的即为差异显著。•在利用字母标记法表示多重比较结果时,常在三角形法的基础上进行。此法的优点是占篇幅小,在科技文献中常见。•应当注意,无论采用哪种方法表示多重比较结果,都应注明采用的是哪一种多重比较法。同时注明显著性水平。5.4单因素方差分析将一份金属钨试样分发给7个实验室,各室用相同的重量法测定其中的镍,各室都独立地进行6次分析,得镍含量(%)数据见下表:实验室123456711.0651.0731.0801.0971.0531.0841.05221.0811.0811.0901.1091.0551.0441.06131.0811.0771.0701.0731.0501.0841.07341.0641.0501.0801.0891.0591.0761.03651.1071.0771.0901.0971.0531.0931.04861.0771.0771.1001.0971.0611.0731.040问各实验室的分析结果有无显著差异?例5-1用Minitab作单因素方差分析在方差分析之前,我们可利用Minitab对数据作方差一致性检验方差分析时,Minitab能够读取的数据格式与上表给出的格式不同,我们必须把数据转化为Minitab能够理解的形式数据Stat→ANOVA→TestforEqualVariance菜单方差一致性检验适用于正态分布的数据适用于非正态分布的数据方差一致性检验(续)我们一起来实践用SPSS作单因素方差分析在SPSS中,单因素方差分析由One-WayANOVA过程实现,用于进行两组及多组样本均数的比较,如果做了相应选择,还可进行随后的两两比较,甚至于在各组间精确设定哪几组和哪几组进行比较。•【DependentList框】–选入需要分析的变量,可选入多个结果变量(应变量)。•【Factor框】–选入需要比较的分组因素,只能选入一个。SPSS界面说明本部分内容主要参考张文彤主编SPSS11统计分析教程•【Contrast钮】•弹出Contrast对话框,用于对精细趋势检验和精确两两比较的选项进行定义,由于该对话框太专业,也较少用,这里只做简单介绍。–Polynomial复选框定义是否在方差分析中进行趋势检验。–Degree下拉列表和Polynomial复选框配合使用,可选则从线性趋势一直到最高五次方曲线来进行检验。–Coefficients框定义精确两两比较的选项。这里按照分组变量升序给每组一个系数值,注意最终所有系数值相加应为0。如果不为0仍可检验,只不过结果是错的。比如说在下面的例7.2中要对第一、三组进行单独比较,则在这里给三组分配系数为1、0、-1,就会在结果中给出相应的检验内容。•【PostHoc钮】•弹出PostHocMultipleComparisons对话框,用于选择进行各组间两两比较的方法,有:–EquarVariancesAssumed复选框组一组当各组方差齐时可用的两两比较方法,共有14中种这里不一一列出了,其中最常用的为LSD和S-N-K法。–EquarVariancesNotAssumed复选框组一组当各组方差不齐时可用的两两比较方法,共有4种,其中以Dunnetts'sC法较常用。–SignificanceLevel框定义两两比较时的显著性水平,默认为0.05。•【Options钮】•弹出Options对话框,用于定义相关的选项,有:–Statistics复选框组选择一些附加的统计分析项目,有统计描述(Descriptive)和方差齐性检验(Homogeneity-of-variance)。–Meansplot复选框用各组均数做图,以直观的了解它们的差异。–MissingValues单选框组定义分析中对缺失值的处理方法,可以是具体分析用到的变量有缺失值才去除该记录(Excludescasesanalysisbyanalysis),或只要相关变量有缺失值,则在所有分析中均将该记录去除(Excludescaseslistwise)。默认为前者,以充分利用数据。我们一起来实践5.5多因素方差分析方差分析也可以同时分析两个或两个以上的因素,这就是多因素方差分析。有的实际问题需要我们同时考虑两个因素对实验结果的影响。同时对这两个因素进行分析,就属于双因素方差分析,通过分析,我们可以知道究竟哪一个因素在起作用,或者两个因素的影响都不显著。例5-2:双因素方差分析施工温度配方编号配方1配方2配方3配方4冷(4℃)26292133凉(10℃)38304469温(16℃)54378579热(20℃)10377156105特殊环境如水下、高温环境中,建筑材料对水泥的硬化时间有严格的要求。现欲比较几种配方的水泥在不同温度下的硬化时间,其他条件相同,试验结果如下表:适用于正态分布的数据适用于非正态分布的数据方差一致性检验用Minitab作双因素方差分析输入数据运行Stat→ANOVA→Two-way…结果因素-方案水平-温度出现Two-wayAnalysisofVariance对话框后:点选C2到Rowfactor框中点选C3到Columnfactor框中选择Fitadditivemodel点选C1到Response框中红色方框部分为方差分析表Minitab输出结果结果的进一步解释我们将Minitab输出的方差分析表转换为下表。其中F临界值为手工加入。双因素方差分析:C2,C3方差分析表方差来源自由度离差平方和均方FPFcrC2327889292.870.0963.86C3315275509215.730.0013.86误差92913324合计1520976结果的进一步解释C2是配方变量,F=2.87<Fcr=3.86,P=0.0960.05,所以不能拒绝零假设,即认为不同配方的反应时间大体一致,不存在显著差异。C3
本文标题:实验设计与数据分析-81页PPT精品文档
链接地址:https://www.777doc.com/doc-5923979 .html