您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 《数理统计》(浙大四版)-第9章---方差分析及回归分析.
§11.1单因素方差分析§11.2双因素方差分析§11.3一元线性回归分析工业生产中产品质量的影响因素:原材料、设备、技术及员工素质等;工作中影响个人收入的影响因素:除学历、专业、工作时间、性别等方面外,还有个人能力、经历及机遇等偶然因素.在这众多因素中,每一个因素的改变都可能影响最终的结果,各因素的影响有大有小。故在实际问题中,就有必要找出对事件最终结果有显著影响的那些因素.如何分析这些诸多因素中哪些因素对结果会产生显著影响?——这是方差分析的主要任务!§9.1单因素方差分析基本概念:•试验指标:在试验中要考察的指标,如产品的质量等。•因素:影响试验指标的条件。包括可控因素和不可控因素。•单因素试验:在一项试验中只有一个因素在改变的试验。•多因素试验:在一项试验中多于一个因素在改变的试验。•水平:因素所处的状态。•随机误差:同一水平下,样本各观察值之间的差异,称为随机误差。这种差异可以看成是随机因素的影响。•系统误差:不同水平下,各观察值之间的差异。这种差异可能是由于行业本身所造成的,称为系统误差。§9.1单因素方差分析一、单因素方差分析问题的提法§9.1单因素方差分析试验指标:薄板的厚度因素:机器水平:三台不同的机器即为三个不同的水平单因素试验试验目的:考察机器这一因素对薄板的厚度有无显著的差异§9.1单因素方差分析试验指标:电路响应时间因素:电路类型水平:四种不同的电路即为四个不同的水平单因素试验试验目的:考察电路类型这一因素对响应时间有无显著影响§9.1单因素方差分析试验指标:射程因素:燃料(A)、推进器(B)水平:因素A有4个水平,因素B有3个水平双因素试验试验目的:考察推进器和燃料这两个因素对射程是否有显著影响§9.1单因素方差分析以例1讨论单因素方差分析的方法:在因素的每个水平下进行独立试验,其结果就是一个样本,31X21X11X51X41X32X22X12X52X42X33X23X13X53X43X表中数据可看成来自三个不同总体的样本值,1均值3均值2均值本题需要检验假设:0123:,H1123:,,.H不全相等§9.1单因素方差分析§9.1单因素方差分析假设:2~(,)ijjXN,2,j未知,不同水平下的样本之间相互独立.jA由假设,有2~(0,),ijjXN随机误差记,ijijjX则有单因素试验方差分析的数学模型§9.1单因素方差分析方差分析的任务:为便于讨论,记()引入记号()的效应jA总平均(1.1)因为11111,ssjjjjjjjjnnnnnn记11jnjijijXXn水平Ai下的样本均值;总偏差平方和:AeTSSS111insijijXXn总的样本均值.211()jnsTijjiSXX211()jnsjeijjiSXX21()sAjjjSnXX组内偏差平方和:组间偏差平方和:(误差平方和)反映了全部试验数据之间的差异反映了水平Aj内由随机误差而引起的波动由水平Aj的效应的差异以及随机误差引起总离差平方和分解式:…………………(1.5)§9.1单因素方差分析二、平方和的分解(总变差)(效应平方和)§9.1单因素方差分析三、SE,SA的统计特性各项间相互独立1、SE的统计特性211()jnsjEijjiSXX§9.1单因素方差分析四、假设检验问题的拒绝域2、SA的统计特性§9.1单因素方差分析§9.1单因素方差分析§9.1单因素方差分析§9.1单因素方差分析§9.1单因素方差分析【例5】工程师测量了四种不同类型外壳的彩色显像管的传导率,得传导率的观察值如下表:显像管型号传导率值A1(类型1)143141150146A2(类型2)152144137143A3(类型3)134136133129A4(类型4)129128134129问:外壳类型对传导率是否有显著影响?)05.0(§9.1单因素方差分析,1454/)14650141143(1x解:设水平Ai下的总体为),(~2iiaNX,30560812914114322241412irijx43210:aaaaH43211,,:aaaaH检验假设:VS不全相等;16,4),4,3,2,1(,4nrini已知:;138161;130,133,1444141432ijijxxxxx,90413816305608162241412xxSirijT,6961642412xxSriA,208694904ATeSSS3846.13)/()1/(rnSrSFeA§9.1单因素方差分析方差来源平方和自由度F值临界值因素A总和试验误差)/()1/(rnSrSFeA208)12,3(05.0FF69690412315方差分析表3846.1349.33846.13F因为故拒绝原假设H0,即认为因子是显著的。498.3§9.1单因素方差分析§11.1单因素方差分析§11.2双因素方差分析§11.3一元线性回归分析一、问题的提出实际应用中,影响试验结果的因素往往不止一个,为此需要讨论多因素方差分析问题。(在此只讨论双因素方差分析):因素A因素BB1B2A1A220605090因素A因素BB1B2A1A2201005080表1表2•从表1看出:因素A与因素B各自单独地对试验结果产生影响,相互之间无影响;•从表2看出:因素A与因素B之间的搭配对试验结果产生影响(称为交互作用)。为简单起见,只讨论A、B无交互作用下的双因素方差分析问题,此时对A、B的每一种搭配只进行一次试验。§9.2双因素方差分析假定要考察两个因素A、B对某项指标值的影响,因素A取s个水平A1,A2,…,As,因素B取r个水平B1,B2,…,Br,在A、B的每对组合水平(Ai,Bj)上作一次试验,试验结果为Xij,i=1,…,s;j=1,…,r。所有Xij独立,数据列于下表:要考察因素A、B是否指标值产生显著性影响?§9.2双因素方差分析设搭配(Ai,Bj)下的试验结果为Xij,假定;,,2,1,:210sjaaaHrjjjA;,,2,1,:210riaaaHiriiB),(~2ijijaNX则问题归结为检验假设:§9.2双因素方差分析类似于单因素方差分析的方法,在检验之前,必须把因素A,因素B及随机误差引起的数据波动从总波动中分离出来:记:riijjsjijiriijjsjijiXTXTXrXXsXrsn1111,,1,1,risjijrisjijXTXrsXsjri1111,1.,,2,1;,,2,1于是,2112rsTXSrisjijT,1212rsTTsSriiA,1212rsTTrSsjjB.BATeSSSS§9.2双因素方差分析SA是由因素A的不同效应和随机误差引起的偏差;SB是由因素B的不同效应和随机误差引起的偏差;Se表示由随机误差引起的偏差.));1)(1((~122rsSe定理:(1)ST,SA,SB相互独立,且),1(~122rSA(2)当H0A成立时,).1(~122sSB当H0B成立时,因此,可用比较SA与SE的值来检验假设H0A,用比较SB与SE的值来检验假设H0B.§9.2双因素方差分析));1)(1((~122rsSe可以证明:(1)ST,SA,SB相互独立,且);1(~122rSA(2)当H0A成立时,).1(~122sSB当H0B成立时,));1)(1(,1(~srrFeAeAASSssrSrSF)1()1)(1(//1/22当H0A成立时,有eAeBBSSrsrSsSF)1()1)(1(//1/22)).1)(1(,1(~srsF当H0B成立时,有)),1)(1(,1(rssFFAH0A的拒绝域为)).1)(1(,1(rsrFFBH0B的拒绝域为给定显著性水平,则有§9.2双因素方差分析B1B2…BSA1x11x12…x1sA2x21x22…x2s……………Arxr1xr2…xrs因素A因素BT……2222iTiTiTiT…risjijx1122iT2iT2iT2iTriiT12jT1T2TsT…2jT21T22T2sTsjjT12…,2112rsTXSrisjijT,1212rsTTsSriiA,1212rsTTrSsjjB.BATeSSSSrsn1r1s)1)(1(srriiTs121rsT2sjjTr121数据计算表§9.2双因素方差分析方差来源平方和自由度F值临界值因素A总和试验误差eAASSsF)1(eSAFASTS1s1r)1)(1(sr方差分析表),,[AF拒绝域为:因素BBS1neBBSSrF)1(BF),[BF§9.2双因素方差分析【例1】为了研究不同地点,不同季节大气飘尘含量的差异性,对地点(A)取三个不同水平,对季节(B)取四个不同水平,在不同组合(Ai,Bj)下各测得一次大气飘尘含量(mg/m2),结果列于表11.8,试求研究地点间的差异及季节间的差异对大气飘尘含量有无影响?显像管型号因素B冬季春季夏季秋季A11.1500.6140.4750.667A21.2000.6200.4200.880A30.9400.3790.2000.540)05.0(§9.2双因素方差分析解:方差来源平方和自由度F值临界值因素A总和试验误差848.23AF0199.092.10AF1574.00568.1326方差分析表,92.10848.23AAFF因素B8795.01n848.88BF78.9BF78.9848.88BBFF§9.2双因素方差分析§11.1单因素方差分析§11.2双因素方差分析§11.3一元线性回归分析一、问题的提法确定性关系,不确定性关系,如V=IR,S=vt变量间的关系如身高与体重的关系由度量上的误差与其他不可控的随机因素导致的这种关系称为相关关系。(一元)线性回归就是这种关系中的最简单的一种。回归分析就是寻找这类不确定的变量之间的数学关系式并进行统计推断的一种方法。相关关系§9.3一元线性回归【父与子的身高关系】xy516.073.33ˆxy516.0674.85ˆ(单位:英寸)(单位:厘米)19世纪,英国生物学家、统计学家高尔顿(F.Galton)在研究父与子的身高关系时,提出了“回归”一词,并得到如下回归方程:高尔顿通过研究发现:当父辈身高高于或低于父代身高的平均值时,儿子的身高有向子代平均身高靠近的趋势。父子两代的平均身高有向中心回归的的趋势——回归分析因此而提出。§9.3一元线性回归散点图与一元线性回归模型设x是一可控制的变量(普通变量),是与x有关的随机变量,如何确定这两者的关系呢?Y甲醛浓度x18202224262830缩醛化度26.8628.3528.7528.8729.7530.0030.36Y【例1】在维尼纶的生产过程中经常使用甲醛浓度x来控制缩醛化度,试验结果如下:Y§9.3一元线性回归随机误差),,0(~2N一般假定2与x无关n,,,21),0(2N独立同分布于Y与x具有如下关系:bxaY………………..(1)对于每一个观察点(xi,yi),满足nibxaYiii,,2,1,….(2)(1)、(2)称为一元(正态)线性回归模型,a、b称为回归系数,建立在一元线性回归模型基础上的统计分析称为一元线性回归分析。bxay§9.3一元线性回归一元线性
本文标题:《数理统计》(浙大四版)-第9章---方差分析及回归分析.
链接地址:https://www.777doc.com/doc-4344119 .html