您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 数理统计第八章-假设检验
第八章假设检验假设检验的基本思想和概念参数假设检验正态总体均值的假设检验正态总体方差的假设检验非参数假设检验奈曼-皮尔逊引理和UMPT,,,~iid1n8.1假设检验的基本概念和思想一、基本概念(一)两类问题1、参数假设检验总体分布已知,参数未知,由观测值x1,…,xn检验假设H0:=0;H1:≠02、非参数假设检验总体分布未知,由观测值x1,…,xn检验假设H0:F(x)=F0(x;);H1:F(x)≠F0(x;)),,(~,,1xfiidn则都是复合假设。未知;:或:是简单假设,而:))(()(000100xFxFHHH本课程主要讨论参数假设检验;说明:(1)假设也称为统计假设;(2)H0称为原假设;H1称为备择假设;(3)做假设检验的最终目的是作出推断:是接受原假设,还是拒绝原假设而接受备择假设。(二)简单假设与复合假设如果一个统计假设完全确定总体的分布,则称该假设为简单假设,否则就称为复合假设。),,(~,,1xfiidn例如对于则称(三)检验法则与拒绝域以样本(1,…,n)出发制定一个法则,一旦观测值(x1,…,xn)确定后,我们由这个法则就可作出判断:是拒绝H0还是接受H0.这种法则称为H0对H1的一个检验法则,简称检验法。样本观测值的全体组成样本空间S,把S分成两个互不相交的子集C和C*,即S=C∪C*,C∩C*=,假设当(x1,…,xn)∈C时,我们就拒绝H0;当(x1,…,xn)∈C*时,我们就接受H0.子集CS就称为检验的拒绝域(或临界域)。(四)检验的两类错误我们给出了H0对H1的某个检验法则,即给出了S的一个划分:C与C*,由于样本的随机性,在进行判断时,还可能犯错误。{拒绝H0|H0真}={(x1,…,xn)∈C|H0真}——第一类错误或“弃真”{接受H0|H0假}={(x1,…,xn)∈C*|H0假}——第二类错误或“取伪”这两个事件都是小概率事件,常记P{拒绝H0|H0真}=,P{接受H0|H0假}=,,在0~1之间,通常不超过0.1。(五)显著性检验对于给定的一对H0和H1,总可找出许多临界域,人们自然希望找到这种临界域C,使得犯两类错误的概率和都很小。但在样本容量n一定时,这又是做不到的,除非容量n无限增大。奈曼—皮尔逊(Neyman—Pearson)提出了一个原则:在控制犯第一类错误的概率的条件下,尽量使犯第二类错误小,这是最优检验(MPT),但是有时MPT法则很难找到,甚至不存在。在这种情况下,我们不得不降低要求,另提一些原则。应用上常采纳的原则是“只对加以限制,而不考虑的大小”。二、显著性检验法则的构造构造统计量t=t(X1,…,Xn),x1,…,xn为样本观测值,令T={t=t(x1,…,xn)满足某条件:(x1,…,xn)∈C}于是P{t∈T|H0真}=P{(x1,…,xn)∈C|H0真}=;t∈T通常用一个不等式来表示,这样就得到了一个检验法则。现在,我们已经把S的划分转化为统计量t的值域空间的划分,这是一个把n维的问题转化为一维的问题。按这种法则做出的检验称为“显著性检验”,此时称为显著性水平或检验水平。1500150010:;:经分析要检验的假设为解:HH例:设某厂生产一种灯管,其寿命X~N(,40000),由以往经验知平均寿命=1500小时,现采用新工艺后,在所生产的灯管中抽取25只,测得平均寿命1675小时,问采用新工艺后,灯管寿命是否有显著提高。,从而,有,使故存在的无偏估计,是,而:意味着接受由于拒绝KXKXHH15000150010}1500|1500{}|{00KXPHHP真拒绝;,,其中,真25200)10(~1500X0nNnXnUHzzz645.1375.45/20015001675252001500xU,645.105.005.0计算得,则查表得现给定。简记为:,,其中,,,:得到,其中真时zUzUxxCCxxznUnKzzPHnn},){(})(2001500x{tT}{U,110故观测值(x1,…,xn)∈C,可作出结论:拒绝H0而接受H1:1500,即认为采用新工艺后,灯管寿命有了显著提高.显著性检验的思想和步骤:(1)根据实际问题作出假设H0与H1;(2)构造统计量,在H0真时其分布已知;(3)给定水平的值(一般为0.05,0.025,0.01,0.005等),求出H0对H1的拒绝域C;(4)查表、计算得分位点和统计量的值;(5)比较统计量与分位点值的大小,得出结论,依据是小概率原理。显著性检验解题步骤简述:做假设;构造统计量;推求拒绝域;查表计算;比较大小得结论.8.2单正态总体参数(均值与方差)的假设检验一、单总体均值的假设检验。:;:检验假设,,值,由观测给定检验水平,,,设0100121),(~HHxxNXXniidn1.2已知的情形2/2/0}{)10(~XXU0zUzUPNnnH,可得拒绝域:由,真对于假设H0:=0;H1:0,构造。:反之,接受:而接受,则拒绝若000102/0H;H|X|HznU查表,计算,比较大小,即得结论:说明:(1)H0:=0;H1:u0称为双边HT问题;而H0:=0;H1:0(或0),则称为单边问题;(2)H0:0;H1:0或H0:0;H1:0也称为单边HT问题,不过这是一个完备的HT问题。(3)完备的单边HT问题与不完备的单边HT问题有相同的拒绝域,从而检验法一致。?对于H0:=0;H1:0,2已知,由)10(XXU},|{}|H{~000000,构造真拒绝真NnnKXPHPiidH由P{Uz}=,可得拒绝域Uz=z1同理可知:对于H0:=0;H1:0,2已知的情形,其拒绝域为Uz2.2未知的情形)1n(t~nSXnSXT0H0真由P{|T|t/2(n1)}=,可得拒绝域|T|t/2(n1),查表、计算,比较大小即得结论。此时,对于单边问题H0:=0;H1:0,有拒绝域Tt(n1)=t1(n1);对于H0:=0;H1:0,有拒绝域Tt(n1)。对于假设H0:=0;H1:0,构造二、单总体方差的假设检验1)}1()1({)1(~1)S-(n1)S-(n22/22/1222202202120200nnPnHHH或由,构造:;:对于假设真。:;:检验假设,,值,由观测,给定检验水平,,,设20212020121)(~HHxxNXXniidn1.未知的情形。或可得拒绝域)1()1(22/22/1nn。可解得拒绝域:,:;:而对单边问题;可解得拒绝域:,:;:对于单边问题)1()1(2202120202120212020nHHnHH2.已知的情形。其中。即可作相应的假设检验,此时构造统计量真212222202)(1)(~0niiHXnSnnSnS8.3双正态总体均值差与方差比的假设检验一、均值差的假设检验,,,,,,,设)();(22212111~~21NYYNXXiidniidn21121011HH,21:;:检验假设,;,,,由观测值水平两样本独立,给定检验nnyyxx已知的情形,2221.1)10(~)(222121212221210,构造统计量真NnnYXnnYXUH.zUzU与绝域分别是而对应的单边问题的拒;,即得拒绝域由2/2/}{zUzUP)2()2().2()}2({2121212/212/nntTnntTnntTnntTP与绝域分别是而对应的单边问题的拒,即得拒绝域由未知的情形2221.2)2(~11)(11212121210nntnnSYXnnSYXTwHw真构造未知且不等2221,.3(1)n1=n2此时,可令Zi=XiYi,i=1,…,n,则Z1,…,Zn其中,未知).,(~2ZiidN于是问题回到了单正态总体方差未知时均值是否为零的HT情形。2221221,Z(2)n1n2,不妨假设n1n2此时,可令(斯切非Scheffe法)).,(~2ZiidN问题还是回到单正态总体方差未知时均值是否为零的HT情形.Z1,…,Zn1,...,,1,11121211niYYnnYnnXZnjjiii其中,未知222121221,nnZ则仍有可考虑推求均值差的置信区间的问题二、方差比的假设检验,,,,,设),(NYY);,(NXX222iidn1211iidn1~~212111nnyyxx,,;,,两样本独立,给定检验水平,由观测值1.1,2未知的情形)11(~212222212122210nnFSSSSFH,构造真由P{FF1/2(n11,n21)或FF/2(n11,n21)}=2221122210HH:;:检验假设,,构造真)(~212222122221021nnFSSSSFH即得拒绝域FF1/2(n11,n21)或FF/2(n11,n21)而对应的单边问题的拒绝域分别是FF1(n11,n21)与FF(n11,n21)2.1,2已知的情形即可得到检验的拒绝域。双正态总体参数的假设检验汇总(自己补上).niidnxxNXX,,,观测值,检验水平,,,设121)(~|U|N(0,1)XU)H(HH2/0200010zn已知拒绝域真分布统计量条件)1()1()1(1)S(n)()()(nS22/22/1220222/22/12202202202nornnnornn未知已知)1(|T|1)-t(nXT2/02ntnS未知单正态总体参数的假设检验汇总三.指数分布总体参数的假设检验0100HH:;:,,,设)(~1ExpXXiidn总体X的概率密度为0,00,);(xxexfx由于Y=2X~2(2),故可构造).2(~22200nXnXnYH真给定显著性水平,试由观测值11nxx,,检验假设可得拒绝域:).)//2nY2nY22221(或(8.4分布函数的拟合检验(非参数假设检验)一、皮尔逊2拟合检验法设X1,X2,…,Xn为来自总体X的一个样本,x1,x2,…,xn为样本的观测值,Fn(x)为经验分布函数,F0(x)为已知的分布函数,通常可由样本观测值推测,Fn(x)与F0(x)差异是否显著.皮尔逊用称之为“分歧度”的统计量1.概念kiiiinpnpn12)((8.4.2)来度量Fn(x)与F0(x)差异的大小。他与费歇尔证明了如下定理:定理8.4.1(皮尔逊-费歇尔定理)在H0为真时,不管总体服从什么分布,由(8.4.2)定义的分歧度的极限分布是2(kr1).其中,k为数据分组数,r为F0(x)中未知参数的个数。二、2拟合检验法解题要点将n个观测值x1,x2,…,xn按大小顺序排列:x(1)x(2)…x(n),寻找一个适当的区间[a,b]
本文标题:数理统计第八章-假设检验
链接地址:https://www.777doc.com/doc-1801058 .html