您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 高等数理统计-假设检验
第三章假设检验学习目的和要求学习重点学习难点教学方法授课时数基本内容学习目的和要求目的和要求:假设检验的基本概念,理解Neyman-Pearson基本思想。在此基础上,掌握一致最优势检验、一致最优势无偏检验的数学方法、掌握多参数指数型分布族的假设检验、似然比检验、U统计量检验和秩检验。学习重点1、Neyman-Pearson基本思想2、几种类型的假设检验的基本思想。学习难点秩检验教学方法讨论讲授授课时数8学时基本内容第一节基本概念第二节Neyman-Peason引理第三节一致最优势检验第四节一致最优势无偏检验第五节多参数指数型分布族的假设检验第六节似然比检验、U统计量检验、秩检验什么是假设检验?在很久以前的一次有各方人士参加的社交聚会中,一位女士为活跃气氛,声称她能区分在熬好的咖啡中,是先加奶还是先放糖。众人不信,于是有爱凑热闹的人弄来8杯加了奶,放了糖的咖啡请该女士鉴别,结果该女士判断正确7杯,错误1杯。于是很多人都承认该女士的鉴别能力,但是也有一些人却固执地认为该女士既然有鉴别能力,应该都说对,不应该猜错1杯,7对1错的结果完全是瞎蒙出来的。两派人争执不下,正好也出席联欢会的一位统计学者,他认为该问题很有意思,思索良久,写出了推理思路。假设检验相关概念定义1、设(Ω,F,P)为一统计结构,则P的非空子集称为假设,在参数分布族中时,的非空子集称为假设。{:}PP定义2、在一个假设检验问题中常涉及两个假设。所要检验的问题称为原假设。与原假设不相容的假设称为备择假设。011::oHPPHPP在参数分布族中,原假设和备择假设分别为:011::oHHP定义3、在检验问题中,所谓检验法则(或称检验法、或检验)就是设法把样本空间划分成不相交的两个可测集。PWW——W称为检验的拒绝域定义4、在参数统计结构中0()(),PXW1()()1(),PXWPXW定义5称样本值落在拒绝域的概率为检验的势函数,记为()(),gPXW在时,,是检验犯第一类错误的概率。在时,,是检验犯第二类错误的概率。0()g()()g1()1()g1()g定义6检验的水平()()gPXWNeyman-Pearson假设检验理论的基本思想,就是使得犯第一类错误的概率在某一个范围内,然后寻找使犯第二类错误的概率尽可能小的检验。定义7检验函数1()0xWxxW()()(())gPXWEX其势函数为定义8设是定义在P上的可测函数,满足条件,则称为随机化检验函数。()x0()1x()x()x()()(())gPXWEX其势函数为第二节Neyman-Pearson基本引理定义(MPT):在检验问题中,设是水平为的检验,如果对任意一个水平为的检验,都有则称检验是水平为的最优势检验,记为MPT(mostpowerfultest)()x()x01(,)111()()ExEX1()x定理(N-P基本引理)1P设和是可测空间上两个不同的概率测度,关于某个有限的测度,有0P(,)F0101(;),(;)dPdPpxpxdd设原假设和备择假设分别为:0011:,:HH(1)对给定的水平存在一个检验函数及常数k,使得则()x0()EX10101(;)(;)()0(;)(;)pxkpxxpxkpx(2)满足该条件的检验函数是水平为的MPT,反之,如果是水平为的MPT,则一定存在常数k,使得满足上式.()x()x()x注1满足该定理条件的检验函数通常称为似然比检验函数(或称为概率比检验函数)。如()x0011:,:HH定义似然检验比函数10(;)()(;)pxxpx注2在似然比函数具有连续分布函数时,MPT检验函数可以取为非随机化的形式1()()0()xkxxk其中k由确定00(){()}EXPxk若似然比函数为离散型随机变量时,可在集合实施随机化。MPT函数可取为{:()}xxk0001{()}{()}{()}PXkPXkPXk例题设样本是来自正态总体,考虑如下的假设:0111:0,:(0)HH在水平为时,构造似然比统计量1_21111(;)()exp{0.5}(;0)niiniipxxnxnpx则MPT的拒绝域具有形式_{:()}{:}Wxxkxxc令1Ucn即可此题中若呢?10例题设样本来自Poisson分布族0111:1,:(1)HH在水平为时,构造似然比统计量11111(;)()exp[(1](;1)niinixiiniipxxnpx1niiTx取统计量由N-P基本引理,检验函数为115()15015TxrTT关于简单假设对简单假设的检验问题,N-P基本引理给出了令人满意的解决方案。在实际问题中,往往出现的是复合假设的情况。定义(UMPT):在检验问题中,设是水平为的检验,如果对任意一个水平为的检验,都有则称检验是水平为的一致最优势检验,记为UMPT(uniformlymostpowerfultest)()x()x01(,)11()()ExEX1()x一致最优势检验问题(UMPT)在某些情况下,UMPT可以直接从N-P引理推出性质1设是检验,是的子集,如果是的UMPT,则是的UMPT。()x()x01(,,)011(,,)()x01(,,)010性质2设是检验,则是的UMPT的充要条件是,对每一个,是的MPT。()x01(,,)()x01(,,{})1101(,,)()x性质3设是检验,假设对某个的和对某一个,都是的MPT,则也是的UMPT。()x01(,,)()x0001(,,)()x1101(,{},{})如果简单原假设对简单备择假设的检验问题的MPT不依赖于备择假设的具体数值,则可适当扩大备择假设;而当势函数是单调函数时,也可适当扩大原假设。反之,对于复合假设检验问题,MPT的依赖于备择假设中的,则UMPT不一定存在。()x对下面几种检验问题进行讨论:001000100010010112012110()::;()::;()::;()::;();:;IHHIIHHIIIHHIVHHVHH或或类型III,IV一般无UMPT,所以不讨论。类型I,II类似,V过于复杂,且不实用,所以只讨论类型I即可。定义:设是含有实参数的概率密度族,其中是实直线上的一个区间。如果存在实值统计量T(X),使得对任意,都有(1)概率分布与是不同的;(2)似然比是T(x)的单调函数,则称概率密度族关于T(x)具有单调似然比MLR(montonelikelihoodratio)。{(;):}px{(;):}px1P2P21(;)()(;)pxxpx12如单数指数型分布族(;)()exp{()()}()pxcQTxhx若Q函数是单调函数,则222111(;)()()exp{[()()]()}(;)()pxcxQQTxpxc是T(x)的单调函数定理:设单参数概率密度族关于实值统计量T(x)具有非降MLR,则对于单边假设检验问题(I),存在水平为a的UMPT检验函数1()(())()0()TxcTxrTxcTxcr由下式确定0(())ETX同学们请参考例3.5(P189)所以在很多情况下,对于一个复合假设的检验问题,UMPT不存在.所以必须找出构造检验法(不管是简单假设还是复合假设)的一般方法.人们提出了似然比检验方法.似然比检验设X=(X1,X2,…,Xn)的分布密度函数是p(x;θ),对于简单假设:0011:,:HH检验问题的似然比为:10(;)()(;)pxxpx对于复合假设:0011:,:HH我们可定义1010sup(;)(;)()sup(;)(;)pxpxxpxpx这里,θ0和θ1分别是H0和H1成立时,θ的MLE。P(x;θ1)是备择假设成立时,观察到样本点x的可能性的一个度量;P(x;θ0)是原假设成立时,观察到样本点x的可能性的一个度量.在λ(x)比较大时,备择假设成立观察到样本点x的可能性比较大,因此可拒绝原假设.故检验的拒绝域可设为:{:()}xxc请同学们参考例题3.14(P220)一般来说,为了更好地确定c的值,要对似然比检验函数的分布形式进行研究,但似然函数一般没有确定的分布形式和分布规则.1938年,统计学家Wilks研究了似然比统计量的极限分布,并得到了一个重要的定理。定理3.18(P222)^101(;)()(;)niiniipxxpx其中,是参数的MLE。^22ln()()nXk原假设成立时例题3.16(P225)例题样本且全部样本独立.要检验假设21,,,.,(,),1iimiiXXiidNim22220111::mmHH不成立记___2121112211(),,iinniiijiiiijjjmmiiiSnXXXnXnSSnnn则221112lnlnloginnniikrmnniiSYnsnSS所以大样本似然比检验有否定域21()nmY非参数统计结构的假设检验问题前述各种检验方法基本上适用于参数统计结构,这些方法往往要求总体分布族的密度函数的数学形式已知,且只含有限个未知参数,但有些时候,人们难于由经验或某种理论得到总体的参数统计结构,而只能得到非参数统计结构。因此有必要寻求非参数统计结构的检验方法。游程检验检验随机性的一个重要方法。0::H1随机性H没有随机性(有聚类倾向)Bernoulli实验:掷一个硬币,以概率p得正面(记为1),以概率1-p得反而(记为0)。得到下面的结果:00000001111110000111100称连在一起的0或者1为游程(run),则上面这组数中有3个0游程,2个1游程,总共有5个游程(R=5)。0的总个数m=13,1的总个数为n=10。记总的实验次数为N,N=m+n。由常识得知,如果这个实验是随机的,则不大可能出出太多的1或0的游程。11111111112(2)(21)kkmnnNkkkkmnmnnNCCPRkCCCCCPRkC原假设成立时,算出或的值,也就可以做检验了()PRr()PRr在m或n不大时,可直接计算得出。12()()PRcPRc及而当样本很大时,即时,在零假设下,mnrn32/(1)(0,1)4/(1)RmrZNrmr可以借助于正态分布表得到p值和检验结果,在给定水平a后,可以用下面的近似公式来得到临界值2212221,11zzmnmnccmnmnmnmn在实际问题中,不一定都碰到只有0或1所代表的二元数据,但是可以把它转换成二元数据来分析。例:在工厂的质量管理中,生产出来的20个元件的某一尺寸按顺序为:12.27,9.92,10.81,11.79,11.87,10.90,11.2210.80,10.33,9.30,9.81,8.85,9.32,8.67,9.3
本文标题:高等数理统计-假设检验
链接地址:https://www.777doc.com/doc-3744770 .html