您好,欢迎访问三七文档
第八章假设检验上一章介绍了对总体中未知参数的估计方法。本章将讨论统计推断的另一个重要方面——统计假设检验。出于某种需要,对未知的或不完全明确的总体给出某些假设,用以说明总体可能具备的某种性质,这种假设称为统计假设。如正态分布的假设,总体均值的假设等。这个假设是否成立,还需要考察,这一过程称为假设检验,并最终作出判断,是接受假设还是拒绝假设。本章主要介绍假设检验的基本思想和常用的检验方法,重点解决正态总体参数的假设检验。§8.1假设检验的基本思想§8.2正态总体未知参数的假设检验§8.3单侧假设检验§1假设检验的基本思想一、假设检验问题的提出统计推断的另一个重要问题是假设检验问题。在总体的分布函数未知或只知其形式,但不知其参数的情况下,为了推断总体的某些性质,提出某些关于总体的假设。例如,提出总体服从泊松分布的假设,又如,对于正态总体提出数学期望μ0的假设等。这里,先结合例子来说明假设检验的基本思想和做法。假设检验就是根据样本对所提出的假设作出判断:是接受,还是拒绝。例1已知某炼铁厂的铁水含碳量X在某种工艺条件下服从正态分布N(4.55,0.1082)。现改变了工艺条件,又测了五炉铁水,其含碳量分别为:4.28,4.40,4.42,4.35,4.37根据以往的经验,总体的方差2=0.1082一般不会改变。试问工艺条件改变后,铁水含碳量的均值有无改变?显然,这里需要解决的问题是,如何根据样本判断现在冶炼的铁水的含碳量是服从≠4.55的正态分布呢?还是与过去一样仍然服从=4.55的正态分布呢?若是前者,可以认为新工艺对铁水的含碳量有显著的影响;若是后者,则认为新工艺对铁水的含碳量没有显著影响。通常,选择其中之一作为假设后,再利用样本检验假设的真伪。例2某自动车床生产了一批铁钉,现从该批铁钉中随机抽取了11根,测得长度(单位:mm)数据为:10.41,10.32,10.62,40.18,10.77,10.64,10.82,10.49,10.38,10.59,10.54。试问铁钉的长度X是否服从正态分布?而在本例中,我们关心的问题是总体X是否服从正态分布。如同例1那样,选择是或否作为假设,然后利用样本对假设的真伪作出判断。以上两例都是科技领域中常见的假设检验问题。我们把问题中涉及到的假设称为原假设或称待检假设,一般用H0表示。而把与原假设对立的断言称为备择假设,记为H1。如例1,若原假设为H0:=0=4.55,则备择假设为H1:≠4.55。若例2的原假设为H0:X服从正态分布,则备择假设为H1:X不服从正态分布。当然,在两个假设中用哪一个作为原假设,哪一个作为备择假设,视具体问题的题设和要求而定。在许多问题中,当总体分布的类型已知时,只对其中一个或几个未知参数作出假设,这类问题通常称之为参数假设检验,如例1。而在有些问题中,当总体的分布完全不知或不确切知道,就需要对总体分布作出某种假设,这种问题称为分布假设检验,如例2。接下来我们要做的事是:给出一个合理的法则,根据这一法则,利用巳知样本做出判断是接受假设H0,还是拒绝假设H0。二、假设检验的基本思想假设检验的一般提法是:在给定备择假设H1下,利用样本对原假设H0作出判断,若拒绝原假设H0,那就意味着接受备择假设H1,否则,就接受原假设H0。换句话说,假设检验就是要在原假设H0和备择假设H1中作出拒绝哪一个和接受哪一个的判断。究竟如何作出判断呢?对一个统计假设进行检验的依据是所谓小概率原理,即概率很小的事件在一次试验中是几乎不可能发生!例如,在100件产品中,有一件次品,随机地从中取出一个产品是次品的事件就是小概率事件。因为此事件发生的概率=0.01很小,因此,从中任意抽一件产品恰好是次品的事件可认为几乎不可能发生的,如果确实出现了次品,我们就有理由怀疑这“100件产品中只有一件次品”的真实性。那么取值多少才算是小概率呢?这就要视实际问题的需要而定,一般取0.1,0.05,0.01等。以例1为例:首先建立假设:H0:=0=4.55,H1:≠4.55。其次,从总体中作一随机抽样得到一样本观察值(x1,x2,…,xn)。注意到是的无偏估计量。因此,若H0正确,则与0的偏差一般不应太大,即不应太大,若过分大,我们有理由怀疑H0的正确性而拒绝H0。由于,因此,考察的大小等价于考察的大小,哪么如何判断是否偏大呢?niiXnX11niixnx11||0x)1,0(~/0NnXZ||0xnx/||0nx/||0具体设想是,对给定的小正数,由于事件是概率为的小概率事件,即因此,当用样本值代入统计量具体计算得到其观察值时,若,即说明在一次抽样中,小概率事件居然发生了。因此依据小概率原理,有理由拒绝H0,接受H1;若,则没有理由拒绝H0,只能接受H0。2/0/||znX2/0/||znXPnXZ/0nxz/||||02/||zz2/||zz将上述检验思想归纳起来,可得参数的假设检验的一般步骤:(1)根据所讨论的实际问题建立原假设H0及备择假设H1;(2)选择合适的检验统计量Z,并明确其分布;(3)对预先给定的小概率>0,由P{|Z|≥z/2}=确定临界值z/2;(4)由样本值具体计算统计量Z的观察值z,并作出判断,若|z|≥z/2,则拒绝H0,接受H1;若|z|<z/2,则接受H0。统计量称为检验统计量。nXZ/0当检验统计量取某个区域C中的值时,就拒绝H0,则称C为H0的拒绝域,拒绝域的边界点称为临界值。如例1中拒绝域为,临界值为和2/zz2/||zz2/zz现在,我们来解决例1提出的问题:(1)假设H0:=0=4.55,H1:≠4.55;(2)选择检验用统计量;)1,0(~/0NnXZ(3)对于给定小正数,如=0.05,查标准正态分表得到临界值z/2=z0.025=1.96;9.35/108.055.4364.4/0nxz因为|z|=3.9>1.96,所以拒绝H0,接受H1,即认为新工艺改变了铁水的平均含碳量。(4)具体计算:这里n=5,,,故Z的观察值364.4x22108.0三、假设检验中两类错误第Ⅰ类错误,当原假设H0为真时,却作出拒绝H0的判断,通常称之为弃真错误,由于样本的随机性,犯这类错误的可能性是不可避免的。若将犯这一类错误的概率记为,则有P{拒绝H0|H0为真}=。第Ⅱ类错误,当原假设H0不成立时,却作出接受H0的决定,这类错误称之为取伪错误,这类错误同样是不可避免的。若将犯这类错误的概率记为,则有P{接受H0|H0为假}=。自然,我们希望一个假设检验所作的判断犯这两类错误的概率都很小。事实上,在样本容量n固定的情况下,这一点是办不到的。因为当减小时,就增大;反之,当减小时,就增大。那么,如何处理这一问题呢?事实上,在处理实际问题中,对原假设H0,我们都是经过充分考虑的情况下建立的,或者认为犯弃真错误会造成严重的后果。例如,原假设是前人工作的结晶,具有稳定性,从经验看,没有条件发生变化,是不会轻易被否定的,如果因犯第Ⅰ类错误而被否定,往往会造成很大的损失。因此,在H0与H1之间,我们主观上往往倾向于保护H0,即H0确实成立时,作出拒绝H0的概率应是一个很小的正数,也就是将犯弃真错误的概率限制在事先给定的范围内,这类假设检验通常称为显著性假设检验,小正数称为检验水平或称显著性水平。§8.2正态总体下未知参数的假设检验一、单个正态总体情形1.均值的检验原假设H0:=0,备择假设H1:≠0。(a)2已知由上节的讨论可知,在H0成立的条件下,选用检验统计量)1,0(~/0NnXZ对给定的检验水平,查正态分布表得临界值z/2,再由样本值具体计算统计量Z的观察值z并与z/2比较,若|z|≥z/2,则拒绝H0,接受H1;若|z|<z/2,则接受H0。这种检验法常称为Z检验法。例1设某车床生产的钮扣的直径X服从正态分布,根据以往的经验,当车床工作正常时,生产的钮扣的平均直径0=26mm,方差2=2.62。某天开机一段时间后,为检验车床工作是否正常,随机地从刚生产的钮扣中抽检了100粒,测得。假定方差没有什么变化。试分别在1=0.05,2=0.01下,检验该车床工作是否正常?由1=0.05及2=0.01,查正态分布表,得临界值z1/2=z0.025=1.96,z2/2=z0.005=2.58。而15.2100/6.2|2656.26|/||||0nxz解:原假设H0:=0,备择假设H1:≠0。因此,|z|=2.15>1.96,但|z|=2.15<2.58,故在检验水平1=0.05下,应当拒绝H0,接受H1,即认为该天车床工作不正常;而在检验水平2=0.01下,应当接受H0,即认为该天车床工作是正常的。上例说明:1)对于同一个问题,同一个样本,由于检验水平不一样,可能得出完全相反的结论。因此,在实际应用中,如何合理地选择检验水平是非常重要的。.)()22显著性的水平较强故拒绝域增大即差异越小越大z.)(,2显著性的水平较低故拒绝域减小即差异变大越小反之z(b)2未知由于2未知,因此,不能用Z作为检验统计量,但注意到样本方差212)(11XXnSini是2的无偏估计量,因此,我们自然会想到用s2代替2,而在第六章的定理3已经证明,在H0成立的条件下,统计量)1(~/0ntnSXT于是,对给定的显著性水平>0,查t分布表可得临界值t/2,使P{|t|≥t/2}=成立。再由样本值具体计算统计量T的观察值t,并与t/2比较,若|t|≥t/2,则拒绝H0,接受H1;若|t|<t/2,则接受H0。这种检验法也称为t检验法。例2某厂利用某种钢生产钢筋,根据长期资料的分析,知道这种钢筋强度X服从正态分布,今随机抽取六根钢筋进行强度试验,测得强度X(单位:kg/mm2)为48.5,49.0,53.5,56.0,52.5,49.5。试问:能否据此认为这种钢筋的平均强度为52.0kg/mm2(=0.05)?解设X~N(,2),依题意建立假设H0:=0,H1:≠0。这里2未知,故在H0成立的条件下应选取检验统计量)1(~/0ntnSXT由已知=0.05,查t分布表得临界值t/2=t0.025(6-1)=2.571。又由样本值算得5.51x9.82s41.06/9.80.525.51t因为,|t|≈0.41<2.571,故接受H0,即可以认为这种钢筋的平均强度为52.0kg/mm2。是否有显著差异?检验这批灯泡的寿命与试在显著性水平样本方差测得只现随机抽取样本未知小时单位设某厂生产的灯泡寿命例100005.0.120946,16.,1000),(~):(322202sxNx100010001100:;:)检验假设:解:(HH)1(||20ntnsxt拒绝域:无显著差异。即灯泡寿命与接受当1000,13.2)15(8.141201000964||,05.00025.0Htt2.方差的检验设总体X~N(,2),均未知,(X1,X2,…,Xn)来自总体X的样本,要求进行的检验(设显著性水平为>0)为原假设H0:=,备择假设H1:≠。202202212)(11XXnSini由于是的无偏估计量,因此由第六章的定理3知当H0为真时,统计量2)1(~)1()(220220212nSnXXini因此对给定检验水平>0,由2分布表求得临界值(n–1)及(n–1)使22/22/1;),1()1(022/122/22Hnn则接受或若202)1(2sn2)}1({)}1({221222/2
本文标题:第八章 假设检验
链接地址:https://www.777doc.com/doc-3985644 .html