您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业文化 > 第四章环境参数的统计推断
环境参数的统计推断(statisticalinference)第四章第四章环境参数的统计推断统计推断由一个样本或一糸列样本所得的结果来推断总体的特征假设检验参数估计第四章第一节第二节第三节第四节第五节假设检验的原理与方法样本平均数的假设检验样本频率的假设检验参数的区间估计与点估计方差的同质性检验一概念:假设检验(hypothesistest)又称显著性检验(significancetest),就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。第一节假设检验小概率原理概率很小的事件在一次抽样试验中实际是几乎不可能发生的。=0.05/0.01如果假设一些条件,并在假设的条件下能够准确地算出事件A出现的概率α为很小,则在假设条件下的n次独立重复试验中,事件A将按预定的概率发生,而在一次试验中则几乎不可能发生。假设检验参数检验非参数检验平均数的检验频率的检验方差的检验秩和检验符号检验游程检验秩相关检验二、假设检验的步骤治疗前0=1262=240N(126,240)治疗后n=6x=136未知那么=0?即克矽平对治疗矽肺是否有效?例:设矽肺病患者的血红蛋白含量具平均数0=126(mg/L),2=240(mg/L)2的正态分布。现用克矽平对6位矽肺病患者进行治疗,治疗后化验测得其平均血红蛋白含量x=136(mg/L)。1、提出假设对立无效假设/零假设/检验假设备择假设/对应假设0=0误差效应处理效应H0HA例:克矽平治疗矽肺病是否能提高血红蛋白含量?平均数的假设检验检验治疗后的总体平均数是否还是治疗前的126(mg/L)?x-0=136-126=10(mg/L)这一差数是由于治疗造成的,还是抽样误差所致。本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样,二者来自同一总体,接受零假设则表示克矽平没有疗效。而相对立的备择假设表示拒绝H0,治疗后的血红蛋白平均数和治疗前的平均数来自不同总体,即克矽平有疗效。H0:μ=μ0=126(mg/L)HA:μ≠μ02、确定显著水平=0.05显著水平*极显著水平**能否定H0的人为规定的概率标准称为显著水平,记作。统计学中,一般认为概率小于0.05或0.01的事件为小概率事件,所以在小概率原理基础上建立的假设检验也常取=0.05和=0.01两个显著水平。P=0.01=0.053、选定检验方法,计算检验统计量,确定概率值u=x-x136-126=√40=1.581P(u1.581)=2×0.0571=0.1142根据研究设计的类型和统计推断的目的选择使用不同的检验方法。例:1260x40624022nx4、作出推断结论:是否接受假设PP小概率原理接受H0否定HA否定H0接受HA可能正确可能错误例:上例中P=0.11420.05所以接受H0,从而得出结论:使用克矽平治疗前后血红蛋白含量未发现有显著差异,其差值10应归于误差所致。P(u1.96)=0.05P(u2.58)=0.01已知:0.950.0250.025u1.96u2.58P(u)0.05P(u)0.01差异达显著水平差异达极显著水平0P(-1.96xx+1.96x)=0.95-1.96x+1.96x0.950.0250.025临界值:+ux左尾右尾否定区否定区接受区u+1.96x三、双尾检验与单尾检验0P(-2.58xx+2.58x)=0.99-2.58x+2.58x0.990.0050.005临界值:+2.58x左尾右尾双尾检验(two-sidedtest)否定区否定区接受区0.950.950.050.051.64-1.64H0:≤0HA:0假设:否定区H0:≥0HA:0左尾检验右尾检验单尾检验(one-sidedtest)接受区接受区u0.05=1.64u0.01=2.33单尾检验分位数双尾检验分位数u0.05/2=1.96u0.01/2=2.5822否定区否定区否定区接受区接受区查表时,单尾概率等于双尾概率乘以2>四、两类错误假设检验的两类错误H0正确H0错误否定H0错误()推断正确(1-)接受H0推断正确(1-)错误()第一类错误(typeIerror),又称弃真错误或错误;第二类错误(typeIIerror),又称纳伪错误或错误0ⅠⅡ0.025Ⅰ和Ⅱ重合=00.950.025错误犯第一类错误的概率等于显著水平值ⅠⅡC1C2220u-uⅠ和Ⅱ不重合犯第二类错误的概率记为值1、两类错误既有联系又有区别错误只在否定H0时发生错误只在接受H0时发生错误增加错误减小错误增加错误减小结论2、还依赖于-0的距离结论3、n,2可使两类错误的概率都减小.单尾检验左尾检验右尾检验0.950.950.050.051.64-1.64否定区接受区接受区否定区只在一侧分析题意提出假设确定显著水平计算检验统计量作出推断假设检验的步骤:大样本平均数的假设检验--u检验小样本平均数的假设检验--t检验单样本双样本一、一个样本平均数的假设检验适用范围:检验某一样本平均数x所属的总体平均数是否和某一指定的总体平均数0相同。若相同,则说明该样本属于这个以0为平均数的指定总体;若不相同,则说明该样本所属的总体与这个指定总体(0)不同,即有显著或极显著差异。1、总体方差σ2已知,无论n是否大于30都可采用u检验法这里所要讲的内容在前面已经讲过了,这里只是简单地做个小结,给出检验的基本程序,并举出例子说明检验过程。检验的基本程序如下:1)假设从σ已知的正态总体,或近似正态总体中,随机抽取含量为的n样本。2)零假设H0:=0。备择假设可有以下三种情况:(1)HA:μ>μ0,若已知μ不可能小于μ0。(2)HA:μ<μ0,若已知μ不可能大于μ0。(3)HA:μ≠μ0,包括μ>μ0和μ<μ03)在=0.05水平上,拒绝H0称为“差异显著”。在=0.01水平上,拒绝H0称为“差异极其显著”。4)检验的统计量:nxu05)相应于2)中的3个备择假设的H0的拒绝域分别为:(1)u>u(2)u<-u(3)│u│>u/2,或表示为│u│>u(双侧)正态分布的分位数,可以从附表中查出。6)根据以上所做的分析,进行统计推断,得出结论。例:已知某工厂排污水中石油分布属正态分布N(45,2.12),现经过水样处理,随机采样8次,得样本平均值为42.5ppm,样本标准差为2.1。问经过处理后水质含油量是否有明显降低。分析(1)这是一个样本平均数的假设检验,因总体σ2已知,采用u检验;(2)处理后水质含油量是否降低,只需作进行单尾检验即可。(1)假设(2)水平(3)检验(4)推断H0:μ=μ0=45(ppm),即处理前后水质含油量保持不变;HA:μ<μ0选取显著水平α=0.05u0.05=1.645<︱u︱=3.4u落在拒绝域内,否定H0,接受HA;说明水质处理后得到改善。4.381.2455.420nxu2、总体方差σ2未知,但n30时,可用样本方差s2来代替总体方差σ2,仍用u检验法总体(μ0)样本(n30)xs2σ2xsxu例:抽取某地区粮食样品36个,测得粮食中六六六的平均值为0.325mg/kg,标准差为0.068mg/kg,国家食品卫生标准规定,粮食中六六六残留量<0.3mg/kg。问该地区粮食中六六六残留量是否超标?分析(1)这是一个样本平均数的假设检验,因总体σ2未知,n=3630,可用s2代替σ2进行u检验;(2)该地区粮食中六六六残留量<0.3mg/kg才符合食品卫生标准,因此进行单尾检验。(1)假设(2)水平(3)检验(4)推断H0:μ≤μ0=0.3mg/kg,即该地区粮食中六六六残留量符合食品卫生标准。HA:μ>μ0选取显著水平α=0.05u>u0.05=1.645拒绝H0,接受HA;认为该地区粮食中六六六残留量超标。206.236/068.03.0325.0/nSxsxux3、总体方差σ2未知,且n30时,可用样本方差s2来代替总体方差σ2,采用df=n-1的t检验法总体(μ0)样本(n30)xs2σ2tsxx对于一个正态总体,若未知且n30,则x服从n-1自由度的t分布。因此,在未知时可用t检验做平均数的显著性检验。t检验的程序与u检验一样,只要用t分布的分位数t代替标准正态分布的分位数u就可以了。t检验的程序这里不再赘述。下面只指出这两种检验的不同点。t检验的统计假设是:零假设H0:μ=μ0。备择假设有以下三种情况:(1)HA:μ>μ0,若已知μ不可能小于μ0。(2)HA:μ<μ0,若已知μ不可能大于μ0。(3)HA:μ≠μ0,包括μ>μ0和μ<μ0。检验的统计量:具n-1自由度。不同自由度下t分布的分位数见附表。三种备择假设的拒绝域为:(1)t>t。(2)t<-t。(3)│t│>t(双侧)。例:某鱼塘水中的含氧量,多年平均为4.5(mg/L),该鱼塘设10个点采集水样,测定含氧量为:4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26(mg/L)试检验该次抽样测定的水中含氧量与多年平均值有无显著差别。分析(1)这是一个样本平均数的假设检验,因总体σ2未知,n=1030,可用s2代替σ2进行t检验;(2)该次测定的水中含氧量可能或多年平均值,用双尾检验。(1)假设(2)水平(3)检验(4)推断H0:μ=μ0=4.5(mg/L),即认为该次测定与多年平均值没有显著差别。HA:μ≠μ0选取显著水平α=0.05在0.05显著水平上,接受H0,否定HA;认为该次抽样所测结果与多年平均值无显著差别,属于随机误差。267.01)(22nnxxs94.01xnsxt︱t︱<t0.05(9)=2.262084.0nssxP0.05421.4nxx二、两个样本平均数的假设检验适用范围:检验两个样本平均数x1和x2所属的总体平均数1和2是否来自同一总体。样本1X1样本2X2总体1μ1总体2μ21、提出假设无效假设H0:μ1=μ2,两个平均数的差值是随机误差所引起的;21xx备择假设HA:μ1=μ2,两个平均数的差值除随机误差外还包含其真实的差异,即由处理引起的.21xx2、确定显著水平:0.05或0.013、检验统计量(1)样本平均数差数的平均数=总体平均数的差数.212121xxxx两个样本平均数的差数21xx(2)样本平均数差数的方差=两样本平均数方差之和.2222212122121xxxxnn22212121nnxx样本平均数差数的标准误222121221nnxx)11(212221nnxxnxx2221221nxx22221σ12=σ22=σn1=n2=nσ12=σ22=σn1=n2=n)1,0(N当σ12和σ22已知21)()(2121xxxxu2121xxxxuH0:μ1=μ2=μ时)1,0(N当σ12和σ22未知,两样本都为大样本时21)()(2121xxsxxu2121xxsxxuH0:μ1=μ2=μ时22212121nsnssxx)2(21nnt当σ12和σ22未知,两样本都为小样本时21)()(2121xxsxxt2121xxsxxtH0:μ1=μ2=μ时22212121nsnssxx4、作出推断,并解释之接受H0否定HAuutt或否定H0接受HAu
本文标题:第四章环境参数的统计推断
链接地址:https://www.777doc.com/doc-922408 .html