您好,欢迎访问三七文档
当前位置:首页 > 财经/贸易 > 资产评估/会计 > 生物统计学教案(5)
39生物统计学教案第五章统计推断教学时间:5学时教学方法:课堂板书讲授教学目的:重点掌握两个样本的差异显著性检验,掌握一个样本的差异显著性检验,了解二项分布的显著性检验。讲授难点:一个、两个样本的差异显著性检验统计假设检验:首先对总体参数提出一个假设,通过样本数据推断这个假设是否可以接受,如果可以接受,样本很可能抽自这个总体,否则拒绝该假设,样本抽自另外总体。参数估计:通过样本统计量估计总体参数。5.1单个样本的统计假设检验5.1.1一般原理及两种类型的错误例:已知动物体重服从正态分布N(μ,σ2),实验要求动物体重μ=10.00g。已知总体标准差σ=0.40g,总体平均数μ未知,为了得出对总体平均数μ的推断,以便决定是否接受这批动物,随机抽取含量为n的样本,通过样本平均数,推断μ。1、假设:H0:μ=μ0或H0:μ-μ0=0HA:μμ0μμ0μ≠μ0三种情况中的一种。本例的μ0=10.00g,因此H0:μ=10.00HA:μ10.00或μ10.00或μ≠10.002、小概率原理小概率的事件,在一次试验中几乎是不会发生的,若根据一定的假设条件计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而拒绝假设。从动物群体中抽出含量为n的样本,计算样本平均数,假设该样本是从N(10.00,0.402)中抽取的,标准化的样本平均数40服从N(0,1)分布,可以从正态分布表中查出样本抽自平均数为μ的总体的概率,即P(Uu),P(U-u),以及P(|U|u)的概率。如果得到的值很小,则x抽自平均数为μ0的总体的事件是一个小概率事件,它在一次试验中几乎是不会发生的,但实际上它发生了,说明假设的条件不正确,从而拒绝零假设,接受备择假设。显著性检验:根据小概率原理建立起来的检验方法。显著性水平:拒绝零假设时的概率值,记为α。通常采用α=0.05和α=0.01两个水平,当P0.05时称为差异显著,P0.01时称为差异极显著。3、临界值例从上述动物群体中抽出含量n=10的样本,计算出x=10.23g,并已知该批动物的总体平均数μ绝不会小于10.00g,规定的显著水平α=0.05。根据以上条件进行统计推断。H0:μ=10.00HA:μ10.00根据备择假设,为了得到x落在上侧尾区的概率P(Uu),将x标准化,求出u值。P(U1.82)=0.03438,P0.05,拒绝H0,接受HA。在实际应用中,并不直接求出概率值,而是建立在α水平上H0的拒绝域。从正态分布上侧临界值表中查出P(Uuα)=α时的uα值,Uuα的区域称为在α水平上的H0拒绝域,而Uuα的区域称为接受域。接受域的端点一般称为临界值。本例的u=1.82,从附表3可以查出u0.05=1.645,uuα,落在拒绝域内,拒绝H0而接受HA。4、单侧检验和双侧检验上尾单侧检验:上例中的HA:μμ0,相应的拒绝域为Uuα。对应于HA:μμ0时的检验称为上尾单侧检验。下尾单侧检验:对应于HA:μμ0时的检验称为下尾单侧检验。nxnxu40.000.10082.11040.000.1023.100nxu41其拒绝域为U-uα。双侧检验:对应于HA:μ≠μ0时的检验称为双侧检验。双侧检验的拒绝域为|U|uα/2。5、单侧检验和双侧检验的效率:在样本含量和显著水平相同的情况下,单侧检验的效率高于双侧检验。这是因为在做单侧检验利用了已知有一侧是不可能这一条件,从而提高了它的辨别力。所以,在可能的条件下尽量做单侧检验。例上例已经计算出u=1.82,上尾单侧检验的临界值u9,0.05=1.645,uuα,结论是拒绝零假设。在做双侧检验时u仍然等于1.82,双侧检验的临界值为u9,0.05/2=1.96,|u|u0.025,不能拒绝零假设。6、两种类型的错误(1)I型错误,犯I型错误的概率记为αα=P(I型错误)=P(拒绝H0|H0是正确的,μ=μ0)(2)II型错误,犯II型错误的概率记为ββμ1=P(II型错误)=P(接受H0|H0是错误的,μ=μ1)例继续上例,抽出n=10的样本,x=10.20g,检验假设H0:μ=10.00gHA:μ10.00g标准化的样本平均数临界值u0.05=1.645,uu0.05,P0.05。结论是不能拒绝H0。以样本平均数表示的临界值,可由下式得出在下图中0x的位置已用竖线标出。犯I型错误的概率α,由竖线右侧μ0=10.00曲线下面积给出。犯II型错误的概率由竖线左侧μ1=10.30曲线下面积给出。10.2010.001.580.4010u0010.001.64510.2080.4010xx42犯II型错误的概率β10.30=0.2327。从上图中可以看出(1)当μ1越接近μ0时,犯II型错误的概率越大。(2)降低犯I型错误的概率,必然增加犯II型错误的概率。(3)为了同时降低犯两种错误的概率,必须增加样本含量。7、关于两个概念的说明:(1)当Pα时,所得结论的正确表述应为:由样本平均数推断出的总体平均数μ与μ0之间的差异有统计学意义。即它们属于两个不同总体。习惯上称为“差异是显著的”。(2)接受H0的更严密的说法应是:尚无足够理由拒绝H0。但习惯上采用接受H0和拒绝H0这种表达方法。5.1.2单个样本显著性检验的程序(略)5.1.3在σ已知的情况下,单个平均数的显著性检验-u检验检验程序如下:1、假设从σ已知的正态或近似正态总体中抽出含量为n的样本。2327.073.01040.030.10208.1030.10UPUPuUP432、零假设H0:μ=μ0备择假设HA:①μμ0②μμ0③μ≠μ03、显著性水平在α=0.05水平上拒绝H0称为差异显著在α=0.01水平上拒绝H0称为差异极显著4、检验统计量5、相应于2中各备择假设之H0的拒绝域①uuα②u-uα③|u|uα/26、得出结论并给予解释例已知豌豆籽粒重量服从正态分布N(377.2,3.32)在改善栽培条件后,随机抽取9粒,其籽粒平均重为379.2,若标准差仍为3.3,问改善栽培条件是否显著提高了豌豆籽粒重量?解①σ已知②假设:H0:μ=377.2HA:μ377.2③显著性水平:α=0.05④σ已知,使用u检验⑤H0的拒绝域:因HA:μμ0,故为上尾检验,当uu0.05时拒绝H0。u0.05=1.645。⑥结论:uu0.05,即P0.05,所以拒绝零假设。栽培条件的改善,显著地提高了豌豆籽粒重量。5.1.4σ未知时平均数的显著性检验-t检验nxu082.193.32.3772.3790nxu44检验程序如下:1、假设从σ未知的正态或近似正态总体中抽出含量为n的样本。2、零假设:H0:μ=μ0备择假设:HA:①μμ0②μμ0③μ≠μ03、显著性水平:在α=0.05水平上拒绝H0称为差异显著在α=0.01水平上拒绝H0称为差异极显著4、检验统计量:当σ未知时以s代替之,标准化的变量称为t,服从n-1自由度的t分布。t分布的临界值可从附表4中查出。5、相应于2中各备择假设之H0的拒绝域:①ttα②t-tα③|t|tα/26、得出结论并给予解释。例已知玉米单交种群单105的平均穗重μ0=300g。喷洒植物生长促进剂后,随机抽取9个果穗,其穗重为:308、305、311、298、315、300、321、294、320g。问喷药后与喷药前的果穗重差异是否显著?解①σ未知②假设:H0:μ=300HA:μ≠300激素类药物需有适当的浓度,浓度适合时促进生长,浓度过高时反而抑制生长,在这里喷药的效果是未知的,并非仅能促进生长,需采用双侧检验③显著性水平:α=0.05④σ未知应使用t检验,已计算出x=308,s=9.62nsxt049.2962.93003080nsxt45⑤H0的拒绝域:因HA:μ≠μ0,故为双侧检验,当|t|t0.025时拒绝H0。t0.025=2.306。⑥结论:因|t|t0.025,即P0.05,所以拒绝零假设。喷药前后果穗重的差异是显著的。若规定α=0.01,t0.01/2=3.355,tt0.005,因此喷药前后果穗重的差异尚未达到“极显著”。5.1.5变异性的显著性检验-χ2检验χ2检验的基本程序如下:1、假设从正态总体中随机抽取含量为n的样本,计算出样本s2。2、零假设:H0:σ=σ0备择假设:HA:①σσ0②σσ0③σ≠σ03、显著性水平:在α=0.05水平上拒绝H0称为差异显著在α=0.01水平上拒绝H0称为差异极显著4、检验统计量:统计量χ2服从n–1自由度的χ2分布。5、相应于2中各备择假设之H0的拒绝域:①χ2χ2α②χ2χ21-α③χ2χ21-α/2和χ2χ2α/26、得出结论并给予解释。例一个混杂的小麦品种,株高标准差σ0=14cm,经提纯后随机抽出10株,它们的株高为:90、105、101、95、100、100、101、105、93、97cm,考查提纯后的群体是否比原群体整齐?解①μ未知,对未知总体的方差做检验20221sn46②假设:H0:σ=14cm0HA:σσ0小麦经提纯后株高只能变得更整齐,因而使用下侧检验。③显著性水平:在α=0.01水平上做检验④检验统计量:⑤相应于备择假设HA:σσ0之H0的拒绝域为χ2χ21-α,从附表6中可以查出χ20.99=2.09⑥结论:因χ2χ20.99,即P0.01,所以拒绝H0。结论是植株经提纯后变得非常整齐。5.2两个样本的差异显著性检验问题的提出(P78)5.2.1两个方差的检验-F检验F检验的基本程序如下:1、从两个正态或近似正态总体中,独立地抽取含量分别为n1和n2的两个随机样本,分别计算出s12和s22。与总体平均数μi无关。2、零假设:H0:σ1=σ2备择假设:HA:①σ1σ2②σ1σ2③σ1≠σ23、显著性水平:在α=0.05水平上拒绝H0称为差异显著在α=0.01水平上拒绝H0称为差异极显著4、检验统计量:在抽样分布一章中已经给出F的定义11.1141.21812201012022iixxsn22222121,21ssFdfdf47在零假设σ1=σ2下,统计量F变为5、相应于2中各备择假设之H0的拒绝域:①相应于HA:σ1σ2,应做上尾单侧检验,当FFα时拒绝H0。②相应于HA:σ1σ2,应做下尾单侧检验,当FF1-α时拒绝H0,F的下侧临界值F1-α由下式给出:一种变通的办法是把s2中较大者称为s12,这时只会用上侧检验,处理起来更方便些,对于结果无影响。③相应于HA:σ1≠σ2,应做双侧检验,当FFα/2和FF1-α/2时拒绝H0。6、得出结论并给予解释。例测定了20位青年男子和20位老年男子的血压值,问老年人血压值个体间的波动是否显著高于青年人?(数据略)P80解1①人类血压值是服从正态分布的随机变量。②假设:H0:σ1=σ2HA:σ1σ2老年人的血压值在个体之间的波动,只会大于青年人,决不会小于青年人。③显著性水平:规定α=0.05④检验统计量:先计算出s12=193.4,s22=937.7⑤建立H0的拒绝域:根据备择假设,应为下侧检验,当FF0.95时拒绝零假设。下侧临界值1,1,22112221,21ndfndfssFdfdf,,1,,12211dfdfdfdfFF1221,22193.40.206937.7dfdfsFs48⑥结论:FF0.95,即P0.05。结论是拒绝H0,老年人血压值在个体之间的波动大于年青人。解2若以s2中较大者作为分子,备择假设则变为HA:σ2σ1,成为上尾检验,所用的检验统计量为:在查临界值时应注意,现在df2是分子,df1是分母。F0.05=2.18,FF0.05,P0.05,结论仍然是拒绝H
本文标题:生物统计学教案(5)
链接地址:https://www.777doc.com/doc-4152244 .html