39卫生统计学课件_第六章_假设检验

1、统计推断用样本信息推论总体特征的过程。包括：参数估计:运用统计学原理，用从样本计算出来的统计指标量，对总体统计指标量进行估计。假设检验：又称显著性检验，是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。3第一节假设检验▲显著性检验;▲科研数据处理的重要工具;▲某事发生了：是由于碰巧？还是由于必然的原因？统计学家运用显著性检验来处理这类问题。假设检验的主要内容1、原因2、目的3、原理4、过程（步骤）5、结果1、假设检验的原因由于个体差异的存在，即使从同一总体中严格的随机抽样，X1、X2、X3、X4、、、，不同。因此，X1、X2不同有两种（而且只有两种）可能：（1）分别所代表的总体均数相同，由于抽样误差造成了样本均数的差别。差别无显著性。（2）分别所代表的总体均数不同。差别有显著性。2、假设检验的目的3、假设检验的原理/思想反证法：当一件事情的发生只有两种可能A和B，为了肯定其中的一种情况A，但又不能直接证实A，这时否定另一种可能B，则间接的肯定了A。概率论：事件的发生不是绝对的，只是可能性大小而已。判断是由于何种原因造成的不同，以做出决策。4、假设检验的一般步骤（1）。

2、建立假设：原假设（无效假设，H0）：两个总体均数相等；备择假设(H1)：与H0相反，即两个总体均数不等;（2）确定显著性水平（）：区分大小概率事件的标准（3）计算统计量：选择不同的统计方法：u,t（4）确定概率值：（5）做出推论85、假设检验的结果接受检验假设拒绝检验假设正确理解结论的概率性（都隐含着犯错误的可能性）。9第二节t检验▲t值表横标目：自由度，υ纵标目：概率，p,即曲线下阴影部分的面积;表中的数字：相应的|t|界值▲t值表规律：(1)自由度（υ）一定时，p越小，t越大;(2)概率（p）一定时，υ越大，t越小;均数的t检验一.小样本均数与已知总体均数比较的t检验二.配对资料的t检验三.两个小样本均数比较的t检验11一、小样本均数与已知总体均数比较的t检验（一组样本资料的t检验）▲目的：比较一个小样本均数所代表的未知总体均数与已知的总体均数有无差别。▲计算公式：t统计量：自由度：n-112▲适用条件：(1)已知一个总体均数；(2)可得到一个样本均数及该样本标准误；(3)样本量小于100；(4)样本来自正态或近似正态总体。例：已知一般婴儿平均出生体重为3.20kg，某医生调。

3、查了25个难产婴儿出生体重，并计算其平均出生体重为3.42kg，标准差为0.42kg，试分析难产儿出生体重与一般婴儿出生体重有否差异？已知：难产婴儿出生体重(1)一个总体均数：3.20kg;(2)一个样本均数：3.42kg;(3)可计算出样本标准误：0.42/5(4)n=25100;14假设检验：▲建立假设：检验假设：难产儿平均出生体重与一般婴儿平均出生体重相同；备择假设：难产儿平均出生体重与一般婴儿平均出生体重不同；▲确定显著性水平（）：0.05▲计算统计量：t统计量：t=2.62▲确定概率值：n=25,自由度=n–1=24,t0.05(24)=2.064tt0.05(24),p0.05▲做出推论:p0.05,小概率事件发生了，原假设不成立；拒绝H0,接受H1，可认为：难产儿平均出生体重与一般婴儿平均出生体重不同；难产儿平均出生体重比一般婴儿平均出生体重大；难产儿平均出生体重与一般婴儿平均出生体重差别显著。16二、配对资料的t检验什么是配对资料？治疗前后；不同检验方法；进行配对；……一对观察对象之间除了处理因素/研究因素之外，其它因素基本齐同。目的：判断不同的处理是否有差别公式：。

4、t自由度：对子数-1适用条件：两组配对计量资料。例题：p.34,例818三、两个小样本均数比较的t检验▲目的：由两个样本均数的差别推断两样本所代表的总体均数间有无差别。▲计算公式及意义：t统计量：自由度：n1+n2–219▲适用条件：（1）已知/可计算两个样本均数及它们的标准差；（2）两个样本之一的例数少于100；（3）样本来自正态或近似正态总体；（4）方差齐。20例题：p.32,例7已知：(1)一个样本:均数491.4,标准差138.5(mg/100ml);另一个样本:均数672.3,标准差150.7(mg/100ml);(2)n1=25;n2=23(3)近似正态分布：138.5x2491.4;150.7x2672.3(4)方差齐：25/23221假设检验：▲建立假设：检验假设：心肌梗塞病人血清ß脂旦白与正常人血清ß脂旦白均数相同；备择假设：心肌梗塞病人血清ß脂旦白与正常人血清ß脂旦白均数不同；▲确定显著性水平（）：0.0522▲计算统计量：t统计量：t=4.34；自由度：25+23–2=46表中：t0.05(40)=2.021t0.05(50)=2.009t0.05(46)=？？。

5、？▲确定概率值：tt0.05(46),p0.05;23▲做出推论:因为p0.05,拒绝H0,接受H1：可认为心肌梗塞病人血清ß脂旦白与正常人血清ß脂旦白均数不同；两样本均数差别有显著性。24第三节均数的u检验1.大样本均数与已知总体均数比较的u检验2.两个（大）样本均数比较的u检验25两个样本均数比较的u检验▲目的：由两个样本均数的差别推断两样本所代表的总体均数间有无差别。▲计算公式及意义：u统计量26▲适用条件：（1）已知/可计算两个样本均数及它们的标准差；（2）两个样本例数都不少于100。27例题：p.30,例5已知：(1)一个样本:均数37.6,标准差22.5(mg/100ml);另一个样本:均数38.8,标准差25.8(mg/100ml);(2)n1=375;n2=36728假设检验：▲建立假设：检验假设：正常男/女新生儿血中甘油三脂均数相同；备择假设：正常男/女新生儿血中甘油三脂均数不同；▲确定显著性水平（）：0.0529▲计算统计量：u统计量：u=0.67；▲确定概率值：u1.96,p0.05;▲做出推论:因为p0.05,不能拒绝H0：不能认为正常男/女新生儿血中甘油。

6、三脂均数不同。30第四节计数资料的u检验二项分布资料u检验：1、一组样本资料的u检验：2、两组独立样本资料的u检验：311、一组样本资料的u检验：2、两组独立样本资料的u检验：Piosson分布资料u检验：32第五节假设检验与区间估计的关系1.置信区间具有假设检验的主要功能；2.置信区间可提供假设检验不能提供的信息——可提供差别有否实际意义3.假设检验可报告确切的P值，从而较为精确地说明检验结论的概率保证。置信区间只能在预先确定的置信度（1-α）%水平上进行推断；在不能拒绝H0的场合下，假设检验可以对检验的功效做出估计。33第六节假设检验的功效一、假设检验的两类错误第I类错误：如果实际情况与H0一致，仅仅由于抽样的原因，使得统计量的值落到了拒绝域，拒绝了原本正确的H0，导致推断错误。称为І类错误（“弃真”的错误），其概率大小用α表示。II类错误的概率β值的两个规律：1.当样本量一定时,α愈小,则β愈大，反之…;2.当α一定时,样本量增加,β减少.第II类错误：如果实际情况与H0不一致，也仅是由于抽样的原因，使得统计量的值落到了接受域，不拒绝了原本错误的H0，也导致推断错误。

7、。称为II类错误（“存伪”的错误）,其概率大小用β表示,β值一般不能确切的知道。35二、假设检验的功效36第七节假设检验的注意事项1、在抽样研究中，每一种假设检验方法都是与相应的研究设计相联系的。严格按照设计方案，收集客观数据；样本的获得必须遵循随机化的原则。2、选择假设检验方法要注意符合其应用条件；应用检验方法一定要考虑其适用条件373、正确理解假设检验的结论（概率性）假设检验的结论是根据概率推断的，所以不是绝对正确的：(1)当p,拒绝H0,接受H1，按接受H1下结论，可能犯错误，此时为І类错误（“弃真”的错误）(2)当p,不能拒绝H0,不能接受H1，按不能接受H1下结论，也可能犯错误；此时为II类错误（”存伪”的错误）38第I类错误和第II类错误假设检验的结果有两种。(1)当拒绝H0时,可能犯错误，可能拒绝了实际上成立的H0，称为І类错误（“弃真”的错误），其概率大小用α表示。(2）当不能拒绝H0时，也可能犯错误，没有拒绝实际上不成立的H0,这类称为II类错误（“存伪”的错误）,其概率大小用β表示,β值一般不能确切的知道。39II类错误的概率β值的两个规律：1.当。

8、样本量一定时,α愈小,则β愈大，反之…;2.当α一定时,样本量增加,β减少.4.正确理解P值的意义，P值很小时“拒绝H0”，P值的大小不要误解为总体参数间差异的大小；拒绝H0只是说差异不为零。统计学中的差异显著或不显著，和日常生活中所说的差异大小概念不同.（不仅区别于均数差异的大小，还区别于均数变异的大小)5、其它注意事项当不能拒绝H0时，即差异无显著性时，应考虑的因素：可能是样本例数不够；单侧检验与双侧检验的问题41第一节假设检验第二节t分布第三节均数的u检验第四节计数资料的u检验第五节假设检验与区间估计的关系第六节假设检验的功效第七节均数假设检验的注意事项小结42是非判断：（）1．标准误是一种特殊的标准差，其表示抽样误差的大小。（）2．N一定时，测量值的离散程度越小，用样本均数估计总体均数的抽样误差就越小。（）3．假设检验的目的是要判断两个样本均数的差别有多大。431.按α=0.10水准做t检验，P0.10，不能认为两总体均数不相等，此时若推断有错，其错误的概率为（）。A．大于0.10B．β,而β未知C．小于0.10D．1-β,而β未知2．某地正常成年男子红细胞的普查结。

9、果，均数为480万/mm3，标准差为41.0万/mm3，后者反映（）A．个体变异B．抽样误差C．总体均数不同D．均数间变异选择题：443.两个样本均数比较，经t检验，差异有显著性，p越小，说明（）A．两样本均数差别越大B．两总体差别越大C．越有理由认为两总体均数不同D．越有理由认为两样本均数不同45思考题：1.标准差和标准误有何区别和联系？2.可信区间和参考值范围有何不同？3.一类错误和二类错误的区别。