您好,欢迎访问三七文档
医学统计学李国春医学博士e-mail:liguochuncn@163.comCell-phone:13913841075第5讲(上)t检验和u检验(Medicalstatistics)SingaporeCollegeofTCM2009.9ttest•单样本均数t检验•配对样本均数的t检验•两个独立样本均数的t检验•正态性检验•两样本的方差齐性检验•两总体方差不等时均数比较的检验•案例•练习和思考•小结主要内容----contents---'tt检验是假设检验中最见的一种方法,它是以t分布为基础。由于t分布的发现使得小样本统计推断成为可能,因而,它被认为是统计学发展史中的里程碑之一,在医学统计学中,t检验是非常活跃的一类假设检验方法。什么是t检验?单样本t检验配对样本t检验两个独立样本t检验同源配对异源配对t检验的分类:t假设检验的应用条件:(1)σ未知且n较小;(2)样本来自正态分布总体;(3)两样本均数比较时还要求所对应的两总体方差相等(σ12=σ22),即方差齐性(HomogeneityofVariance);(4)独立性。在实际应用中,与上述条件略有偏离,但对结果影响不大。问题:σ已知,或n较大时,用什么检验?f(t)=∞(标准正态曲线)=5=10.10.2-4-3-2-1012340.3z检验t检验是根据t分布判断样本概率而进行的假设检验,而当样本量n很大时,t分布就接近标准正态分布,标准正态分布也称为u分布,而国外教科书则称为Z分布,这时候根据u分布判断概率所进行的假设检验称为u检验。应用条件:σ已知或者σ未知且n足够大(如n100)。复习(1)样本均数与总体均数的比较•目的:推断该样本是否来自某已知总体;样本均数代表的总体均数与0是否相等。•总体均数0一般为理论值、标准值或经大量观察所得并为人们接受的公认值、习惯值。未知总体μ已知总体μ0?t检验例3.16根据大量调查,已知健康成年男子听到最高声音频率的平均数为18000Hz。某医生随机抽查25名接触噪声作业的男性工人,测得可以听到的最高声音频率的均数为17200Hz,标准差为650Hz。试问能否认为接触噪声作业工人的听力水平与正常成年男性的听力水平不同?μ0=18000Hz总体健康成年男子样本接触噪声作业工人μ总体=未知总体17200650XS??1、建立假设,确定检验水准。H。(μ=μ。)接触噪声作业工人的听力水平与正常成年男性的听力水平相同。H1(μ≠μ。)接触噪声作业工人的听力水平与正常成年男性的听力水平不同。α=0.05针对总体2、选定检验方法,计算检验统计量t值。n=25,X=17200Hz,s=650Hz,μ。=18000Hz017200180006.1546502525124xtsn统计量t表示,在标准误的尺度下,样本均数与总体均数的偏离。这种偏离称为标准t离差(standardtdeviation)假设检验步骤:3、确定P值,作出推断结论。25124查t界值表双侧0.05/2,(24)0.01/2,(24)2.064,2.797tt0.05/2,(24)2.064t0t=6.1540.01/2,(24)2.797t现有统计量t=6.1542.797,P0.01。按α=0.05水准,拒绝H。,接受H1,差异有统计学意义。结合本题有理由认为接触噪声作业的男性工人平均听力水平低于正常成年男性。-tt0附表2t界值表概率,P单侧0.250.200.100.050.0250.010.0050.00250.0010.0005自由度双侧0.500.400.200.100.050.020.010.0050.0020.00111.0001.3763.0786.31412.70631.82163.657127.321318.309636.61920.8161.0611.8862.9204.3036.9659.92514.08922.32731.59930.7650.9781.6382.3533.1824.5415.8417.45310.21512.92440.7410.9411.5332.1322.7763.7474.6045.5987.1738.61050.7270.9201.4762.0152.5713.3654.0324.7735.8936.86960.7180.9061.4401.9432.4473.1433.7074.3175.2085.95970.7110.8961.4151.8952.3652.9983.4994.0294.7855.40880.7060.8891.3971.8602.3062.8963.3553.8334.5015.04190.7030.8831.3831.8332.2622.8213.2503.6904.2974.781100.7000.8791.3721.8122.2282.7643.1693.5814.1444.587210.6860.8591.3231.7212.0802.5182.8313.1353.5273.819220.6860.8581.3211.7172.0742.5082.8193.1193.5053.792230.6850.8581.3191.7142.0692.5002.8073.1043.4853.768240.6850.8571.3181.7112.0642.4922.7973.0913.4673.745250.6840.8561.3161.7082.0602.4852.7873.0783.4503.725-2.0642.0640=240.0250.025t0.05,24=2.064P=P(|t|≥2.064)=0.05P=P(|t|≥5.4545)0.05思路解析:μ0=18000Hz总体健康成年男子样本μ总体=未知总体17200650XSμ0μ0=18000Hz总体样本17200650XS假设该样本来自已知总体μ0=18000Hz总体样本17200650XS这些样本是什么分布规律?这些样本是什么分布规律?(1)这些样本的均数服从正态分布:20(,)Nn这里μ0=18000Hz,σ未知,因此这种正态分布往往是未知的,这样就没办法求目前手头这个样本()在样本抽样分布中出现的概率就无法确认。即无法获得等于及大于(或等于及小于)现有样本均数的概率,也就无法判断是否是小概率。17200,650XS20(,)Nn?xix只知道它服从正态分布,至于是什么样的正态分布,不清楚22()21(),2xfxexμσ这些样本的均数服从正态分布,但至于是什么样的正态分布,往往未知,这时我们不去追究,而是回避这个问题,采用t分布来解决。(2)由这些样本的均数和标准差导出的新的统计量t服从的不是正态分布,而是t分布。0xtsn都是已知的服从自由度为n-1的t分布,即v=25-1=24的t分布。f(t)=∞(标准正态曲线)=5=10.10.2-4-3-2-1012340.3t仅分布与自由度有关-tt0附表2t界值表概率,P单侧0.250.200.100.050.0250.010.0050.00250.0010.0005自由度双侧0.500.400.200.100.050.020.010.0050.0020.00111.0001.3763.0786.31412.70631.82163.657127.321318.309636.61920.8161.0611.8862.9204.3036.9659.92514.08922.32731.59930.7650.9781.6382.3533.1824.5415.8417.45310.21512.92440.7410.9411.5332.1322.7763.7474.6045.5987.1738.61050.7270.9201.4762.0152.5713.3654.0324.7735.8936.86960.7180.9061.4401.9432.4473.1433.7074.3175.2085.95970.7110.8961.4151.8952.3652.9983.4994.0294.7855.40880.7060.8891.3971.8602.3062.8963.3553.8334.5015.04190.7030.8831.3831.8332.2622.8213.2503.6904.2974.781100.7000.8791.3721.8122.2282.7643.1693.5814.1444.587210.6860.8591.3231.7212.0802.5182.8313.1353.5273.819220.6860.8581.3211.7172.0742.5082.8193.1193.5053.792230.6850.8581.3191.7142.0692.5002.8073.1043.4853.768240.6850.8571.3181.7112.0642.4922.7973.0913.4673.745250.6840.8561.3161.7082.0602.4852.7873.0783.4503.725不同自由度下t界值对应的概率有差异t仅分布与自由度有关2(1)/2[(1)/2]()(1)(/2)nnthtnnnf(t)=∞(标准正态曲线)=5=10.10.2-4-3-2-1012340.3-tt0it16.154tP0.01对这个样本是否来自这个总体产生了怀疑,因此从已知总体中抽样,获得这样的样本的概率太少了P0.01。从而认为这个样本很有可能来自于与已知总体有本质差别的另一总体。μ总体u检验f(t)=∞(标准正态曲线)=5=10.10.2-4-3-2-1012340.3t检验是根据t分布所进行的假设检验,而当样本量n很大时,t分布就接近标准正态分布,标准正态分布也称为u分布,而国外教科书则称为Z分析,这时候根据u分布所进行的假设检验称为u检验。应用条件:σ已知或者σ未知且n足够大(如n100)。00/xun0/xusn(n较大时)(μ。已知时)这些样本是什么分布规律?这些样本的均数服从正态分布:200(,)Nn17200,650XS20(,)Nnσ。xix它服从正态分布,至于是什么样的正态分布,是清楚的。00/xun(μ。已知时)0/xusn(n较大时)f(t)=∞(标准正态曲线)=5=10.10.2-4-3-2-1012340.3u分布例3.18为了解医学院学生的心理健康状况,随机抽查某医科大学在校大学生210名,用SCL90症状自评量表进行测定,得出因子总分的均数为142.6,标准差为31.25。已知全国SCL90因子总分的均数(常模)为130。试问该医科大学在校学生的SCL90因子总分是否与全国水平相同?μ0=130总体全国水平样本某医学大学在校学生μ总体=未知总体142.631.25XS??0/xusn(n较大时)f(t)=∞(标准正态曲线)=5=10.10.2-4-3-2-1012340.3u分布1、建立假设,确定检验水准。H。(μ=μ。)该医科大学在校学生的SCL90因子总分与全国水平相同。H1(μ≠μ。)医科大学在校学生的SCL90因子总分与全国水平不同。α=0.05针对总体2、选定检验方法,计算检验统计量u值。n=210100,X=142.6,s=31.25,μ。=1300142.61305.843/31.25/210xusn假设检验步骤:3、确定P值,作出推断结论。查u界值表双侧,即t界值表中v为∞时的一行,双侧:0.050.011.96,2.58uu0.051.96u0u=5.8430.012.58t现有统计量u=5.8432.58,P0.01。按α=0.05水准,拒绝H。,接受H1,差异有统计学意
本文标题:u检验和t检验
链接地址:https://www.777doc.com/doc-3362944 .html