您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第5章用spss进行总体均数的估计和t检验
第5章总体均数的估计和t检验第一节总体均数的估计一.标准误(StandardError)标准差是描述个体值的变异。标准误用于描述统计量的变异。均数的标准误,就是样本均数的标准差,用以表达样本均数分布的离散程度。标准误小,表示抽样误差小,统计量较稳定,与所估计的参数较接近。nSSx/样本1N样本2N样本3N。。。。。。1X2X3X正态总体N(,2)各样本均数构成一个总体,为正态分布N(,2/N)。样本均数的标准差为:/用一个样本来估计样本均数的标准差为:NnSSx/通常用均数±标准差:表示一组数据的平均水平和离散程度。有时用均数±标准误:表达样本均数及其离散程度,必须注明以免误解。除了均数的标准误外,还有率的标准误,回归系数的标准误等。二.总体均数的估计总体均数用μ表示,总体均数的估计包括点估计和区间估计。点估计即用样本均数来估计总体均数。区间估计即按一定的概率估计总体均数在哪个范围内,这个范围称为置信区间,这个概率称为可信度或置信度,用1-α表示,常取95%或99%,按此确定的可信区间分别称之为95%或99%可信区间。总体服从正态分布并且总体标准差σ未知,则总体均数的95%可信区间为:nstx/,05.0例4.1求例3.2资料(P38)中红细胞数总体均数的点估计和区间估计。从例3.2的计算中可得:n=120,=4.9591,s=0.4038,自由度ν=n-1=120-1=119,查t界值表得,;(P394)。总体均数的点估计为:4.9591总体均数的95%可信区间为:=(4.8861,5.0321)总体均数的99%可信区间为:=(4.8626,5.0556)x980.1120,05.0t617.2120,01.0txˆnstx/,05.0nstx/,05.0120120x980.1120,05.0t617.2120,01.0t120/4038.0980.19591.4120/4038.0617.29591.4三.总体均数区间估计的SAS程序procmeansdata=rbcnmeanstdclm;varx;run;Procmeansdata=rbcnmeanstdclmalpha=0.01;varx;run;选择项clm表示要计算总体均数的可信区间可信区间的可信水平α可用选择项alpha=α规定程序4.1结果输出:AnalysisVariable:XNMeanStdDevLower95.0%CLMUpper95.0%CLM------------------------------------------------------------------------------------------------------1204.95909170.40383484.88609555.0320879------------------------------------------------------------------------------------------------------AnalysisVariable:XNMeanStdDevLower99.0%CLMUpper99.0%CLM-----------------------------------------------------------------------------------------------------1204.95909170.40383484.86258765.0555957-----------------------------------------------------------------------------------------------------第二节样本均数与总体均数比较的t检验设样本观察值为X1,X2,……,Xn,欲检验该样本是否来自均数为μ0的已知总体。t检验步骤为:(1)建立假设:H0:样本来自均数为μ0的总体H1:样本所来自的总体均数不为μ0双侧α=0.05(2)计算统计量,求P值xSxt/0自由度ν=n-1nSSx/求得t值后,据ν查t临界值表得t0.05,t0.01。如果,t<t0.05,则P>0.05,不拒绝H0。样本均数和μ0的差异无统计学意义。t0.05≤t<t0.01,则0.01<P<0.05,在α=0.05水平上拒绝H0,样本均数和μ0的差异有统计学意义。认为该样本并非来自均数为μ0的总体。t0.01≤t,则P<0.01,在α=0.01水平上拒绝H0,例4.2随机抽取某地区96个成年男子的脉搏平均数是每分钟73.7次,标准差为8.8次,试问该地区成年男子的脉搏平均数和每分钟72次有无差别?解:H0:μ=72H1:μ≠72t=|73.7-72|/(8.8/)=1.893ν=96-1=95查t界值表(见附表二),ν=95时,t0.05=1.982,现t=1.893<t0.05,故P>0.05。认为某地区成年男子的平均脉搏数与每分钟72次差别无统计学意义。96第三节配对t检验配对t检验(PariedtTest)用于配对试验设计(PairedDesign),它是按一些非实验因素条件将受试对象配成对子,给予每对中的个体以不同的处理。配对的条件一般为年龄、性别、体重、……。其优点是在同一对的试验对象间取得均衡,从而提高试验的效率。欲比较配对试验中两种处理的效果,或者自身对照中比较试验前后某指标的变化。可先求出成对数据之差值d。然后使用t检验,检验d是否来自均数为0的总体。配对比较设计处理前后的比较例号用药前用药后1118112211098……10122108治疗前后舒张压的改变两种处理的比较对子号A药B药10.2-0.121.01.8……100.40.8两种药物治疗白细胞降低疗效的比较(表中为白细胞升高数)。配对t检验公式为:dSdt/例4.3用某药治疗10例高血压病人,治疗前后各例舒张压测量结果如表4.1,问该药是否有降低舒张压的作用?表4.110例高血压患者用某药治疗前后的舒张压(mmHg)────────────────────────────────────例号治疗前治疗后差数d────────────────────────────────────1117123-621271081931411202141071070511010010611498167115102138138152-149127104231012210715────────────────────────────────────解:H0:差数总体均数μd=0H1:差数总体均数μd≠0。由表4.1算得各例治疗前后的差值d后,得=9.7,=12.3473/代入(4.13)式,t=9.7/(12.3473/)=2.4843,df=10-1=9查t界值表,df=9时,t0.05=2.262,t0.01=3.25现t0.05<t<t0.01,故0.01<P<0.05,所以,拒绝H0,认为治疗前后舒张压之相差有统计学意义,可以认为该药有降低舒张压作用。ddS10d10第四节团体t检验当按完全随机化设计的两个样本均数比较时,可用团体t检验(GroupedtTest),比较的目的是它们各自所代表的总体是否具有相同的均数,其假设检验为H0:μ1=μ2,H1:μ1≠μ2完全随机化设计两个样本均数比较方差齐方差不齐方差齐性检验t’检验样本大小合并方差估计法各自方差估计法21||21xxSxxt分母称为两样本之差的标准误1.小样本时,用合并方差估计法:)11(2)()(212122221121nnnnxxxxSxx自由度:DF=n1+n2-22.大样本时,用各自方差估计法:22212121nSnSSxx自由度可用公式计算第五节两组的方差齐性检验两个均数比较的t检验,其前提是两个样本所代表的总体具有相同的方差,因此在作t检验前,应该作两个方差是否齐性(一致)的检验,称为方差的齐性检验(TestforHomogeneityofVariance)。H0:σ12=σ22H1:σ12≠σ22统计量F计算:F=较大的方差/较小的方差这是一个单側检验,查单側方差分析用表。自由度值有2个,分别为分子的自由度与分母的自由度。由方差齐性检验专用的F界值表(附表四,P396),据分子,分母的自由度查得F0.05,F0.01值,如果F<F0.05,则P>0.05,不拒绝H0;如果F0.05≤F<F0.01,则0.01<P<0.05,在α=0.05水平上,拒绝H0;如果F0.01≤F,则P<0.01,在α=0.01水平上,拒绝H0。t检验的条件1.样本均数和总体均数比较的t检验:样本来自正态分布的总体。2.配对t检验:差值的总体为正态分布。3.团体t检验:1)两个样本都来自正态分布的总体。2)两个总体方差相等。t检验条件不满足时的对策1.进行变量变换,如对数变换,变换成正态分布后再进行t检验。2.用非参数检验的方法。3.两样本比较的t检验时,如正态分布但方差不齐,可用t’检验。
本文标题:第5章用spss进行总体均数的估计和t检验
链接地址:https://www.777doc.com/doc-2110559 .html