您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 计量资料两组均数的比较-t检验
第六章计量资料两组均数的比较—t检验主要内容假设检验的基本原理和步骤样本均数与总体均数的比较两相关样本均数的比较两独立样本均数的比较t检验的应用条件检验假设注意的问题案例讨论假设检验的概念与原理对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设,称为假设检验(hypothesistesting)。为什么要进行假设检验?假设检验能够处理哪些问题?假设检验的基本思想是什么?假设检验的基本步骤有哪些?应用假设检验还要涉及哪些问题?假设检验的思维逻辑实例:欲探讨男性成人肺炎患者的血红蛋白同男性健康成人有无区别,如果能够测量所有的男性成人肺炎患者和男性健康成人的血红蛋白数值,我们通过计算均数就可以进行大小的比较。可是,男性成人肺炎患者和男性健康成人的群体是无限大的,其血红蛋白值构成的总体也是无限的。若随机抽取两个样本,各10例:10例男性成人肺炎患者的血红蛋白(g/dl)测量值:11.9,10.9,10.1,10.2,9.8,9.9,10.3,9.3,9.8,8.9;10例男性健康成人的血红蛋白(g/dl)测量值:13.9,14.2,14.0,14.3,13.7,13.9,14.1,14.7,13.5,13.6。算得10例男性成人肺炎患者的血红蛋白均数为10.11(g/dl),10例男性健康成人的血红蛋白均数为13.99(g/dl),差别的原因?差别的原因可能有两种:本质上的差异抽样误差只要个体之间存在差异,抽样误差就不可避免。欲想知道差别到底是本质上的差异还是纯粹的抽样误差,需进行假设检验。借助抽样误差的分布规律:均数的分布、t分布、z分布、…t变换/2,t/2,ttP1接受无效假设拒绝H0拒绝H0tt假设检验的原理:假设检验(hypothesistest)也称显著性检验(significancetest),采用的是小概率反证法的思想,即是事先对样本统计量的分布和总体参数作出某种假设然后判定样本统计量在总体分布所处的位置和对应的概率值如果样本统计量(如)在总体分布中的位置远离假定的参数,相对应的P值也小(如小于0.05)根据“小概率事件在一次试验中一般不可能发生”的原理,统计学有理由认为样本统计量不是来自事先假定的总体假设检验的基本步骤例已知北方农村儿童前囟门闭合月龄为14.1月。某研究人员从东北某县抽取36名儿童,得囟门闭合月龄均值为14.3月,标准差为5.08月。问该县儿童前囟门闭合月龄的均数是否大于一般儿童?1.选择检验方法,建立检验假设并确定检验水准根据研究目的、研究设计的类型和资料特点(变量种类、样本大小)等因素选择合适的检验方法。并且将需要推断的问题表述为一对关于总体特征的假设。原假设(nullhypothesis),又称无效假设,记为H0;对立假设(alternativehypothesis),又称备择假设,记为H1。H1的内容直接反映了检验单双侧。若H1中只是0或0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。例建立的原假设为:μ=14.1(月),(μ为该县儿童前囟门闭合月龄总体均数),意为“总体上该县儿童前囟门闭合月龄的平均水平与一般儿童的平均水平相同”。对立假设为:μ14.1(月),意为“该县儿童前囟门闭合月龄的平均水平高于一般儿童的平均水平”。检验水准(sizeofatest),用希腊字母α表示。实践中常取0.05或0.01等数值。它将小概率事件具体化,即规定概率不超过α就是小概率2.计算统计量根据样本数据计算相应的统计量。统计量(statistic)是随机样本的函数。它不应包含任何未知参数。在例7-1中,应计算t检验的统计量t。236.036/08.51.143.14/0nsxt(相应的自由度为)351361n.3.确定P值P值的意义是:如果总体状况和0H一致,统计量获得现有数值以及更不利于0H的数值的可能性(概率)有多大?统计量越大越不利于(0H),所以这里的P值应取为自由度为35的t分布曲线下、大于t=0.236的尾端的面积。4.做推断结论假设检验的推断结论是对“0H是否真实”作出判断。这种判断是通过比较P值与检验水准α的大小来进行的。在两个检验假设之间进行二者取一抉择的规则是:如果P值小于或等于检验水准α,意味着在0H成立的前提下发生了小概率事件,根据“小概率事件在一次随机试验中不(大)可能发生”的推断原理,怀疑0H的真实性,从而做出拒绝(reject)0H的决策。因为1H与0H是对立的,既然拒绝0H,就只能接受1H如果P值大于α,在成立的假设下发生较为可能的事件,没有充足的理由对提出怀疑。于是做出不拒绝的决策无论做出哪一种推断结论(接受或是拒绝),都面临着发生判断错误的风险。这就是假设检验的两类错误第一节样本均数与总体均数的比较基本思想与步骤:1.假设检验:H0:总体均数为μ0,即μ=μ0H1:μ≠μ0.其对立假设H1包括μμ0和μμ0两种可能。一般情况下均采用双侧检验2.计算统计量推断样本来自的总体均数µ与已知的某一总体均数µ0(常为理论值或标准值)有无差别nsXsXtx001n3.确定P值P值的意义是:如果总体状况和一致,统计量获得现有数值以及更不利于的数值的可能性(概率)有多大第二节两相关样本均数的比较配对设计主要适用于以下情况:同一受试对象处理前后的比较,或两个部位的数据,(若为某种处理前后的数据,需要经历的处理时间较长,测量结果稳定)同一样品(或受试对象)用两种处理方法(或测量等)检测的结果;根据非处理因素配对后,两个受试对象分别接受两种不同处理的数据0H:差数的总体均数是否为“0”,即μd=0,1H:μd≠0α=0.05当0H成立时,检验统计量nSdtd/0~)(t,1n.其中d为差值的均数,dS为差值的样本标准差,n是对子数。如果根据样本算得的t值偏大,有理由拒绝0H。基本思想与步骤例为探讨健康教育干预对于儿童铅中毒的重要作用,对于某地区12名儿童的家庭实行健康教育干预三个月,干预前后血铅水平(ug/L)如表7-1所示,试问干预前后血铅水平有无变化?表健康教育干预三个月前后血铅水平(ug/L)含量序号干预前干预后差值1200.42184.6815.742154.39128.6726.723242.22208.3033.924226.78210.3516.535136.77126.2510.526198.35188.3210.037176.89164.7212.178166.58150.4816.109110.5098.6411.9610148.39129.9818.4111172.18158.3614.8212180.11164.0716.041.建立检验假设,确定检验水准0H:干预前后血铅水平差值的总体均数相等,即0d,1H::0d=0.052.计算统计量这里n=12,202.96,/202.96/1216.9133dddn23962.9872d223962.9872(202.96)/12/1148.2052dS48.20526.9430dS16.913308.43866.9430/12t3.确定P值和作推断查附表2(t界值表),0.05/2,112.201t,得p0.05,在=0.05的水准上拒绝0H,可以认为健康教育干预措施对于该地区儿童血铅水平的下降有效。第三节两独立样本均数的比较两组独立样本(twoindependentsample)将受试对象随机分配成两个处理组,每一组随机接受的一种处理一般把这样获得的两组资料视为代表两个不同总体的样本,推断它们的总体均数是否相等从两个人群(例如某年龄组男性与女性)分别随机抽取一定数量的观察对象,测量某项指标进行比较在实际工作中这类资料也按完全随机设计的两样本比较来对待(一)两样本所属总体方差相等如果两总体均为正态分布,分别记为N(μ1,σ2)和N(μ2,σ2),检验假设为H0(两样本所属的)两个总体均数相等,即μ1=μ2H1:μ1≠μ2已知当H0成立时,检验统计量1221211()cXXtSnn~t(n1+n2-2)其中,2cS是合并方差2)()(2)1()1(21222211212222112nnXXXXnnSnSnSc如果根据样本算得的t值偏大,有理由拒绝0H。基本思想和步骤例某职防所测定了某工厂不同工种的两个车间的氟作业工人的尿氟含量(μmol/L),资料如下,问两车间的氟作业工人的尿氟含量有无差别?甲车间:126.12143.20139.41161.11123.21110.3398.06151.4486.7631.56乙车间:86.7193.14106.5190.11121.32116.1456.9278.7861.14100.301.建立检验假设,确定检验水准H0:两车间的氟作业工人的尿氟含量无差异,即µ1=µ2H1:两车间的氟作业工人的尿氟含量有差异,即µ1≠µ2α=0.052.计算统计量这里1X=127.1200,S1=23.4467;2X=91.1070,S2=21.3553;n1=n2=10Sc2=210103553.21)110(4467.23)110(22=502.8983t=)101101(8983.5021200.1271070.91=-3.5913.确定P值和作统计推断自由度υ=10+10-2=18,查t界值表得:0.002P0.005按照α=0.05的水准,拒绝H0,(接受H1,有差异)。即可以认为两车间的氟作业工人的尿氟含量有差异,乙车间较高(二)两样本所属总体方差不等(Satterthwaite近似法)如果2221,两总体分别记为),(211N和),(222N。采用统计量t’作检验。其自由度需通过调整公式计算22212121'nSnSXXt11)(24142222121nsnsssxxxx其中,1X和2X分别是两组样本的均值,21S和22S分别为样本方差,1xS和2xS分别为样本均数的标准误,1n和2n分别为两组的样本量。例为探讨硫酸氧钒对糖尿病性白内障的防治作用,研究人员将已诱导糖尿病模型的20只大鼠随机分为两组。一组用硫酸氧钒治疗(DV组),另一组作对照观察(D组),12周后测大鼠血糖含量(mmol/L)。结果为,DV组12只,样本均数为6.5mmol/L,标准差为1.34mmol/L;D组8只,样本均数为13.7mmol/L,标准差为4.21mmol/L。试问两组动物血糖含量的总体均数是否相同?1.建立检验假设,确定检验水准H0:两样本所属的两个总体均数相等,即μ1=μ2H1:μ1≠μ2α=0.052.计算统计量因两组样本方差之比为(4.21)2/(1.34)2≈9.87,将n1=12,LmmolX/5.61,S1=1.34mmol/L,n2=8,LmmolX/7.132,S2=4.21mmol/L代入(7-5)式,6817.41234.1821.45.67.132222212121'nSnSXXt由(7-6)式得89542.7112)1234.1(18)821.4()1234.1821.4(22222223.确定P值和作统计推断查附表2(t临界值表),得0.05/2,82.306t,知P0.05,在α=0.05水平上拒绝H0。所以可认为经硫酸氧钒治疗的大鼠与未治疗大鼠的血糖含量不同。第四节t检验的应用条件(一)图示法:P-Pplot,Q-Qplot(二)矩法偏度系数(skewness),峰度系数(k
本文标题:计量资料两组均数的比较-t检验
链接地址:https://www.777doc.com/doc-3709765 .html