您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 4_假设检验_科学学位
宋曼殳首都医科大学公共卫生学院流行病与卫生统计学系假设检验的基本思想假设检验的基本步骤主要内容复习:统计推断统计推断参数估计假设检验点估计区间估计统计推断:样本统计量总体参数根据大量调查结果,已知某地新生儿平均出生体重μ0=3.30kg某医生从该地随机抽取35名难产儿作为研究样本,测其平均出生体重=3.42kg,S=0.40kg可否下结论:该地难产儿出生体重(μ)与一般新生儿体重(μ0)不同?X实例1新生儿已知总体0=3.30难产儿未知总体难产儿样本X实例1已知:μ0,推断:μμ0?X=3.42实例225例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗法,二个月后测空腹血糖(mmol/L)甲组:n1=12,=15.21乙组:n2=13,=10.85可否下结论:两种疗法治疗后患者血糖值不同?1X2XX药物治疗药物治疗合并饮食疗法12n1=121X=15.212X=10.85n2=13甲组乙组总体样本?推断已知:,推断:μ1μ2?1X2X1)μ=μ0或μ1=μ2(同一总体)差异由抽样误差造成2)μμ0或μ1μ2(不同总体)差异由两总体的本质差别(处理因素)造成是由哪种可能引起的?分析有两种可能:μ0或X1X2X——假设检验问题!某事发生了:是由于碰巧?还是由于必然的原因?统计学家运用假设检验来处理这类问题假设检验的概念由样本信息对相应总体的特征进行推断称为统计推断。若对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设,称为假设检验(hypothesistesting)。样本1同一总体差异抽样误差引起样本2总体甲样本1差异本质不同引起总体乙样本2不能用抽样误差来解释P0.05P0.05无统计学意义有统计学意义假设检验的原因(本质不同)1.反证法:当一件事情的发生只有两种可能A和B,为了肯定其中的一种情况A,但又不能直接证实A,这时否定另一种可能B,则间接的肯定了A。反证法原理:某事(结果)假设检验的原理A(不能直接证明)B(容易证明)假设检验的原理2.概率论(小概率):如果一件事情发生的概率很小,那么在进行一次试验时,我们说这个事件是“不会发生的”。从一般的常识可知,这句话在大多数情况下是正确的,但是它一定有犯错误的时候,因为概率再小也是有可能发生的。小概率事件原理:某事(结果)A(绝大多数情况下发生)B(一般情况下不发生)假设检验的步骤1.建立检验假设,确定检验水准2.选择检验方法,计算检验统计量3.确定P值,作出推断结论1.建立检验假设,确定检验水准1)原假设(NullHypothesis):H02)备择假设(AlternativeHypothesis):H1假设检验的步骤其它译法:无效假设、零假设、检验假设可假定:两个总体均数无差异(μ1=μ2或μ1-μ2=0)两个总体方差相等(σ1=σ2)样本所对应的总体与某一统计学分布相同1)原假设(NullHypothesis):H0其它译法:备选假设、研究假设H1是与H0相反的假设。如果拒绝H0,则顺其自然地接受H1,即H1是拒绝H0后选择的一种假设假定两个总体参数不相等(μ1≠μ2,叫双侧检验)若依据专业知识(对总体的了解)认为可排除某一侧(μ1>μ2或μ1<μ2,叫单侧检验)2)备择假设(AlternativeHypothesis):H11.建立检验假设,确定检验水准H0:0,该地难产儿与一般新生儿平均出生体重相同H1:0,该地难产儿与一般新生儿平均出生体重不同检验水准0.05假设检验的步骤—例1分析在假设检验中,定义发生的概率P≤的随机事件为小概率事件,称为检验水准(levelofthetest)检验水准就是我们用来区分大概率事件和小概率事件的标准是人为规定的,通常取0.05或0.01在统计学上,当某事件发生的概率小于时,则认为该事件为小概率事件,其意义为对于一次随机抽样,是不太可能发生的事件检验水准假设检验的基本步骤2.选择检验方法,计算检验统计量检验方法的选用,应根据分析目的、研究设计、资料类型、样本量大小等选择适当的公式计算出检验统计量常用的检验统计量:2F)(xtuz、、、假设检验的基本步骤2.选择检验方法,计算检验统计量成组设计两样本均数的比较:t检验两大样本均数的比较:z(u)检验两样本方差的比较:F检验多个样本均数的比较:F检验多个样本率的比较:2检验nSXt假设检验中进行均数比较的方法:nSXt00X抽样误差的大小(即标准误)X比例=如果其比例值的绝对值(不大)<检验临界值,则不拒绝H0如果其比例值的绝对值(较大)>检验临界值,则拒绝H0,接受H1,说明这种差异不仅仅是由于抽样误差所引起,很能由两总体均数本身的不相等所引起以上所指的比例值通常被称为检验统计量常用的检验统计量:2FxtZ、、、2.选择检验方法,计算检验统计量因难产儿总体的标准差未知,n=35为小样本,故采用单样本t检验已知:0=3.30kg,=3.42kg,S=0.40kg在H0:μ=μ0成立的假定下,计算统计量为:003.423.301.770.40/35XXXtSSnX假设检验的步骤—例1分析3、确定概率值(P),作出推断结论假设检验的步骤做出统计学推断结论主要有两种方法:3、确定概率值(P),作出推断结论假设检验的步骤做出统计学推断结论主要有两种方法:3、确定概率值(P),作出推断结论假设检验的步骤•过去在计算机比较少的情况下,通常采用P做出统计推断;现在为计算机时代,做出统计推断常采用P≤。•实际工作中只需采用这两种判断方法中的一种即可。•最后根据统计推断结果,结合相应的专业知识,给出一个专业的结论。t,t2t1检验临界值假设检验的基本步骤3.确定P值,作出推断结论单侧检验:P(t≥t,)=|t|t,ν,则P,接受H0|t|t,ν,则P≤,拒绝H0t分布曲线3、确定P值,作出推断结论如果P,认为在检验假设H0成立的条件下,得到等于或大于现有统计量(z值或t值)的可能性大于,不属于小概率事件,则不拒绝H0,结论:差别无统计学意义,不认为两总体参数不同如果P≤,认为在检验假设H0成立的条件下,得到等于或大于现有统计量(z值或t值)的可能性小于,可判为小概率事件,则拒绝H0,接受H1,结论:差别有统计意义,两总体参数不同假设检验的基本步骤3、确定概率值(P),作出推断结论根据z分布和t分布可知如果|z|=z或|t|=t,ν,则P=如果|z|z或|t|t,ν,则P如果|z|z或|t|t,ν,则P假设检验的步骤3.确定P值,作出推断结论自由度=n-1=35-1=34,查t分布界值表,得检验临界值t0.05/2,34=2.032因为t=1.77t0.05/2,34,故P0.05统计:差异无统计学意义,按0.05水准不拒绝H0专业:根据现有样本信息,尚不能认为该地难产儿与一般新生儿平均出生体重不同假设检验的步骤—例1分析t,t检验临界值在报告结果时,最好列出概率P的确切数值或给出P值的范围,如写成0.02P0.05同时应注明采用的是单侧检验还是双侧检验,以便读者与同类研究进行比较IndependentSamplesTest.283.6002.64023.0154.36221.65217.944417.779952.64622.972.0144.36221.64883.951087.77328EqualvariancesassumedEqualvariancesnotassumedGSFSig.Levene'sTestforEqualityofVariancestdfSig.(2-tailed)MeanDifferenceStd.ErrorDifferenceLowerUpper95%ConfidenceIntervaloftheDifferencet-testforEqualityofMeans统计学软件检验统计量取值所对应P值建立假设作出推断结论计算统计量确定P值小结假设有一前提条件H0:μ1=μ2成立|t|≥t,νP≤抽样分布理论计算统计量对立条件H1:μ1μ2拒绝H0同时接受H1小结假设有一前提条件H0:μ1=μ2成立|t|t,νP抽样分布理论计算统计量不拒绝H0小结假设检验在两种假设条件下进行:总体分布已知—参数检验总体分布未知—非参数检验结果不拒绝检验假设拒绝检验假设正确理解结论的概率性(都隐含着犯错误的可能性)37I型错误和II型错误假设检验是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立,然后在假定H0成立的条件下计算检验统计量,最后根据P值判断结果,此推断结论具有概率性,因而无论拒绝还是不拒绝H0,都可能犯错误。38I型错误:“实际无差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率是(其值等于检验水准)II型错误:“实际有差别,但下了不拒绝H0的结论”,假阴性错误。犯这种错误的概率是(其值未知)。39假设检验的结果客观实际拒绝H0不拒绝H0H0成立I型错误()推断正确(1)H0不成立即H1成立推断正确(1)II型错误()表2可能发生的两类错误检验功效(效能)拒绝不正确的H0的概率,在统计学中称之检验功效(poweroftest),记为检验功效的意义是:当两个总体参数间存在差异时(如备择假设H1:成立时),所使用的统计检验能够发现这种差异(拒绝零假设H0:)的概率一般情况下要求检验功效应在0.8以上100411-:检验效能(power):当两总体确有差别,按检验水准所能发现这种差别的能力。I型错误与II型错误示意图(以单侧z检验为例)43图3I型错误与II型错误示意图(以单侧u检验为例)H1:0成立界值01144减少I型错误的主要方法:假设检验时设定值。减少II型错误的主要方法:提高检验效能。提高检验效能的最有效方法:增加样本量。如何选择合适的样本量:实验设计。减少(增加)I型错误,将会增加(减少)II型错误增大n同时降低α与βα与β间的关系461.要有严密的研究设计,尤其是下因果结论2.不同的资料应选用不同检验方法。3.正确理解“统计学意义”一词的含义。假设检验的统计意义与实际意义474.结论不能绝对化,提倡使用精确P值5.注意统计P值大小与医学/临床/生物学差异大小的区别6.可信区间与假设检验各自不同的作用,要结合使用48有实际专业意义的值H0(2)(3)(4)(5)(1)有实际可能有实际无实际样本例数可接受专业意义专业意义专业意义太少H0有统计学意义无统计学意义可信区间在统计推断上提供的信息49一方面,可信区间亦可回答假设检验的问题,算得的可信区间若包含了H0,则按水准,不拒绝H0;若不包含H0,则按水准,拒绝H0,接受H1。50另一方面,可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义。51虽然可信区间亦可回答假设检验的问题,并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率检验水准的前提下进行计算,而假设检验能够获得一较为确切的概率P值。学术网站:“医学统计学”北京市精品课程网址:网上免费统计学资源:学术期刊:中国卫生统计杂志StatistcsinMedicine参考资料
本文标题:4_假设检验_科学学位
链接地址:https://www.777doc.com/doc-4534010 .html