您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 小样本资料的差异显著性检验
第六章小样本资料的差异显著性检验本章主要介绍小样本时单个均数、两个均数的假设检验单个率、两个率间的假设检验应重点掌握各种情况下的t检验方法正确区分成组资料和配对资料在上一章中,我们系统介绍了抽样分布和统计推断的基本原理和基本方法,即通过随机抽样的方法获得某一特定总体的随机样本,用这一样本进行试验,并对试验后所得资料进行分析,通过统计推断来定性或定量地分析研究总体的特征本章主要介绍总体方差未知、且样本较小时不同资料类型的统计推断——差异显著性检验(假设检验)的具体方法第一节单个平均数的假设检验单个平均数的假设检验是检验一个样本所属的总体平均数与一个特定(已知)总体平均数间是否存在显著差异的一种统计方法,也可理解为检验一个样本是否来自某一特定(已知)总体的统计分析方法根据统计假设检验的基本原理可知,假设检验的关键是根据统计量的分布计算实得差异(即表面效应)由抽样误差造成的概率测验的统计量分布服从u-分布或t-分布,所以单个平均数的假设检验可分为u-test和t-test两种0一、总体方差已知时单个平均数的假设检验当总体方差已知,不管样本多大,均可用u-分布计算实得差异由抽样误差造成的概率,所以称u-testu-检验(u-test)的方法和步骤见前一章内容(请逐一回忆一下检验公式和检验步骤)2二、总体方差未知时单个样本平均数的假设检验(一)当总体方差未知、而样本较大时,可以使用u-分布计算实得差异由抽样误差造成的概率因此,其检验还是u-test(请回忆一下以上两种u-test的共同点和不同点;公式的不同:哪里不同)(二)总体方差未知,且样本较小时的单个样本平均数的假设检验实际上,在很多情况下,总体方差往往是未知的,而由于各种条件的限制,试验的样本又不可能很大,即只能用小样本来作试验,或调查时抽取的样本较小因此,总体方差未知、样本较小是试验中最常见的一种情况在第四章讨论t-分布时,我们已经知道,总体方差未知、且样本较小时,可以用代替,其统计量就不再服从标准正态分布,而是服从t-分布:2s2xxsxxts(请回忆一下t-分布曲线及其特点)t-分布曲线受自由度制约,不同自由度下的t-分布曲线其形状是不同的,因此不同自由度下算得的t-值落在某一范围内的概率值也随自由度的不同而不同下面我们用例子来说明这一类型的t-test例:猪的正常肛温为39℃,今有一个猪场报告,怀疑其猪群可能是发病了,某兽医在该场内随机抽测了24头猪的体温,得到这24头猪的平均肛温为=40.2℃,标准差为=1.25℃,试问该猪场的猪犯病了吗?该例仅有总体平均值=39℃,而无总体方差,且样本量不大(n=2430),因此符合总体方差未知、且是小样本的情况,应使用t-test来进行检验xs已知:=39℃,样本=40.2℃,=1.25℃检验步骤如下:设℃℃计算和t值:查附表4:t分布表,得知:自由度为df=24-1=23时的xs0:39H39AHvsxs1.250.25524xssn40.2394.710.255xxts0.05,232.069t0.01,232.807t本例中所得所得t值的概率因此,应否定无效假设,接受备择假设即:该猪群肛温与正常猪肛温差异显著,我们有95%以上的把握认为该猪群犯病了由于所得t值远大于因此还应当作进一步的检验:所得t值出现的概率,因此更应该否定无效假设而接受备择假设即:该猪群肛温与正常猪肛温差异极显著,我们有99%以上的把握认为该猪群犯病了0.05,234.712.069tt0.01,234.712.807tt0.05p0.01p0.05,232.069t再举一例:药典规定,某药物每100ml中应含有60mg的总黄酮,现对某药厂生产的某一批次的这种药进行检测,得如下数据,试问该批次药物的总黄酮含量合格吗?58.359.258.660.660.359.559.158.061.058.9n=10下面我们作统计分析由于是小样本,且总体方差为未知因此应使用t-test进行分析(请同学们先自行立题、计算)首先计算平均数和标准差,得:第一步,设立无效假设设:查t值表,得:即接受无效假设,即该批次药物的总黄酮含量符合药典规定(试想一下,该题可以用一尾检验吗?)0:60Hvs:60AH59.35x0.999s0.9990.3210xssn|59.3560|2.030.32t0.05,92.262t0.05,92.032.262tt0.05p我们有三个公式用于单个样本的统计假设检验:能说出这三个公式各自的使用场合和它们之间的区别吗?xxuxxusxxts第二节两个样本平均值相比较的统计假设检验很多情况下,我们不只是将样本平均数与总体平均数相比较而是做一个试验,这个试验中设置两个组,一个组作试验,施加某种试验条件(即处理),另一个组作对照,试验完了将这两个组的试验数据进行比较这种试验可以采用两种方法进行:第一种方法是两个组的数据是相互独立的:一组是处理,另一组是对照第二种方法是两个组的数据是配对的下面我们先讨论两个组是相互独立的情况这种统计假设检验的方法称为成组数据的比较一、成组数据的平均值比较方法介绍:在一个总体中,随机地抽取两个样本,在这两个样本中,被抽取的个体是相互独立的,且基本条件(如品种、日龄、性别、体况等)都应一致、均匀,必要时须作适当的调整,尽可能使两个组在样本量上一致,各组的基本情况一致随机地指定一组作处理,另一组作对照一定要注意其中的任意一组作处理,一组作对照,而不能事先规定哪一组做处理,哪一组作对照试验过程中注意记录资料,结束以后整理资料并进行统计分析这样得到的资料称为成组数据这样的数据在组间、组内都是独立的成组数据的t-test其公式是:其中:1212xxxxts12221222121212121111xxxxxxnnsnnnn或:t公式中分母两样本差的标准误也可以这样写:其中:当两样本量相等时:则:122211221212111111xxnsnssnnnn1221211xxssnn22122212212122xxxxnnsnn12nnn122222121211xxnsssssnnn在小样本时,两样本平均数差的标准化是服从t分布的因此:由于我们在之前的无效假设是:(备择假设是:)因此这一式子可以简化为:121212xxxxts012:H12:AH121212xxxxs1212xxxxts得到成组数据所进行的试验称为完全随机设计法(仅两个组)两个组的样本量可以相等,也可以不等,但应尽量接近这种两个组是完全独立的试验,如:一组用药,一组不用药一组用试验药物,一组用常规药物一组用试验剂量,一组用常规剂量一组是引进品种(品系),一组是本地品种,等等就称为完全随机设计试验这里,前面的一组称为处理,后一组称为对照下面我们以实例来说明成组数据的比较A、B两厂生产某同类药物,现作24小时血液内残留量检测,得如下数据,试分析哪一厂家的该类药物的残留量大A厂:49.348.149.851.250.050.749.948.550.451.6B厂:48.349.748.248.847.347.750.449.2显然,这两个厂家的药物是相互独立的,试验所用动物也是独立的;样本较小因此应使用成组数据的t-test进行分析(同学们先行分析)先做预备计算,将两个样本的平均值、方差等计算出来:设立无效假设:计算t值,并作比较:所得t值出现的概率因此,否定无效假设,接受备择假设即:A、B两厂生产的该类药物的24h血液残留量差异显著(下面应针对这一现象作出专业解释)110n149.95x211.225s28n248.70x221.074s012:Hvs12:AH12111.1590.51108xxs49.9548.701.252.450.510.51t0.05,162.452.120tt0.05p在这种检验中,我们求t值时用的是合并均方,合并均方只有在两总体方差(我们一般用样本均方估计总体方差)相同,即两方差差异不显著的情况下才能得到这里我们总假定两个均方差异不显著,但如果两方差差异显著,就不能合并,两均方是否相等,必须用下一章的F-test进行检验才能知道当两均方不等(称为方差不齐)时,用以下方法计算和t值:当用的作判断的临界值当时须用Cochran-cox法:首先计算在α水平上显著的临界值式中:,12xxs12221212xxsssnn1212xxxxts12nnn1dfnt12nn't22121212222112'tnstnstnsns111tdfnt是的值221tdfnt是的值若就否定,否则,就接受由于处于之间,因此,只有在实际计算得到的在之间时,才需要计算附:两均方是否齐性的判别方法:如果表示两均方齐性,否则就是不齐(例题见P52该例实际是不需要计算的,为什么?)12~tt't||'tt0H0H||t12~tt't22sFs大小12,,dfdfFF't二、配对数据的平均值比较方法介绍:配对数据来自于配对试验,配对试验根据具体试验情况可以有好多种方法:1、将两个品种、性别、日龄、体况等一致的动物(最好是有血缘关系的同胞或半同胞)配成一对,任意一只进入试验组,另一只进入对照组,配成若干对,试验中做好记录,这种记录到的数据就是配对数据注意:对子内的两个个体应尽可能一样,但对子之间应有较大的差异2、选取若干个动物,每一个动物在试验前测定一次,试验后测定一次,这样的两次记录就是配对数据,如同一个人吃早饭前后各测一次血糖值,这同一个人的两次血糖值就是一对数据,若干个人就有若干个数据对3、同一个体的不同部位可以配成一对,如一个兔子的左右体侧,就可以配成一对,若干个兔子的不同体表就是若干对4、同一个动物的不同试验时期所施加的不同处理形成一个对子,如一只猪在第一试验期施加A处理,在第二试验期施加B处理;或第一试验期施加处理,第二试验期作对照凡此种种,都是配对试验,因此配对试验既有空间上的配对,亦有时间上的配对,配对试验所得到的数据,就称为配对数据配对数据的比较方法不同于成组数据的比较方法其t-test的公式为:其中:而ddts112niiddxxn221dddnsnn12iiidxx而n是对子数,这里的样本量不是2n,而是n,因此自由度不是2(n-1),而是n-1在对配对资料进行统计分析时,首先要计算每一对对子内两数据之差,即d值,然后对d值进行分析下面我们以实际例子来说明配对数据的差异性检验研究和的关系,挑选体况基本相似的一对全同胞小鼠,其中任意一只放入Ⅰ组,另一只放入Ⅱ组,共挑选了8对,分成了两组。一组饲喂正常饲料,另一组饲喂缺乏的饲料。试验结束后检测小鼠肝脏中的含量,得如下数据:对子号12345678正常35502000300039503800375034503050缺24502400180032003250270025001750差1100-400120075055010509501300idAVEVAVEVEV第一步,设立无效假设,即饲料中缺乏不影响肝脏中的储存量,对:饲料中缺乏会严重影响肝脏中的储存量简写为:设第二步,计算:首先计算各组数据的差然后计算,得得:即t值出现的概率否定无效假设,接受备择假设,即饲料中缺乏会严重影响小鼠肝脏对的储存量;或正常饲料与缺乏的饲料两者对肝脏的储存量差异极显著012:Hvs12:AH812.50d193.13ds0.01,7812.504.2073.499193.13ddtts
本文标题:小样本资料的差异显著性检验
链接地址:https://www.777doc.com/doc-5899348 .html