您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 生物统计学 第五章 卡方检验
两个比率比较的u(t)检验,在观察例数不足够大或拟对多个比率进行比较时,该检验不适宜,因为直接对多个样本率作两两间的u(t)检验有可能加大第一类错误。χ2检验的基本思想是检验实际频数与理论频数的差别是否由抽样误差所此起的,也是就是样本率(或样本构成比)来推断总体率(或总体构成比)。χ2检验第五章χ2检验的相关知识一、χ2检验的定义对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。二、χ2检验与连续型资料假设检验的区别检验2连续型资料假设检验数据资料所属总体检验对象连续型资料离散型资料总体正态分布总体分布未知总体参数或几个总体参数之差不是对总体参数而是对总体分布的假设检验χ2检验的相关知识三、χ2检验的用途适合性检验独立性检验同质性检验指对样本的理论数先通过一定的理论分布推算出来,然后用实际观测值与理论数相比较,从而得出实际观测值与理论数之间是否吻合。因此又叫吻合度检验。在连续型资料的假设检验中,对一个样本方差的同质性检验,也需进行χ2检验。是指研究两个或两个以上的计数资料或属性资料之间是相互独立的或者是相互联系的假设检验,通过假设所观测的各属性之间没有关联,然后证明这种无关联的假设是否成立。χ2检验的相关知识第五章第一节第二节第三节χ2检验的原理与方法适合性检验独立性检验χ2检验的原理与方法χ2检验就是统计样本的实际观测值与理论推算值之间的偏离程度。实际观测值与理论推算值之间的偏离程度就决定其χ2值的大小。两值偏差越大,χ2值就越大,越不符合;偏差越小,χ2值就越小,越趋于符合;两值完全相等,χ2值就为0,表明理论值完全符合。性别观察值(O)理论值(E)O-E公羊母羊428448438438-10+10合计8768760876只羔羊性别调察要回答这个问题,首先需要确定一个统计量,将其用来表示实际观测值与理论值偏离的程度;然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。判断实际观测值与理论值偏离的程度,最简单的办法是求出实际观测值与理论值的差数。性别观察值(O)理论值(E)O-E公羊母羊428448438438-10+10合计8768760876只羔羊性别调察由于差数之和正负相消,并不能反映实际观测值与理论值相差的大小。为了避免正、负相抵消的问题,可将实际观测值与理论值的差数平方后再相加,也就是计算:∑(O-E)2值越大,观测值与理论值相差也就越大,反之越小。2)(iiEO值越大,观测值与理论值相差也就越大,反之越小。2)(iiEO将实际观测值与理论值的差数平方,即(O-E)2,再用差数的平方除以相应的理论值,将之化为相对数,从而来反映(O-E)2的比重,最后将各组求和,这个总和就是χ2。69iiEO4649iiEOiiiEEO22)(χ2值就等于各组观测值和理论值差的平方与理论值之比,再求其和。876只羔羊性别调察)(O观测值)(E理论值EEO2)(性别公羊428438-100.2283母羊448438+100.2283合计87687600.4566EOiiiEEO22)(可加性非负值随O和E而变化iiiEEO22)(χ2值与概率P成反比,χ2值越小,P值越大,说明实际值与理论值之差越小,样本分布与假设的理论分布越相一致;χ2越大,P值越小,说明两者之差越大,样本分布与假设理论分布越不一致。观测值与理论值的差异由抽样误差引起,即观测值=理论值。备择假设HA:观测值与理论值的差值不等于0,即观测值≠理论值一般确定为0.05或0.011.提出无效假设H02.确定显著水平α3.计算样本的χ2值4.进行统计推断2222iiiEEO22)(1ndf1、任何一组的理论次数Ei都必须大于5,如果Ei≤5,则需要合并理论组或增大样本容量以满足Ei>52、在自由度=1时,需进行连续性矫正。χ2检验的注意事项iiicEEO22)5.0(由于检验的对象-次数资料是间断性的,而χ2分布是连续型的,检验计算所得的χ2值只是近似地服从χ2分布,所以应用连续型的χ2分布的概率检验间断性资料所得的χ2值就有一定的偏差。由次数资料算得的χ2均有偏大的趋势,即概率偏低。当df=1,尤其是小样本时,必须作连续性矫正。Yates(1934)提出了一个矫正公式χ2检验的注意事项第五章第一节第二节第三节χ2检验的原理与方法适合性检验独立性检验适合性检验比较观测数与理论数是否符合的假设检验。第二节:适合性检验是对样本的理论值先通过一定的理论分布推算出来,然后用实际观测值与理论值比较,从而得出实际观测值与理论值之间是否吻合,因此也称为吻合性检验或拟合度检验。遗传学中用以检验实际结果是否符合遗传规律样本的分布与理论分布是否相等自由组合定律适合性检验的df由于受理论值的总和等于观测值总和这一条件的约束,故df=n-1孟德尔分离规律适合性检验体色青灰色红色总数F2观测尾数1503991602鲤鱼遗传试验F2观测结果H0:鲤鱼体色F2分离符合3:1比率;HA:鲤鱼体色F2分离不符合3:1比率;例有一鲤鱼遗传试验,以荷包红鲤(红色)与湘江野鲤(青灰色)杂交,其F2代获得如下表所示的体色分离尾数,问这一资料的实际观测值是否符合孟德尔一对等位基因的遗传规律,即鲤鱼体色青:红=3:1(1)假设α=0.05df=k-1=2-1=1在无效假设H0正确的前提下Ei=1602×3/4=1201.5红色理论数为:Ei=1602×1/4=400.5需要连续性校正(2)水平(3)检验(4)推断青灰色的理论数为:63.3015.400)5.05.40099(5.1201)5.05.12011503()5.0(222122iiiiEEO查χ2值表,当df=1时,χ20.05=3.84。实得χ2c=301.63>χ20.05否定H0,接受HA,即鲤鱼体色F2分离不符合3:1比率。在遗传学中,有许多显、隐性比率可以划分为两组的资料,如欲测其与某种理论比率的适合性,则χ2值可用下表中的简式进行计算:naA21naA25.122naA3232naA638972rnrraA221rmnmrramA221:11:21:37:91:rmr:理论比率χ2值显:隐Aa大豆花色遗传试验F2观测结果28981208F2观测株数总数花色例(1)H0:大豆花色F2分离符合3:1比率;HA:大豆花色F2分离不符合3:1比率;(2)取显著水平α=0.05(3)计算统计数χ2值:256.128932813208323222naA256.128932813208323222naA(4)查值表,进行推断接受H0,即大豆花色F2分离符合3:1比率df=184.3205.0P>0.05对于资料组数多于两组的值,可通过下面简式进行计算:npOnii221Oi-第i组的实际观测数pi-第i组的理论比率n-总次数F2代,共556粒31510110832豌豆此结果是否符合自由组合规律根据自由组合规律,理论分离比为:161163163169:::皱=黄圆:黄皱:绿圆:绿豌豆杂交实验F2分离结果黄圆黄皱绿圆绿皱实际观测数O理论频数P理论数EO-E(O-E)2/E3159/16312.752.250.0161013/16104.25-3.250.1011083/16104.253.750.135321/1634.75-2.750.218方法一(1)H0:豌豆F2分离符合9:3:3:1的自由组合规律;HA:豌豆F2分离不符合9:3:3:1的自由组合规律;(2)取显著水平α=0.05(3)计算统计数χ2值:χ2=0.016+0.101+0.135+0.218=0.470(4)查临界值表,进行推断:df=4-1=3815.7205.0χ2<χ20.05P>0.05接受H0,即豌豆F2分离符合9:3:3:1的自由组合规律。方法二31510110832161163163169:::皱=黄圆:黄皱:绿圆:绿470.05561613216310816310116931555611222222npOniiχ2=0.016+0.101+0.135+0.218=0.470第五章第一节第二节第三节χ2检验的原理与方法适合性检验独立性检验独立性检验独立性检验(independencetest)又叫列联表(contingencytable)χ2检验,它是研究两个或两个以上因子彼此之间是独立还是相互影响的一类统计方法。(一)2×2列联表的独立性检验设A,B是一个随机试验中的两个事件,其中A可能出现r1、r2个结果,B可能出现c1、c2个结果,两因子相互作用形成4格数,分别以O11、O12、O21、O22表示,下表是2×2列联表的一般形式行列c1c2总和r1r2O11O21O12O22R1=O11+O12R2=O21+O22总和C1=O11+O21C1=O12+O22T无效假设H0:事件A和事件B无关;HA:事件A和事件B有关联关系。确定显著水平α依据H0,推算出理论数,计算χ2值确定自由度,df=(r-1)(c-1),查临界值表,进行推断。(1)假设(2)水平(3)检验(4)推断给药方式有效无效总数有效率口服注射5864403198(R1)95(R2)59.2%67.4%总数122(C1)71(C2)193(T)给药方式与给药效果的2×2列联表1.H0:给药方式与给药效果相互独立。HA:给药方式与给药效果有关联。2.给出显著水平α=0.053.根据H0,运用概率乘法法则:事件A与事件B同时出现的概率为:P(AB)=P(A)P(B)口服与有效同时出现的理论频率=口服频率×有效频率,即P(AB)=P(A)P(B)=98/193×122/193理论频数Ei=理论频率×总数给药方式有效无效总数有效率口服注射5864403198(R1)95(R2)59.2%67.4%总数122(C1)71(C2)193(T)理论频数Ei=理论频率×总数=98/193×122/193×193=(98×122)/193=61.95即Eij=Ri×Cj/T=行总数×列总数/总数给药方式有效无效总数有效率口服注射5864403198(R1)95(R2)59.2%67.4%总数122(C1)71(C2)193(T)E11=R1×C1/T=61.95E12=R1×C2/T=36.05E21=R2×C1/T=60.05E22=R2×C2/T=34.95给药方式有效无效总数口服注射58(61.95)64(60.05)40(36.05)31(34.95)98(R1)95(R2)总数122(C1)71(C2)193(T)给药方式与给药效果的2×2列联表057.195.345.095.34315.365.05.364005.605.005.606495.615.095.61585.0222222EEOc计算χ2值:由于df=(r-1)(c-1)=(2-1)(2-1)=1,故所计算的χ2值需进行连续性矫正:给药方式有效无效总数口服注射58(61.95)64(60.05)40(36.05)31(34.95)98(R1)95(R2)总数122(C1)71(C2)193(T)4.查χ2表,当df=1时,χ20.05=3.841,而χ2c=0.863<χ20.05,P>0.05,应接受H0,拒绝HA,说明给药方式与给药效果相互独立.2×2列联表的χ2检验可利用以下简式而不必计算理论次数:212122112221122/CCRRTTOOOOcT/2-为矫正数212122112221122/CCRRTTOOOOc057.17112295
本文标题:生物统计学 第五章 卡方检验
链接地址:https://www.777doc.com/doc-3403325 .html