您好,欢迎访问三七文档
•卡方检验基础•配合度检验•列联表检验•卡方检验中的特殊性问题现将每个随机变量标准化,得到n个相互独立的服从标准正态分布的随机变量:设有一平均数为,方差为的正态总体,现从总体中独立随机地抽取n个样本(n个随即变量):212nxxx、、、1212nnxxx,,,记这n个标准正态分布随机变量的平方和为:22222222122()iinixx它服从自由度为n的分布,记为:2222()()ixn卡方分布的来源一、概念定义:检验观测频数是否等于理论频数的假设检验称为配合度检验例子:遗传学中的分离规律:杂种第二代3种基因型比例AA:Aa:aa=1:2:1杂种第二代2种表现型比例A_:aa=3:1豌豆F2代红花与白花比例=3:1遗传学的自由组合规律:杂种第二代4种表现型比例A_B_:A_bb:B_bb:aabb=9:3:3:1豌豆F2代:黄色圆粒:黄色皱粒:绿色圆粒:绿色皱粒=9:3:3:1人类中男女性别比例=1:123计算值224从值表中查出值,自由度等于分组数-122当时,表明实际数与理论数差异显著225当时,表明实际数与理论数差异不显著:显著水平,犯第一类错误的概率,即无效假设正确,但经过检验给推翻了。1提出统计假设:虚无假设H0:实际比例符合理论比例备选假设H1:实际比例不符合理论比例2根据理论比例计算理论频数检验方法或通常规定=0.05,0.01例:孟德尔用豌豆的两对相对性状进行杂交试验,黄色圆滑种子与绿色皱缩种子的豌豆杂交后,F2代的分离情况为:黄圆315粒,黄皱101粒,绿圆108粒,绿皱32粒,共556粒,问此结果是否符合自由组合规律。第一步:提出统计假设无效假设H0:实际观察次数之比符合9:3:3:1的理论比例备择假设HA:实际观察次数之比不符合9:3:3:1的理论比例第二步:计算理论次数:根据理论比例9:3:3:1求理论次数黄圆理论次数E1=556×9/16=312.75;黄皱理论次数E2=556×3/16=104.25;绿圆理论次数E3=556×3/16=104.25;绿皱理论次数E4=556×1/16=34.75第三步:列表计算2第四步:查临界值,作出统计推断2自由度220.050.013,(3)7.81,(3)11.34df计算的,故不能否定H0,220.05类型实际次数O理论次数EO-E黄圆315312.752.250.016黄皱101104.25-3.250.101绿圆108104.253.750.135绿皱3234.75-2.750.218总和55655600.4702()iiiOEE表明实际次数与理论次数差异不显著,可以认为豌豆四种植株的比例符合9:3:3:1的理论比例。分组数=4,自由度df=4-1=3,用非校正公式计算卡方值。=0.016+0.101+0.135+0.218=0.470例题:现有200头母猪所产仔猪1月龄窝重的分组数据见右表(单位kg),试检验该仔猪1月龄窝重是否服从正态分布。•从直观上看数据的分布,两头少,中间多,两侧基本对称,基本符合正态分布。•但需要用统计方法检验。分组组中值频数0~8408~1612416~2420624~3228932~40361040~48441348~56521756~64602664~72683572~80762880~88842188~96921696~1041008104~1121084112~1201163120~1281240第一步,统计假设无效假设H0:仔猪1月龄窝重服从正态分布备选假设HA:仔猪1月龄窝重不服从正态分布第二步,计算理论频数:因为要检验数据是否服从正态分布,所以理论频数应该根据正态分布计算,即先用正态分布计算在每个组的区间内取值的概率,然后用概率乘以数据总数200就得到各个组的理论频数。⑴计算平均数和方差:由于正态分布的总体平均数和总体方差未知,需用样本平均数和样本方差作为他们的估计值。04412012465.6200iifxxn分组组中值x频数f0~8408~1612416~2420624~3228932~40361040~48441348~56521756~64602664~72683572~80762880~88842188~96921696~1041008104~1121084112~1201163120~1281240222()1iiiifxfxnsn2222(044120124)1312020020012508.783922.556⑵计算各组的概率(理论频率)(816)Px例如,第二组8~16取值的概率是:分组组中值频数理论频数合并理论频数0~8401.0168~161241.70416~242063.7224~322896.926.9232~40361012.0612.0640~48441318.1218.1248~56521723.1823.1856~64602627.7027.7064~72683528.428.472~80762824.9624.9680~88842120.2820.2888~96921614.0414.0496~10410088.948.94104~11210844.88112~12011632.288120~12812401.552865.665.61665.622.55622.55622.556xp2.552.20pz2.202.55pzpz0.013900.0053860.00852因为前面三组和后面三组的理论频数小于5,需要将它们合并。6.448.72⑶计算理论频数第二组8~16的理论频数=200×0.00852=1.704:0~241210104~1281167第三步,计算检验统计量——卡方值由于用样本估计了2个总体参数(平均数和方差),故自由度=分组数-2-1=12-2-1=9,分组组中值频数合并理论频数0~2412106.4424~322896.9232~40361012.0640~48441318.1248~56521723.1856~64602627.7064~72683528.472~80762824.9680~88842120.2888~96921614.0496~10410088.94104~12811678.7222(106.44)(78.72)6.448.721.96800.62520.33938.7308第四步,查卡方表,做统计推断20.05(9)16.92所以,判断差异不显著,接受H0:仔猪1月窝重服从正态分布。220.058.7308(9)16.92
本文标题:93卡方检验
链接地址:https://www.777doc.com/doc-3676611 .html