您好,欢迎访问三七文档
成才之路·数学路漫漫其修远兮吾将上下而求索北师大版·选修2-3统计案例第三章§2独立性检验第三章课堂典例探究2课时作业3课前自主预习1课前自主预习通过对案例的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用.本节重点:独立性检验的基本思想及实施步骤.本节难点:独立性检验的基本思想.1.2×2列联表设A,B为两个变量,每一个变量都可以取两个值,变量A∶A1,A2=A1;变量B∶B1,B2=B1.其频数表(称为2×2列联表)为BAB1B2总计A1aba+bA2cdc+d总计a+cb+dn=a+b+c+d其中,a表示变量A取A1,且变量B取B1时的数据;b表示变量A取A1,且变量B取B2时的数据;c表示变量A取A2,且变量B取B1时的数据;d表示变量A取A2,且变量B取B2,时的数据.2.2×2列联表的独立性检验根据2×2列联表计算出频率值,用频率估计概率进行独立性检验.用an估计P(A1B1),a+bn估计P(A1),a+cn估计P(B1).若有式子an=a+bn·a+cn,则可以认为A1与B1独立.同理,若bn=a+bn·b+dn,则可以认为A1与B2独立.若cn=c+dn·a+cn,则可以认为A2与B1独立;若dn=c+dn·b+dn,则可以认为A2与B2独立.但在an=a+bn·a+cn中,由于an、a+bn、a+cn表示的是频率,不同于概率,即使变量之间独立,式子两边也不一定恰好相等.但是当两边相差很大时,变量之间就不独立.3.独立性检验的基本思想利用2×2列联表检验变量之间是否独立,当an-a+bn·a+cn、bn-a+bn·b+dn、cn-c+dn·a+cn、dn-c+dn·b+dn大时,变量之间不独立.但不能解释这些量究竟要多大才能说明变量之间不独立.为此,统计学家引入统计量χ2=nad-bc2a+bc+da+cb+d,用它的大小来检验变量之间是否独立.当χ2较大时,说明变量之间不独立.当数据量较大时,在统计中,用以下结果对变量的独立性进行判断;(1)当__________时,没有充分的证据判定变量A、B有关联,可以认为变量A、B是没有关联的;(2)当__________时,有90%的把握判定变量A、B有关联;(3)当_________时,有95%的把握判定变量A、B有关联;(4)当_________时,有99%的把握判定变量A、B有关联.χ2≤2.706χ22.706χ23.841χ26.6351在看表时要明确合计指的是哪些数据的和;列的合计是所在列所有数据的和;行的合计是所在行所有数据的和;它们的交叉处是所有研究对象的和(样本总量),既等于所在列的数据和又等于行的数据的和.2.需要注意的是:在进行上述列联表的独立性检验时,使用的是频率,而不是概率,即使变量独立,式子的两边不一定就相等,一般来讲,如果式子两边相差不大,就可认为变量独立,但如果式子两边相差很大,变量之间就不独立.3.利用独立性检验的思想解决实际问题利用独立性检验的思想解决实际问题的思路如下:(1)独立性检验原理只能解决两个对象,且每个对象有两类属性的问题,所以对于一个实际问题,我们要首先看能不能用独立性检验的思想加以解决.(2)如果确实属于这类问题,要进行科学地抽取样本,样本容量要适当,特别不可太小,要保证每个数据都大于5;(3)根据数据列出2×2列联表;(4)根据公式计算χ2=nad-bc2a+bc+da+cb+d的值;(5)比较观测值χ2与χ2分布表中相应的检验值相比较,根据小概率原理肯定或者否定假设,判断A、B是否相关.4.利用χ2检验值为依据也可能有失误,它强调的是最大的可能性.样本量越大,这个估计越准确,使用χ2统计量作2×2列联表的独立性检验时,要求表中的4个数据都要大于5,为此,在选取样本的容量时一定要注意这一点.1.在吸烟与患肺病是否相关的计算中,有下面的说法:()①若χ2=6.635,我们有99%的把握判定吸烟与患肺病有关联,那么在100个吸烟的人中必有99个人患肺病;②从独立性检验可知有99%的把握判定吸烟与患肺病有关联时,若某人吸烟,那么他有99%的可能患有肺病;③从统计量中求出有95%的把握判定吸烟与患肺病有关联,是指有5%的可能性使得推断出现错误.其中说法正确的个数为()A.0B.1C.2D.3[答案]B[解析]根据独立性检验的意义,知③正确.2.为了探究色盲是否与性别有关,在调查的500名男性中有39名色盲患者,500名女性中有6名色盲患者,那以你认为色盲与性别有关的把握为()A.0B.95%C.99%D.都不正确[答案]C[解析]由题意得2×2列联表:色盲不色盲合计男39461500女6494500合计459551000χ2=1000×39×494-6×4612500×500×45×955≈25.34,∵25.34>6.635,∴有99%把握认为色盲与性别有关.3.下列关于χ2的说法中正确的是()A.χ2越大,“变量A、B有关联”的可信度越小B.χ2越大,“变量A、B无关”的可信度越大C.χ2越小,“变量A、B有关联”的可信度越小D.χ2越小,“变量A、B无关”的可信度越小[答案]C[解析]χ2越大,“变量A,B有关联”的可信度越大,“变量A,B无关”的可信度越小;相反,χ2越小,“变量A,B有关联”的可信度越小,“变量A,B无关”的可信度越大.4.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射后14天内的结果如下表所示:死亡存活合计第一种剂量141125第二种剂量61925合计203050进行统计分析时的统计假设是____________.[答案]假设电离辐射的剂量与人体受损程度无关.5.下面是一个2×2的列联表yxy1y2总计x1a2173x222527总计b46100则表中a、b的值依次为________.[答案]5254[解析]由a+21=73得a=73-21=52,由a+2=b,b=52+2=54.课堂典例探究独立性检验动物园对某种动物进行接种试验,预防传染病,经试验得到如下数据:传染情况接种情况发生传染病未发生传染病接种680未接种1868问进行接种试验是否能有效预防传染病.[解析]由已知数据得2×2列联表如下:传染情况接种情况发生传染病未发生传染病总计接种68086未接种186886总计24148172则χ2=17268×6-80×18286×86×24×148≈6.973,∵6.9736.635,∴有99%的把握认为“接种”与“染病”有关.又设A为接种未染病,B为未接种未染病,则由数据得P(A)=8086≈0.9302,P(B)=6886≈0.7907.∴我们有99%的把握认为接种能够更有效地预防传染病.[反思总结]熟悉临界值与相关程度的关系,一般情况下,当χ22.706时,说明“变量A与B的关联”的可信程度为90%;当χ23.841时,说明“变量A与B有关联”的可信程度为95%;当χ26.635时,说明“变量A与B有关联”的可信程度为99%;当χ2≤2.706时,可认为变量A与B无关联.巴西医生马廷思收集犯有各种贪污、受贿罪的官员与廉洁官员之寿命的调查资料:500名贪官中有348人寿命小于平均寿命、152人的寿命大于或等于平均寿命;590名廉洁官中有93人的寿命小于平均寿命、497人的寿命大于或等于平均寿命.这里的“平均寿命”是指“当地人均寿命”.试分析官员在经济上是否清白与他们寿命的长短之间是否独立?[解析]列2×2列联表短寿长寿合计贪官348152500廉洁官93497590合计4416491090由公式得χ2=1090×348×497-152×932500×590×441×649=325.635∵325.635>6.635,所以我们有99%的把握可以认为在经济上不清白的人易过早死亡.综合应用为了比较注射A、B两种药物后产生的皮肤疱疹的面积,选200只家兔做实验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.(1)甲、乙是200只家兔中的2只,求甲、乙分在不同组的概率;(2)下表1和表2分别是注射药物A和B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表疱疹面积[60,65)[65,70)[70,75)[75,80)频数30402010表2:注射药物B后皮肤疱疹面积的频数分布表疱疹面积[60,65)[65,70)[70,75)[75,80)[80,85)频数1025203015①完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;②完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.表3:疱疹面积小于70mm2疱疹面积不小于70mm2合计注射药物Aa=b=注射药物Bc=d=合计n=附:χ2=nad-bc2a+bc+da+cb+dP(K2≥k)0.1000.0500.0250.0100.001k2.7063.8415.0246.63510.828[分析]本小题考查古典概型、组合数公式、频率分布直方图、独立性检验及2×2列联表等统计学知识.解题思路是(1)古典概型的概率公式的应用,需用到组合数公式.(2)绘制频率分布直方图,并从图中观察出中位数进行比较,(3)从频率分布表中读取数值填制2×2列联表并计算χ2与临界值比较,说明是否有关.[解析](1)甲、乙两只家兔分在不同组的概率为p=2C99198C100200=100199.(2)①可以看出注射药物A后的疱疹面积的中位数在65至70之间,而注射药物B后的疱疹面积的中位数在70至75之间,所以注射药物A后疱疹面积的中位数小于注射药物B后疱疹面积的中位数.②表3:疱疹面积小于70mm2疱疹面积不小于70mm2合计注射药物Aa=70b=30100注射药物Bc=35d=65100合计10595n=200χ2=200×70×65-35×302100×100×105×95≈24.56,由于χ210.828,所以有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.[反思总结]本题比较新颖,将统计学与古典概型、组合联系在一起,难度不大,但考查知识全面,而且还需要一定的识图表能力,是今年命题一热点方向.(2014·合肥一六八中高二期中)某学校对手工社、摄影社两个社团招新报名的情况进行调查,得到如下的列联表:手工社摄影社总计女生6男生42总计3060(1)请完成上表中所空缺的五个数字;(2)已知报名摄影社的6名女生中甲、乙、丙三人来自于同一个班级,其他再无任意两人同班情况.现从此6人中随机抽取2名女生参加某项活动,则被选到两人同班的概率是多少?(3)能否在犯错误的概率不超过0.05的前提下,认为学生对这两个社团的选择与“性别”有关系?注:K2=nad-bc2a+bc+da+cb+d.P(K2≥k0)0.250.150.100.050.025k01.3232.0722.7063.8415.024[解析](1)手工社摄影社总计女生12618男生182442总计303060(2)所求概率为P=C23C26=15.(3)χ2=nad-bc2a+bc+da+cb+d=60×12×24-6×18230×30×18×42=207≈2.8573.841,所以,不能在犯错误的概率不超过0.05的前提下,认为学生对这两个社团的选择与“性别”有关系.对于“有99%以上的把握认为吸烟与患肺癌是有关的”,以下理解正确的是________.(1)100个吸烟的人中有99个患有肺癌;(2)吸烟者有可能不患肺癌,不吸烟者可能患肺癌;(3)吸烟者一定患肺癌,不吸烟者一定不患肺癌;(4)“吸烟与患肺癌有关系”这一结论准确性在99%以上.[误解](1)(3)[正
本文标题:【成才之路】2015-2016学年高中数学-第3章-2独立性检验课件-北师大版选修2-3
链接地址:https://www.777doc.com/doc-7534655 .html