您好,欢迎访问三七文档
第3章统计案例3.1独立性检验学习目标核心素养1.了解独立性检验的概念,会判断独立性检验事件.2.能列出2×2列联表,会求χ2(卡方统计量的值).3.能够利用临界值,作出正确的判断.(重点)4.应用独立性检验分析实际问题.(难点)1.通过对2×2列联表的学习,培养数据处理素养.2.通过对独立性检验的学习,提升数学抽象、逻辑推理素养.自主预习探新知1.2×2列联表的意义一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B(如吸烟与不吸烟);Ⅱ也有两类取值,即类1和类2(如患呼吸道疾病和未患呼吸道疾病).我们得到如下表所示的抽样数据:Ⅱ类1类2合计类Aaba+bⅠ类Bcdc+d合计a+cb+da+b+c+d形如上表的表格称为2×2列联表,____________经常用来判断Ⅰ和Ⅱ之间是否有关系.2×2列联表2.独立性检验(1)独立性检验2×2列联表中的数据是样本数据,它只是总体的代表,具有随机性,结果并不唯一.因此,由某个样本得到的推断有可能正确,也有可能错误.为了使不同样本量的数据有统一的评判标准,统计学中引入下面的量(称为卡方统计量):χ2=_________________________(*),其中n=___________为样本容量.用__统计量研究这类问题的方法称为独立性检验(testofindependence).(2)独立性检验的基本步骤要推断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:①提出假设H0:Ⅰ与Ⅱ没有关系;②根据2×2列联表与公式(*)计算χ2的值;nad-bc2a+bc+da+cb+da+b+c+dχ2③查对临界值(如下表),作出判断.P(χ2≥x0)0.500.400.250.150.10x00.4550.7081.3232.0722.706P(χ2≥x0)0.050.0250.0100.0050.001x03.8415.0246.6357.87910.828思考1:若有99%以上的把握认为吸烟与患肺癌有关,则对一个吸烟的人,他患肺癌的概率就是99%,对吗?[提示]错误.有多大的把握只是说两个变量有关联,并不是事件发生的概率.思考2:独立性检验的必要性为什么不能只凭列联表的数据和图形下结论?[提示]列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用列联表检验的方法确认所得结论在多大程度上适用于总体.B[受样本选取的影响,独立性检验得到的结论不一定正确.]1.以下关于独立性检验的说法错误的是()A.独立性检验依赖小概率原理B.独立性检验得到的结论一定正确C.样本不同,独立性检验的结论可能有差异D.独立性检验不是判定两事物是否相关的唯一方法52,60[∵a+21=73,∴a=52.又b=a+8=52+8=60.]2.下面是一个2×2列联表:y1y2合计x1a2173x282533合计b46则表中a,b处的值分别为________.大[由χ2的表达式知|ad-bc|越大,(ad-bc)2就越大,χ2就越大.]3.式子|ad-bc|越大,χ2的值就越________.(填“大”或“小”)4.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:专业性别非统计专业统计专业男1310女7205%[因为χ23.841时有95%的把握认为确定主修专业与性别有关,出错的可能为5%.而已知χ2≈4.8443.841.所以上述结论成立.]为了判断主修统计专业是否与性别有关系,根据表中数据得到,χ2=50×13×20-10×7220×30×23×27≈4.844,因为χ23.841,所以确定主修统计专业与性别有关系,那么这种判断出错的可能性为________.合作探究提素养绘制2×2列联表【例1】在一项有关医疗保健的社会调查中,调查的男性为530人,女性为670人,发现其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.[解]作2×2列联表如下:喜欢甜食不喜欢甜食合计男117413530女492178670合计60959112001.分清类别是作列联表的关键.2.表中排成两行两列的数据是调查得来的结果.3.选取数据时,要求表中的四个数据a,b,c,d都要不小于5,以保证检验结果的可信度.1.某电视公司为了研究体育迷是否与性别有关,在调查的100人中,体育迷75人,其中女生30人,非体育迷25人,其中男生15人,请作出性别与体育迷的列联表.[解]体育迷非体育迷合计男451560女301040合计7525100利用χ2值进行独立性检验【例2】某矿石粉厂当生产一种矿石粉时,在数天内即有部分工人患职业性皮肤炎,在生产季节开始,随机抽取75名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤炎患病人数如下:阳性例数阴性例数合计新防护服57075旧防护服101828合计1588103问这种新防护服对预防工人患职业性皮肤炎是否有效?并说明你的理由.[思路探究]通过有关数据的计算,作出相应的判断.[解]提出假设H0:新防护服对预防皮肤炎没有明显效果.根据列联表中的数据可求得χ2=103×5×18-70×10275×28×15×88≈13.826.因为H0成立时,χ2≥10.828的概率约为0.001,而这里χ2≈13.82610.828,所以我们有99.9%的把握说新防护服比旧防护服对预防工人患职业性皮肤炎有效.根据2×2列联表,利用公式nad-bc2a+bc+da+cb+d计算χ2的值,再与临界值比较,作出判断.2.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中,有175人秃顶.根据以上数据判断男性病人的秃顶与患心脏病是否有关系?[解]提出假设H0:男性病人的秃顶与患心脏病没有关系.根据题中所给数据得到如下2×2列联表:患心脏病未患心脏病合计秃顶214175389不秃顶4515971048合计6657721437根据列联表中的数据可以求得χ2=1437×214×597-175×4512389×1048×665×772≈16.373.因为当H0成立时,χ2≥10.828的概率约为0.001,而这里χ2≈16.37310.828,所以有99.9%的把握认为,男性病人的秃顶与患心脏病有关系.独立性检验的综合应用[探究问题]1.利用χ2进行独立性检验,估计值的准确度与样本容量有关吗?[提示]利用χ2进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n越大,这个估计值越准确,如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性.2.在χ2运算后,得到χ2的值为29.78,在判断变量相关时,P(χ2≥6.635)≈0.01和P(χ2≥7.879)≈0.005,哪种说法是正确的?[提示]两种说法均正确.P(χ2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两个变量相关;而P(χ2≥7.879)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两个变量相关.【例3】为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试分别用列联表、独立性检验的方法分析监督员甲对产品质量好坏有无影响.能否在犯错误的概率不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关?[思路探究]解答本题可先列出2×2列联表,然后具体分析.[解](1)2×2列联表如下:合格品数次品数合计甲在生产现场9828990甲不在生产现场49317510合计1475251500由列联表可得|ad-bc|=|982×17-493×8|=12750,相差较大,可在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”.(2)由2×2列联表中数据,计算得到χ2的观测值为χ2=1500×982×17-493×82990×510×1475×25≈13.09710.828,因此在犯错误的概率不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关.判断两个变量是否有关的三种方法3.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:出生时间在晚上的男婴为24人,女婴为8人;出生时间在白天的男婴为31人,女婴为26人.(1)将下面的2×2列联表补充完整;晚上白天合计男婴女婴合计(2)能否在犯错误的概率不超过0.1的前提下认为婴儿性别与出生时间有关系?[解](1)晚上白天合计男婴243155女婴82634合计325789(2)由所给数据计算χ2的观测值χ2=89×24×26-31×8255×34×32×57≈3.6892.706.根据临界值表知P(χ2≥2.706)≈0.10.因此在犯错误的概率不超过0.10的前提下认为婴儿的性别与出生时间有关系.1.本节课的重点是用2×2列联表、两个分类变量间的关系以及独立性检验.2.解决一般的独立性检验问题的步骤:(1)通过列联表确定a,b,c,d,n的值,根据实际问题需要的可信程度确定临界值k0;(2)利用χ2=nad-bc2a+bc+da+cb+d求出χ2的观测值;(3)如果χ2≥k0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”.其中第(2)步易算错χ2的值,是本节课的易错点.当堂达标固双基1.判断(正确的打“√”,错误的打“×”)(1)分类变量中的变量与函数中的变量是同一概念.()(2)独立性检验的方法就是反证法.()(3)独立性检验中可通过统计表从数据上说明两分类变量的相关性的大小.()[答案](1)×(2)×(3)√2.考察棉花种子经过处理与生病之间的关系,得到下表中的数据:种子处理种子未处理合计得病32101133不得病61213274合计93314407B[χ2=407×32×213-61×101293×314×133×274≈0.1640.455,即没有充足的理由认为种子是否经过处理跟生病有关.]根据以上数据可得出()A.种子是否经过处理与是否生病有关B.种子是否经过处理与是否生病无关C.种子是否经过处理决定是否生病D.有90%的把握认为种子经过处理与生病有关3.下列说法正确的是________.(填序号)①对事件A与B的检验无关,即两个事件互不影响;②事件A与B关系越密切,χ2就越大;③χ2的大小是判断事件A与B是否相关的唯一数据;④若判定两事件A与B有关,则A发生B一定发生.②[对于①,事件A与B的检验无关,只是说两事件的相关性较小,并不一定两事件互不影响,故①错.②是正确的.对于③,判断A与B是否相关的方式很多,可以用列联表,也可以借助于概率运算,故③错.对于④,两事件A与B有关,说明两者同时发生的可能性相对来说较大,但并不是A发生B一定发生,故④错.]4.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.[解]将2×2列联表中的数据代入公式计算,得χ2=nad-bc2a+bc+da+cb+d=100×60×10-20×10280×20×70×30=10021≈4.762.因为4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
本文标题:2019-2020学年高中数学 第3章 统计案例 3.1 立性检验课件 苏教版选修2-3
链接地址:https://www.777doc.com/doc-8289781 .html