您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 12独立性检验的基本思想及其初步应用《云师大“1+1”专业数学辅导》
1.2独立性检验的基本思想及其初步应用(教师用书独具)●三维目标1.知识与技能了解独立性检验的基本思想、方法及初步应用.会从列联表(只要求2×2列联表)、柱形图、条形图直观分析两个分类变量是否有关.会用K2公式判断两个分类变量在某种可信程度上的相关性.2.过程与方法运用数形结合的方法,借助对典型案例的探究,来了解独立性检验的基本思想,总结独立性检验的基本步骤.3.情感、态度与价值观(1)通过本节课的学习,让学生感受数学与现实生活的联系,休会独立性检验的基本思想在解决日常生活问题中的作用.(2)培养学生运用所学知识,依据独立性检验的思想作出合理推断的实事求是的好习惯.●重点难点重点:理解独立性检验的基本思想及实施步骤.难点:了解独立性检验的基本思想、了解随机变量K2的含义.分别利用2×2列联表、等高条形图、K2公式分析两变量之间的关系,探究解题方法和规律,充分理解观测值k的意义,能熟练正确地对问题作出判断,达到化难为易的目的.(教师用书独具)●教学建议通过对典型案例“吸烟是否对患肺癌有影响?”的提出,联系生活,引起共鸣,激发学生的学习兴趣.从生活的实例出发,让学生充分体会数学与实际生活的联系,从而使得本节知识的形成更自然、更生动.要注重学生的主体参与,努力创设教师引导下的学生自主探究、合作交流的学习方式.建议在教学过程中,教师点拨、学生探讨,共同完成例题的解答.要注重数学的思想性,采用反证法做类比,帮助学生理解独立性检验的思想,通过课堂练习,检验学生能否熟练掌握用独立性检验思想解决实际问题的方法.●教学流程通过典型案例“吸烟是否与患肺癌有关系”的研究,介绍了独立性检验的基本思想、方法和初步应用.创设问题情境引出列联表、等高条形图和K2公式等基础知识.利用填一填的形式,使学生自主学习本节基础知识,并反馈了解,对理解有困难的概念加以讲解.引导学生在学习基础知识的基础上分析解决例题1的问题,并总结规律方法,完成变式训练.引导学生分析例题2,根据图中的数据计算出各类变量对应的频率,作出等宽且高度均为1的条形图.并通过图形作出判断,完成变式训练.完成当堂双基达标,巩固所学知识及应用方法,并进行反馈矫正.归纳整理,进行课堂小结,整体认识本节所学知识,强调重点内容和规律方法.要求学生借鉴例题3的解法完成变式训练.给出易错辨析题目及错解,让学生讨论错因,并给出正确解答.引导学生探究例题3的解法,(1)直接由表中数据代入公式,作出判断.(2)列出列联表,由公式计算观测值,作出判断.解后让学生总结规律方法.课标解读1.了解独立性检验的基本思想、方法及其简单应用.(重点)2.通过收集数据,并依据独立性检验的原理作出合理推断,培养学生良好的思维习惯.(难点)分类变量与列联表【问题导思】吸烟变量有几种类别?国籍变量呢?【提示】吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别,如中国、美国、法国…….1.分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.2.列联表(1)定义:列出的两个分类变量的频数表,称为列联表.(2)2×2列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d等高条形图【问题导思】表格和图形哪一个更能直观地反映出两个分类变量间是否相互影响?【提示】图形.(1)定义:将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高条形图.(2)特征:等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(3)用法:观察等高条形图发现aa+b和cc+d相差很大,就判断两个分类变量之间有关系.独立性检验(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)公式:K2=nad-bc2a+bc+da+cb+d,其中n=a+b+c+d为样本容量.用2×2列联表分析两变量间的关系在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用aa+b与cc+d判断二者是否有关系.【思路探究】对变量进行分类→求出分类变量的不同取值→作出2×2列联表→计算aa+b与cc+d的值作出判断【自主解答】2×2列联表如下:年龄在六十岁以上年龄在六十岁以下总计饮食以蔬菜为主432164饮食以肉类为主273360总计7054124将表中数据代入公式得aa+b=4364=0.671875.cc+d=2760=0.45.显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.1.作2×2列联表时,注意应该是4行4列,计算时要准确无误.2.作2×2列联表时,关键是对涉及的变量分清类别.题中条件不变,尝试用|ad-bc|的大小判断饮食习惯与年龄是否有关.【解】将本例2×2列联表中的数据代入可得|ad-bc|=|43×33-21×27|=852.相差较大,可在某种程度上认为饮食习惯与年龄有关系.用等高条形图分析两变量间的关系某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.【思路探究】作出2×2列联表―→根据列联表数据作等高条形图―→对比乘积的差距判断两个分类变量是否有关【自主解答】作列联表如下:性格内向性格外向总计考前心情紧张332213545考前心情不紧张94381475总计4265941020相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出,考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.1.利用列联表中数据计算出各类变量取值对应频率,作出等宽度且高度均为1的等高条形图.2.利用数形结合的思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法之一.一般地,在等高条形图中,aa+b与cc+d相差越大,两个分类变量有关系的可能性就越大.作等高条形图时可以用列联表来寻找相关数据,作图要精确,且易于观察,使对结论的判断不出现偏差.某生产线上,质量监督员甲在生产现场时,990件产品中有合格品982件,次品8件;不在生产现场时,510件产品中有合格品493件,次品17件.试利用图形判断监督员甲在不在生产现场对产品质量好坏有无影响.【解】根据题目所给数据得如下2×2列联表:合格品数次品数总计甲在生产现场9828990甲不在生产现场49317510总计1475251500相应的等高条形图如图所示.图中两个深色条的高分别表示甲在生产现场和甲不在生产现场样本中次品数的频率.从图中可以看出,甲不在生产现场样本中次品数的频率明显高于甲在生产现场样本中次品数的频率.因此可以认为质量监督员甲在不在生产现场与产品质量好坏有关系.独立性检验下表是某地区的一种传染病与饮用水的调查表:得病不得病总计干净水52466518不干净水94218312总计146684830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病的有5人,不得病的有50人,饮用不干净水得病的有9人,不得病的有22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.【思路探究】求出k2的值―→与临界值作比较―→作出判断.【自主解答】(1)假设H0:传染病与饮用水无关.把表中数据代入公式得:K2的观测值k=830×52×218-466×942146×684×518×312≈54.21.在H0成立的情况下,P(K210.828)≈0.001,是小概率事件,所以拒绝H0.因此我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关.(2)依题意得2×2列联表:得病不得病总计干净水55055不干净水92231总计147286此时,K2的观测值k=86×5×22-50×9214×72×55×31≈5.785.因为5.7855.024,P(K25.024)≈0.025,所以我们有97.5%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有97.5%的把握肯定.解决一般的独立性检验问题的步骤:(1)通过列联表确定a、b、c、d、n的值,根据实际问题需要的可信程度确定临界值k0;(2)利用K2=nad-bc2a+bc+da+cb+d求出K2的观测值k;(3)如果k≥k0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α;否则就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”.某社区医疗服务部门为了考察人的高血压病是否与食盐摄入量有关,对该社区的1633人进行了跟踪测查,得出以下数据:患高血压未患高血压合计喜欢较咸食物34220254喜欢清淡食物2613531379合计6015731633问能否判断在犯错误的概率不超过0.001的前提下,认为患高血压与食盐摄入量有关?【解】提出假设H0:该社区患有高血压病与食盐的摄入量无关.由公式计算K2的观测值为k=1633×34×1353-220×26260×1573×254×1379≈80.155.因为80.155>10.828,因此在犯错误的概率不超过0.001的前提下,我们认为该社区患有高血压病与食盐的摄入量有关.因未理解P(K2≥k0)的含义而致误某小学在对232名小学生调查中发现:180名男生中有98名有多动症,另外82名没有多动症,52名女生中有2名有多动症,另外50名没有多动症,用独立性检验方法判断多动症与性别是否有关系?【错解】由题目数据列出如下列联表:多动症无多动症总计男生9882180女生25052总计100132232k=232×98×50-2×822100×132×180×52≈42.11710.828.所以有0.1%的把握认为多动症与性别有关系.【错因分析】应该是有(1-P(K2≥10.828))×100%=(1-0.001)×100%的把握,而不是P(K2≥10.828)×100%=0.001×100%的把握.【防范措施】本题的错误之处在于不能正确理解独立性检验步骤的含义,当计算的K2的观测值k大于临界值k0时,就可推断在犯错误的概率不超过α的前提下说两分类变量有关系.这一点需牢记,才能避免类似错误.【正解】由题目数据列出如下列联表:多动症无多动症总计男生9882180女生25052总计100132232由表中数据可得到:k=232×98×50-2×822100×132×180×52≈42.11710.828.所以有99.9%的把握认为多动症与性别有关系.1.列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系.2.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算随机变量K2的值,如果K2值很大,说明假设不合理.K2越大,两个分类变量有关系的可能性越大.1.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是()A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这个人有99%的概率患有肺癌C.在100个吸烟者中一定有
本文标题:12独立性检验的基本思想及其初步应用《云师大“1+1”专业数学辅导》
链接地址:https://www.777doc.com/doc-3060006 .html