您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 人教A版数学选修23全册课件第三章32独立性检验的基本思想及其初步应用
第三章3.2独立性检验的基本思想及其初步应用2突破常考题型题型一1理解教材新知题型二3跨越高分障碍4应用落实体验随堂即时演练课时达标检测知识点一知识点二3.2独立性检验的基本思想及其初步应用[提出问题]某校高三模拟考试调查中,性格内向的426人中有332人考前紧张,性格外向的594人中有213人考前紧张.问题1:考前紧张与性格类别有关系吗?独立性检验的有关概念提示:有.问题2:通过怎样比较看出有?提示:通过考前紧张的人数占性格类型的比例.[导入新知]1.分类变量变量的不同“值”表示的不同类别,像这样的变量称为分类变量.2.2×2列联表假设有两个分类变量X和Y,它们的取值分别为和,其样本频数列联表(也称为2×2列联表)为:个体所属{x1,x2}{y1,y2}y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d3.K2统计量为了使不同样本容量的数据有统一的评判标准,我们构造一个随机变量K2=,其中n=为样本容量.4.独立性检验利用随机变量K2来确定是否能以给定把握认为“”的方法,称为两个分类变量独立性检验.nad-bc2a+bc+da+cb+da+b+c+d两个分类变量有关系[化解疑难]1.2×2列联表的特征2.在列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0.因此|ad-bc|越小,说明两个分类变量之间的关系越弱;|ad-bc|越大,说明两个分类变量之间的关系越强.独立性检验的思想吸烟与患肺癌“列联表”中,事件A表示不吸烟,B表示不患肺癌.问题1:事件A,B发生的频率可求吗?提示:可以.问题2:通常情况下,为研究问题方便,常用什么近似于概率?提示:频率.问题3:事件A,B无关有怎样的概率公式?提示:P(AB)=P(A)P(B).[导入新知]独立性检验的思想:要确定“两个分类变量有关系”这一结论成立的可信程度,首先,即假设结论“两个分类变量没有关系”成立.在该假设下我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2观测值k很大,那么在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过可信度表评价该假设不合理的程度,即“两个分类变量有关系”的可信程度.假设结论不成立[化解疑难]1.P(K2≥6.635)≈0.01表明H0成立的概率很小,是小概率事件,可以判断H0不成立,也就是“两个分类变量之间没有关系”错误地判断为“两个分类变量之间有关系”的概率不超过0.01,也可以理解为“有99%的把握认为两个分类变量之间有关系”.2.利用独立性检验解决问题的基本步骤:(1)根据相关数据作列联表;(2)求K2的观测值;(3)与临界值作比较,得出结论.列联表和等高条形图的应用[例1]某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.[解]作列联表如下:性格内向性格外向总计考前心情紧张332213545考前心情不紧张94381475总计4265941020相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.[类题通法]进行独立性检验的前提是根据题中数据获得2×2列联表,常用等高条形图展示列联表数据的频率特征,即将aa+b与cc+d(或ba+b与dc+d)的值相比,由此能直观地反映出两个分类变量间是否相互影响,但是此方法较粗劣.[活学活用]为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:父母吸烟父母不吸烟总计子女吸烟23783320子女不吸烟6785221200总计9156051520利用等高条形图判断父母吸烟对子女吸烟是否有影响?解:等高条形图如下:由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.[例2]研究人员选取170名青年男女大学生为样本,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,否定的有38名;男生110名在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?用独立性检验的方法判断.附:P(K2≥k0)0.100.050.025k02.7063.8415.024考查独立性检验的原理[解]根据题目所给数据建立如下2×2列联表:肯定否定总计男生2288110女生223860总计44126170根据2×2列联表中的数据得到:k=170×22×38-22×882110×60×44×126≈5.622>3.841.所以在犯错误的概率不超过0.05的前提下,认为“性别与态度有关系”.[类题通法]根据题意列出2×2列联表,计算K2的观测值,如果K2的观测值很大,说明两个分类变量有关系的可能性很大;如果K2的观测值比较小,则认为没有充分的证据显示两个分类变量有关系.这需要给出正确的计算,避免计算失误.[活学活用]在一次天气恶劣的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判定:在天气恶劣的飞机航程中,男乘客是否比女乘客更容易晕机?附:P(K2≥k0)0.100.05k02.7063.848解:根据题意,列出2×2列联表如下:晕机不晕机总计男乘客243155女乘客82634总计325789假设在天气恶劣的飞机航程中男乘客不比女乘客更容易晕机.由公式可得K2的观测值k=nad-bc2a+bc+da+cb+d=8924×26-31×8255×34×32×57≈3.6892.706,故在犯错误的概率不超过0.10的前提下,认为“在天气恶劣的飞机航程中男乘客比女乘客更容易晕机”.4.独立性检验与统计的综合应用[典例](12分)某工厂有工人1000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样的方法(按A类、B类分两层)从该工厂的工人中抽取100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数),结果如下表.表1:A类工人生产能力的频数分布表生产能力分组[110,120)[120,130)[130,140)[140,150)人数8x32表2:B类工人生产能力的频数分布表生产能力分组[110,120)[120,130)[130,140)[140,150)人数6y2718(1)确定x,y的值;(2)完成下面2×2列联表,并回答能否在犯错误的概率不超过0.001的前提下认为工人的生产能力与工人的类别有关系?生产能力分组工人类别[110,130)[130,150)总计A类工人B类工人总计附:K2=nad-bc2a+bc+da+cb+d,P(K2≥k0)0.0500.0100.001k03.8416.63510.828[解题流程][规范解答](1)∵从该工厂的工人中抽取100名工人,且该工厂中有250名A类工人,750名B类工人,∴要从A类工人中抽取25名,从B类工人中抽取75名,(2分)∴x=25-8-3-2=12,y=75-6-27-18=24.(4分)[名师批注]要确定x,y的值,应先确定A类工人及B类工人中应各抽取多少人,此处易误认为x=25,y=75,从而导致解题错误.(2)根据所给的数据可以完成列联表,如下表所示:生产能力分组工人类别[110,130)[130,150)总计A类工人20525B类工人304575总计5050100(6分)由列联表中的数据,得K2的观测值为k=100×20×45-5×30225×75×50×50=12>10.828.(10分)因此,在犯错误的概率不超过0.001的前提下认为工人的生产能力与工人的类别有关系.(12分)此处易犯错误有两点:①计算失误;②将公式中的数据搞错.[活学活用](东北三校联考)某学生对其亲属30人的饮食进行了一次调查,并用下图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)(1)根据以上数据完成下列2×2列联表:主食蔬菜主食肉类总计50岁以下50岁以上总计(2)能否在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关?并写出简要分析.解:(1)2×2列联表如下:主食蔬菜主食肉类总计50岁以下481250岁以上16218总计201030(2)因为K2=30×8-128212×18×20×10=106.635,P(K26.635)=0.01所以可以在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关.[随堂即时演练]1.观察下列各图,其中两个分类变量x,y之间关系最强的是()解析:在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.答案:D2.下面是一个2×2列联表:y1y2总计x1a2173x222527总计b46则表中a、b处的值分别为()A.94,96B.52,50C.52,54D.54,52解析:由a+21=73,a+2=b,得a=52,b=54.答案:C3.独立性检验所采用的思路是:要研究A,B两类型变量彼此相关,首先假设这两类变量彼此________,在此假设下构造随机变量K2,如果K2的观测值较大,那么在一定程度上说明假设________.答案:无关不成立4.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K2的观测值k6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.解析:K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.答案:③5.为了解决高二年级统计案例入门难的问题,某校在高一年级的数学教学中设有试验班,着重加强统计思想的渗透,下面是高二年级统计案例的测验成绩统计表(单位:分)的一部分,试分析实验效果.70及70分以下70分以上总计对照班321850试验班123850总计4456100附:P(K2≥k0)0.0250.0100.005k05.0246.6357.879解:根据列联表中的数据,由公式得K2的观测值k=nad-bc2a+bc+da+cb+d=10032×38-18×12250×50×44×56≈16.234.因为16.234>6.635,所以,在犯错误的概率不超过0.01的前提下认为高二年级统计案例的测试成绩与高一年级数学教学中增加统计思想的渗透有联系.[课时达标检测]
本文标题:人教A版数学选修23全册课件第三章32独立性检验的基本思想及其初步应用
链接地址:https://www.777doc.com/doc-5877876 .html