您好,欢迎访问三七文档
当前位置:首页 > 中学教育 > 高中教育 > 高中数学人教版选修12同课异构教学课件12独立性检验的基本思想及其初步应用精讲优练课型
1.2独立性检验的基本思想及其初步应用【自主预习】1.分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的_________,像这样的变量称为分类变量.不同类别(2)列联表①定义:列出的两个分类变量的_______称为列联表.②2×2列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为频数表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d2.等高条形图(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否_________,常用等高条形图展示列联表数据的_________.(2)如果直接观察等高条形图发现______和______相差很大,就判断两个分类变量之间有关系.相互影响频率特征aabccd3.独立性检验定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验公式22n(adbc)Kn__________abcdacbd,其中()()()()a+b+c+d具体步骤①确定α,根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定________.②计算K2,利用公式计算随机变量K2的________.③下结论,如果_____,就推断“X与Y有关系”,这种推断_____________不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中__________________支持结论“X与Y有关系”临界值k0观测值kk≥k0犯错误的概率没有发现足够证据【即时小测】1.下列变量中不属于分类变量的是()A.性别B.吸烟C.宗教信仰D.职业【解析】选B.“吸烟”不是分类变量.“是否吸烟”才是分类变量.2.下面是2×2列联表.y1y2总计x1332154x2a1346总计b34则表中a,b处的值应为()A.33,66B.25,50C.32,67D.43,56【解析】选A.由2×2列联表知a+13=46,所以a=33,又b=a+33,所以b=33+33=66.3.如果在犯错误的概率不超过0.05的前提下认为事件A和B有关,那么具体算出的数据满足()A.K23.841B.K23.841C.K26.635D.K26.635【解析】选A.根据独立性检验的临界值及其与K2大小关系的意义可知,在犯错误的概率不超过0.05的前提下认为事件A和B有关时,统计量K23.841.【知识探究】探究点12×2列联表1.2×2列联表中研究的变量是什么变量?提示:分类变量.2.2×2列联表中{x1,x2},{y1,y2}的意义是什么?提示:{x1,x2},{y1,y2}表示分类变量x,y的取值.【归纳总结】1.对“分类变量”的三点说明(1)这里的“变量”和“值”都应作为“广义”的变量和值进行理解.例如,对于性别变量,其取值为男和女两种.这里的变量指的是性别,同样这里的“值”指的是“男”和“女”.因此,这里所说的“变量”和“值”不一定取的是具体的数值.(2)分类变量是大量存在的.例如,是否吸烟变量有吸烟与不吸烟两种类别,而国籍变量则有多种类别.(3)注意区分分类变量与定量变量的不同.如身高、体重、考试成绩等就是定量变量,它们的取值一定是实数,并且取值大小有特定的含义.2.2×2列联表(1)2×2列联表用于研究两类变量之间是否相互独立,它适用于分析两类变量之间的关系,是对两类变量进行独立性检验的基础.(2)表中|ad-bc|越小,两个变量之间的关系越弱;|ad-bc|越大,两个变量之间的关系越强.特别提醒:判断两个分类变量相关关系强弱也可通过比较与之间的差的大小来判断,差越大,相关关系越强.aabccd探究点2K2统计量1.K2≥6.635是指在犯错误的概率不超过多少的前提下认为两个分类变量有关系?提示:0.010.2.当K2≥3.841时,认为“X与Y有关系”而犯错误的概率有多大?提示:不超过0.05.【归纳总结】独立性检验的关注点(1)使用K2统计量作独立性检验时,2×2列联表中的数据a,b,c,d都要大于5.(2)独立性检验类似于数学中的反证法,要确认“两个变量有关系”这一结论成立的可信度,首先假设结论不成立,在假设下,我们构造的统计量K2应该很小.如果由观测数据计算得到的K2值很大,则在一定程度上说明假设不合理,再根据不合理的程度与临界值的关系作出判断.类型一等高条形图与2×2列联表【典例】1.下列关于等高条形图的叙述正确的是()A.从等高条形图中可以精确地判断两个分类变量是否有关系B.从等高条形图中可以看出两个变量频数的相对大小C.从等高条形图中可以粗略地看出两个分类变量是否有关系D.以上说法都不对2.在2×2列联表中,两个比值________相差越大,两个分类变量之间的关系越强.()acacABabcdcdabacacCDadbcbdac.与.与.与.与3.为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?【解题探究】1.典例1中利用等高条形图可以比较两个变量的什么大小关系?提示:利用等高条形图可以比较两个变量频率的大小关系.2.典例2中,研究两个分类变量的关系,应着重研究哪些量?提示:应着重研究与或者与.3.典例3中要画出等高条形图应先计算哪些量?提示:铅中毒病人和对照组样本中尿棕色素为阳性的频率.aabccdbabdcd【解析】1.选C.在等高条形图中仅能粗略判断两个分类变量的关系,故A错.在等高条形图中仅能找出频率,无法找出频数,故B错.2.选A.与相差越大,说明ad与bc相差越大,两个分类变量之间的关系越强.aabccd3.等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.【方法技巧】1.判断两个分类变量是否有关系的方法(1)利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法.(2)在等高条形图中,与相差越大,两个分类变量有关系的可能性就越大.aabccd2.利用等高条形图判断两个分类变量是否相关的步骤【变式训练】从发生交通事故的司机中抽取2000名司机作随机样本,根据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下:有责任无责任总计有酒精650150800无酒精7005001200总计13506502000试分析血液中含有酒精与对事故负有责任是否有关系.【解析】作等高条形图如下,图中阴影部分表示有酒精负责任与无酒精负责任的比例,从图中可以看出,两者差距较大,由此我们可以在某种程度上认为“血液中含有酒精与对事故负有责任”有关系.类型二K2独立性检验【典例】为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.能否在犯错误的概率不超过0.1的前提下,认为“学生选报文、理科与对外语的兴趣有关”?【解题探究】本例中“犯错误的概率不超过0.1”对应的K2值应满足什么?提示:“犯错误的概率不超过0.1”对应的K2值应满足K2≥2.706.【解析】根据题目所给的数据得到如下列联表:理科文科总计有兴趣13873211无兴趣9852150总计236125361根据列联表中数据由公式计算得k=≈1.871×10-4.因为1.871×10-42.706,所以,在犯错误的概率不超过0.1的前提下,不能认为“学生选报文、理科与对外语的兴趣有关”.2361(138527398)211150236125-【延伸探究】1.把本例条件“理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.”换成“理科对外语有兴趣的有100人,无兴趣的有136人,文科对外语有兴趣的有93人,无兴趣的有32人.”其他条件不变,再求解该问题.【解析】根据题目所给的数据得到如下列联表:理科文科总计有兴趣10093193无兴趣13632168总计236125361根据列联表中数据由公式计算得k=≈33.690.因为33.6902.706,所以,在犯错误的概率不超过0.1的前提下,可以认为“学生选报文、理科与对外语的兴趣有关”.2361(1003213693)193168236125-2.在上述探究中能否在犯错误的概率不超过0.001的前提下,认为“学生选报文、理科与对外语的兴趣有关”?【解析】由上述探究可知k=33.69010.828,故在犯错误的概率不超过0.001的前提下,可以认为“学生选报文、理科与对外语的兴趣有关”.【方法技巧】反证法与独立性检验的关系反证法独立性检验要证明结论A要确认“两个分类变量有关系”在A不成立的前提下进行推理假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下计算K2推出矛盾意味着结论A成立由观测数据计算得到的K2的观测值k很大,则在一定可信程度上说明假设不合理反证法独立性检验没有找到矛盾,不能对A下任何结论,即反证法不成立根据随机变量K2的含义,可以通过概率P(K2≥k0)的大小来评价该假设不合理的程度有多大,从而得出“两个分类变量有关系”这一结论成立的可信程度有多大易错警示:当K2的观测值k≥k0时,是指“在犯错误的概率不超过α的前提下推出“X与Y有关系”,而不是“X与Y有关系的概率为α”.【补偿训练】某学校对学生的课外活动进行调查,结果如表:体育文娱总计男生212344女生62935总计275279试用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为学生喜欢课外活动的类型与性别有关?【解析】由表中数据可知K2的观测值因为P(K2≥7.879)≈0.005且8.1067.879.所以在犯错误的概率不超过0.005的前提下,可以认为学生喜欢课外活动的类型与性别有关系.22nadbckabcdacbd79(2129236)8.106.44352752自我纠错判断两个分类变量的相关程度【典例】在某项研究吸烟与患肺癌的关系的调查中,共调查了10000人,经计算得K2的观测值k=62.98,根据这一数据分析,在犯错误的概率超过_______的前提下认为“吸烟与患肺癌没有关系”.(P(K2≥10.828)≈0.001).【失误案例】分析解题过程,找出错误之处,并写出正确答案.提示:错误的根本原因是审题错误,由题意可知,我们认为“吸烟与患肺癌有关系”,这种判断出错的可能性是0.001.因此,我们认为“吸烟与患肺癌没有关系”,这种判断出错的可能性是0.999.正确解答过程如下:【解析】由P(K2≥10.828)≈0.001知在犯错误的概率不超过0.001的前提下认为“吸烟与患肺癌有关系”.因此在犯错误的概率超过0.999的前提下认为“吸烟与患肺癌没有关系”.答案:0.999
本文标题:高中数学人教版选修12同课异构教学课件12独立性检验的基本思想及其初步应用精讲优练课型
链接地址:https://www.777doc.com/doc-5887625 .html