您好,欢迎访问三七文档
3.2独立性检验的基本思想及其初步应用1.了解分类变量、2×2列联表、随机变量K2的意义.2.通过对典型案例的分析,了解独立性检验的基本思想方法.(重点)3.通过对典型案例的分析,了解两个分类变量的独立性检验的应用.(难点)[基础·初探]教材整理1列联表和等高条形图阅读教材P91~P94,完成下列问题.1.分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表①定义:列出的两个分类变量的频数表称为列联表.②2×2列联表一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d2.等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(2)观察等高条形图发现aa+b和cc+d相差很大,就判断两个分类变量之间有关系.1.下面是2×2列联表:y1y2总计x1a2173x222527总计b46则表中a,b的值分别为________.【解析】∵a+21=73,∴a=52.又∵a+2=b,∴b=54.【答案】52542.下面的等高条形图可以说明的问题是________(填序号).图321①“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的;②“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同;③此等高条形图看不出两种手术有什么不同的地方;④“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把握.【答案】④3.下列说法正确的有________(填序号).①分类变量的取值仅表示个体所属的类别,它们的取值一定是离散的;②分类变量的取值也可以用数字来表示,但这时的数字除了分类以外没有其他的含义;③2×2列联表是两个分类变量的频数汇总统计表;④2×2列联表和等高条形图都能反映出两个分类变量间是否相互影响.【解析】由分类变量的定义可知①②正确;由2×2列联表的定义可知③正确;2×2列联表和等高条形图都能展示样本的频率特征,若在一个分类变量所取值的群体中,另一个分类变量所取值的频率相差较小,则说明这两个变量不相互影响,否则就相互影响.故④正确.【答案】①②③④教材整理2独立性检验阅读教材P93~P96,完成下列问题.1.定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.2.K2=nad-bc2a+bc+da+cb+d,其中n=a+b+c+d为样本容量.3.独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.(2)利用公式计算随机变量K2的观测值k.(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.1.若由一个2×2列联表中的数据计算得K2=4.013,那么有__________的把握认为两个变量之间有关系.【解析】查阅K2表知有95%的把握认为两个变量之间有关系.【答案】95%2.考察棉花种子经过处理与生病之间的关系,得到下表中的数据:种子处理种子未处理总计得病32101133不得病61213274总计93314407根据以上数据可得出种子是否经过处理与是否生病________(填“有关”或“无关”).【导学号:97270061】【解析】k=-293×314×133×274≈0.1640.455,即没有充足的理由认为种子是否经过处理跟生病有关.【答案】无关[质疑·手记]预习完成后,请将你的疑问记录,并与“小伙伴们”探讨交流:疑问1:解惑:疑问2:解惑:疑问3:解惑:[小组合作型]利用等高条形图判断两个分类变量是否相关(2016·青岛高二检测)某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.【精彩点拨】首先求出在考前心情紧张与考前心情不紧张群体中,性格内向的频率,再绘制等高条形图进行判定.【自主解答】作列联表如下:性格内向性格外向总计考前心情紧张332213545考前心情不紧张94381475总计4265941020在考前心情紧张的群体中,性格内向的约占61%,在考前心情不紧张的群体中,性格内向的约占20%.绘制相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例大,可以认为考前紧张与性格类别有关.利用等高条形图判断两个分类变量是否相关的步骤:统计:收集数据,统计结果列表:列出2×2列联表,计算频率、粗略估计绘图:绘制等高条形图,直观分析.[再练一题]1.网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常上网与学习成绩是否有关?【解】根据题目所给的数据得到如下2×2列联表:经常上网不经常上网总计不及格80120200及格120680800总计2008001000得出等高条形图如图所示:比较图中深色条的高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为经常上网与学习成绩有关.由K2进行独立性检验某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,则我们能否在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学优秀有关系?物理优秀化学优秀总分优秀数学优秀228225267数学非优秀14315699注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人.【精彩点拨】首先分别列出数学成绩与物理、化学、总分的2×2列联表,再正确计算K2的观测值,然后由K2的值作出判断.【自主解答】(1)根据已知数据列出数学与物理优秀的2×2列联表如下:物理优秀物理非优秀总计数学优秀228b360数学非优秀143d880总计371b+d1240∴b=360-228=132,d=880-143=737,b+d=132+737=869.代入公式可得K2的观测值为k1≈270.114.(2)按照上述方法列出数学与化学优秀的2×2列联表如下:化学优秀化学非优秀总计数学优秀225135360数学非优秀156724880总计3818591240代入公式可得K2的观测值k2≈240.611.综上,由于K2的观测值都大于10.828,因此说明都能在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学优秀有关系.1.利用K2进行独立性检验的步骤(1)列表:列出2×2列联表.(2)求值:求出K2的观测值k.(3)判断:与临界值比较,得出事件有关的可能性大小作出判断.2.独立性检验的必要性列联表中的数据是样本数据,它只是总体的代表,它具有随机性,所以只能利用列联表的数据和等高条形图粗略判断两个分类变量是否有关系.而K2给出了不同样本容量的数据的统一评判标准.利用它能精确判断两个分类变量是否有关系的可靠程度.[再练一题]2.在国家未实施西部开发战略前,一新闻单位在应届大学毕业生中随机抽取1000人问卷,只有80人志愿加入西部建设.而国家分步实施西部开发战略后,随机抽取1200名应届大学毕业生问卷,有400人志愿加入国家西部建设.问:能否在犯错误的概率不超过0.001的前提下,认为实施西部开发战略的公布对应届大学毕业生的选择产生了影响?【解】根据题意,列出2×2列联表:志愿者非志愿者总计开发战略公布前809201000开发战略公布后4008001200总计48017202200由公式计算K2统计量得:k=-2480×1720×1000×1200≈205.22.因为205.2210.828,因此在犯错误的概率不超过0.001的前提下认为实施西部开发战略的公布对应届大学毕业生的选择产生了影响.[探究共研型]独立性检验与统计的综合应用探究1从容量为400人的中年人与容量为100人的老年人中抽出50人去体检某项健康指标,若采取分层抽样方法,应从中抽取老年人为多少人?【提示】50400+100×100=10(人).探究2高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据:总成绩好总成绩不好总计数学成绩好478a490数学成绩不好39924423总计bc913你能求出a,b,c的值吗?该问题中有几个分类变量?它们的取值分别是什么?【提示】a=12,b=877,c=36.该问题中有“总成绩”和“数学成绩”两个分类变量;“总成绩”的取值有“总成绩好”与“总成绩不好”两个值,“数学成绩”的取值也有“好”与“不好”两个值.探究3在探究2中,你认为文科学生总成绩不好与数学成绩不好有关系吗?【提示】由探究2计算随机变量K2的观测值:k=-2490×423×877×36≈6.2335.024,∵P(k≥5.024)≈0.025,∴在犯错误的概率不超过0.025的前提下,认为文科学生总成绩不好与数学成绩不好有关系.(2016·黄冈高二检测)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品,从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)频数126386182分组[30.02,30.06)[30.06,30.10)[30.10,30.14)频数92614乙厂:分组[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)频数297185159分组[30.02,30.06)[30.06,30.10)[30.10,30.14)频数766218(1)试分别估计两个分厂生产零件为优质品的概率;(2)由以上统计数据填下面2×2列联表,并问能否有99%的把握认为“两个分厂生产的零件的质量有差异”.甲厂乙厂总计优质品非优质品总计【精彩点拨】解答本题先由各组及频数求出优质品的概率,然后完成列联表,最后判断两个变量是否相互独立.【自主解答】(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500×100%=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500×100%=64%.(2)甲厂乙厂总计优质品360320680非优质品140180320总计5005001000由表中数据得k=-2680×320×500×500≈7.35>6.635,因此,有99%的把握认为“两个分厂生产的零件的质量有差异”.解决独立性检验与统计综合应用的步骤1.认真审题、弄清所求问题中的两个分类变量是什么,它们的取值分别是什么.2.充分利用统计知识,完成2×2列联表.3.利用独立性检验判断两分类变量间的关系.[再练一题]3.某学生对其亲属30人的饮食进行了一次调查,并用如图322所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)图322(1)根据以上数据完成下列2×2列联表:主食蔬菜主食肉类总计50岁以下50岁以上总计(2)能否在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关?并写出简要分析.【解】(1)2×2列联表如下:主食蔬菜主食肉类总计50岁
本文标题:2016-2017学年高中数学3.2独立性检验的基本思想及其初步应用学案新人教A版
链接地址:https://www.777doc.com/doc-5555343 .html