您好,欢迎访问三七文档
-1-2.4独立性检验的应用目标导航1.通过对典型案例的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用.2.通过对典型案例的探究,了解实际推断原理,了解随机变量χ2的含义.知识梳理独立性检验的应用我们可以用独立性检验来考察两个变量是否有关联,并且能够较准确地给出这种判断的可靠程度.具体步骤是:(1)根据样本数据制作2×2列联表;(2)根据χ2统计量的计算公式,求出χ2的值;(3)将χ2的值与临界值进行比较;(4)作出统计推断.知识梳理【做一做1】为了评价某个电视栏目的改革效果,在改革前后分别从居民中抽取了100位居民进行调查,经过计算χ2≈0.99,根据这一数据分析,下列说法正确的是()A.有99%的人认为该栏目优秀B.有99%的人认为该栏目是否优秀与改革有关系C.有99%的把握认为电视栏目是否优秀与改革有关系D.没有充分的理由认为电视栏目是否优秀与改革有关系解析:只有χ26.635才能有99%的把握认为电视栏目是否优秀与改革有关系,而即使χ26.635也只是对“电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论,不是说明是否有99%的人认为有无关系,故选D.答案:D知识梳理【做一做2】高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.为验证“文科就怕数学不好”的正确性,某人对高三文科学生的成绩进行了调查,得到如下列联表(单位:人):总成绩数学成绩好不好总计好47812490不好39924423总计87736913则大约有的把握认为文科学生总成绩不好与数学成绩不好有关系.解析:χ2=913×(478×24-12×399)2490×423×877×36≈6.2333.841.故大约有95%的把握认为文科学生总成绩不好与数学成绩不好有关系.答案:95%典例透析题型一题型二题型三独立性检验判断两个变量相关的可靠程度【例1】为研究大气污染与人患呼吸系统疾病是否有关,对重污染地区和轻污染地区作跟踪调查,得到如下表格(单位:人):患病情况受污染情况患呼吸系统疾病未患呼吸系统疾病总计重污染地区10313971500轻污染地区1314871500总计11628843000请根据统计资料,作出合适的判断分析.分析:根据独立性检验的步骤求随机变量χ2的观测值,与临界值比较,作出判断.典例透析题型一题型二题型三因为72.6366.635,所以有99%以上的把握认为大气污染与人患呼吸系统疾病有关.反思解答此类题目的关键在于正确利用计算χ2的值,再用它与临界值的大小作比较来判断,从而使问题得到解决.χ2=𝑛(𝑎𝑑-𝑏𝑐)2(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑),解:χ2=3000×(103×1487-1397×13)2116×2884×1500×1500≈72.636.典例透析题型一题型二题型三【变式训练1】对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示(单位:人):发作心脏病手术情况又发作过心脏病未发作过心脏病总计心脏搭桥手术39157196血管清障手术29167196总计68324392试根据上述数据比较这两种手术对病人又发作过心脏病的影响有没有差别.典例透析题型一题型二题型三解:根据列联表中的数据,得到因为1.782.706,所以我们可以认为病人是否又发作过心脏病与其做过何种手术无关,即可以认为两种手术对病人又发作过心脏病的影响没有差别.χ2=392×(39×167-157×29)2196×196×68×324≈1.78.典例透析题型一题型二题型三独立性检验的综合应用【例2】电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:典例透析题型一题型二题型三将日均收看该体育节目时间不低于40min的观众称为“体育迷”,已知“体育迷”中有10名女性.根据已知条件完成下面的2×2列联表(单位:人),据此资料你是否认为“体育迷”与性别有关?是否体育迷性别不是体育迷是体育迷总计男女总计典例透析题型一题型二题型三解:由题中所给的频率分布直方图知,“体育迷”人数为100×(10×0.020+10×0.005)=25,“非体育迷”人数为75,则根据题意完成的2×2列联表如下(单位:人):是否体育迷性别不是体育迷是体育迷总计男301545女451055总计7525100典例透析题型一题型二题型三将2×2列联表的数据代入公式计算:χ2=100×(30×10-45×15)245×55×75×25≈3.030.因为3.0302.706,所以有90%以上的把握认为“体育迷”与性别有关.反思对于两个分类变量的相关性检验,最可靠的方法就是独立性检验,是否相关与所选样本又有必然的联系,本题与统计综合考查,既联系实际又侧重知识间的联系.典例透析题型一题型二题型三性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人所占的比例.(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?分析:对于(1),可依据古典概型的概率公式及抽样方法分析求解.对于(2),题中给出了2×2列联表,从而可通过求χ2的值进行判定.【变式训练2】为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样的方法从该地区调查了500位老年人,结果如下(单位:位):典例透析题型一题型二题型三解:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此估计该地区老年人中,需要帮助的老年人所占的比例为70500=14%.(2)χ2=500×(40×270-30×160)270×430×200×300≈9.967.因为9.9676.635,所以有99%以上的把握认为该地区的老年人是否需要帮助与性别有关.典例透析题型一题型二题型三易错点因找不准公式中的量致误【例3】调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表(单位:人),你有多大把握认为婴儿的性别与出生的时间有关系?出生时间性别晚上白天总计男婴243155女婴82634总计325789典例透析题型一题型二题型三错解由公式计算得:χ2=89×(24×31-8×26)255×34×32×57≈7.49646.635,所以有99%以上的把握认为婴儿的性别与出生的时间有关系.错因分析由于将2×2列联表中a,b,c,d的位置记错,导致计算结果的错误.正解:由公式计算得:χ2=89×(24×26-31×8)255×34×32×57≈3.68892.706,所以有90%以上的把握认为婴儿的性别与出生的时间有关系.典例透析题型一题型二题型三【变式训练3】为研究学生的数学成绩与学习数学的兴趣浓厚是否有关,对某年级学生进行调查,得到如下数据(单位:人):成绩兴趣是否浓厚成绩优秀成绩较差总计兴趣浓厚643094兴趣不浓厚227395总计86103189根据列联表的独立性检验,能有多大把握认为学生的数学成绩好坏与学习数学的兴趣是否浓厚有关?解:χ2=189×(64×73-22×30)286×103×94×95≈38.459.∵38.4596.635,∴有99%以上的把握认为学生学习数学的兴趣浓厚与否与数学成绩好坏是有关的.12341.利用独立性检验对两个分类变量是否有关系进行研究时,若有99%的把握认为事件A和B有关系,则具体计算出的数据应该是()A.χ26.635B.χ26.635C.χ23.841D.χ23.841答案:A12342.某班主任对全班50名学生进行了是否喜欢玩电脑游戏及认为作业量多少的调查,数据如下表(单位:人):是否作业情况喜欢玩电脑游戏认为作业多认为作业不多总计喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总计262450则认为“喜欢玩电脑游戏与作业量的多少有关系”的把握大约为()A.99%B.95%C.90%D.无充分依据解析:≈5.0593.841,故认为“喜欢玩电脑游戏与作业量多少有关系”的把握为95%.答案:Bχ2=50×(18×15-8×9)227×23×26×2412343.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据(单位:人):作文成绩课外阅读量作文成绩优秀作文成绩一般总计课外阅读量较大221032课外阅读量一般82028总计303060由以上数据,计算得到χ2≈9.643,根据临界值表,有以上的把握认为课外阅读量大与作文成绩优秀有关.答案:99%12344.在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表;(2)检验休闲方式是否与性别有关,可靠性有多大.1234解:(1)2×2列联表如下(单位:人):(2)χ2=124×(43×33-27×21)270×54×64×60≈6.2013.841,休闲方式性别看电视运动总计女432770男213354总计6460124故有95%以上的把握认为休闲方式与性别有关.
本文标题:2019-2020学年高中数学 第一章 统计案例 2 独立性检验 2.4 独立性检验的应用课件 北师
链接地址:https://www.777doc.com/doc-8116642 .html