您好,欢迎访问三七文档
-1-2.2独立性检验2.3独立性检验的基本思想2.4独立性检验的应用学习目标核心素养1.了解独立性检验的基本思想方法.(重点)2.了解独立性检验的初步应用.(难点)1.借助了解独立性检验的思想,提升学生数学抽象的核心素养.2.通过独立性检验的分析应用,培养学生数据分析的核心素养.1.独立性检验设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=A1;变量B:B1,B2=B1,有下面2×2列联表:ABB1B2总计A1aba+bA2cdc+d总计a+cb+dn=a+b+c+d其中,a表示变量A取A1,且变量B取B1时的数据;b表示变量A取A1,且变量B取B2时的数据;c表示变量A取A2,且变量B取B1时的数据;d表示变量A取A2,且变量B取B2时的数据.2.独立性检验的基本思想在2×2列联表中,令χ2=nad-bc2a+bc+da+cb+d,当数据量较大时,在统计中,用以下结果对变量的独立性进行判断:(1)当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;(2)当χ22.706时,有90%的把握判定变量A,B有关联;(3)当χ23.841时,有95%的把握判定变量A,B有关联;(4)当χ26.635时,有99%的把握判定变量A,B有关联.-2-1.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差B.回归分析C.独立性检验D.概率C[判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.]2.在2×2列联表中,两个比值aa+b与________相差越大,两个分类变量有关系的可能性越大.cc+d[根据2×2列联表可知,比值aa+b与cc+d相差越大,则|ad-bc|就越大,那么两个分类变量有关系的可能性就越大.]3.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20至40岁401858大于40岁152742总计5545100由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________(填“是”或“否”).是[因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即ba+b=1858,dc+d=2742,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的.]2×2列联表【例1】在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用aa+b与cc+d判断二者是否有关系.思路点拨:对变量进行分类→求出分类变量的不同取值→作出2×2列联表→-3-计算aa+b与cc+d的值,作出判断[解]2×2列联表如下:年龄在六十岁以上年龄在六十岁以下总计饮食以蔬菜为主432164饮食以肉类为主273360总计7054124将表中数据代入公式得aa+b=4364=0.671875.cc+d=2760=0.45.显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.利用2×2列联表的关键及注意事项1.作2×2列联表时,关键是对涉及的变量分清类别.注意应该是4行4列,计算时要准确无误.2.利用2×2列联表分析两变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将aa+b与cc+d或ba+b与dc+d的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.1.在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.[解]作列联表如下:喜欢甜食情况性别喜欢甜食不喜欢甜食总计男117413530女492178670总计6095911200独立性检验【例2】在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外-4-500名未用血清的人的感冒记录作比较,结果如表所示.问:能否在犯错误的概率不超过1%的前提下认为该种血清能起到预防感冒的作用.未感冒感冒总计使用血清258242500未使用血清216284500总计4745261000思路点拨:独立性检验可以通过2×2列联表计算χ2的值,然后和临界值对照作出判断.[解]假设感冒与是否使用该种血清没有关系.由列联表中的数据,求得χ2的值为χ2=1000×258×284-242×2162474×526×500×500≈7.075.χ2≈7.0756.635,查表得P(χ26.635)=0.01,故我们在犯错误的概率不超过1%的前提下,即有99%的把握认为该种血清能起到预防感冒的作用.独立性检验的一般步骤1.根据样本数据列2×2列联表.2.计算χ2=nad-bc2a+bc+da+cb+d的值.3.将χ2的值与临界值进行比较,若χ2大于临界值,则认为X与Y有关,否则没有充分的理由说明这个假设不成立.2.“十一”黄金周前某地的一旅游景点票价上浮,黄金周过后,统计本地与外地来的游客人数,与去年同期相比,结果如下:本地外地总计去年140728424249今年133120653396总计273849077645能否在犯错误的概率不超过0.01的前提下认为票价上浮后游客人数与所处地区有关系?[解]按照独立性检验的基本步骤,假设票价上浮后游客人数与所处地区没有关系.因为χ2=7645×1407×2065-2842×133124249×3396×2738×4907≈30.35>6.635.-5-所以在犯错误的概率不超过0.01的前提下认为票价上浮后游客人数与所处地区有关系.独立性检验的综合应用[探究问题]1.当χ2>3.841时,我们有多大的把握认为事件A与B有关?[提示]由临界值表可知当χ2>3.841时,我们有95%的把握认为事件A与B有关.2.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.我们是否可以判定100个心脏病患者中一定有打鼾的人?[提示]这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知100个心脏病患者中可能一个打鼾的人都没有.【例3】为了解某市创建文明城市过程中,学生对创建工作的满意情况,相关部门对某中学的100名学生进行调查,其中有50名男生对创建工作表示满意,有15名女生对创建工作表示不满意.已知在全部100名学生中随机抽取1人,其对创建工作表示满意的概率为45.是否有充足的证据说明,学生对创建工作的满意情况与性别有关?思路点拨:解决本题首先根据对工作满意的概率,确定对工作满意的男女生人数,再画出2×2列联表,最后根据2×2列联表计算χ2,并进行判断.[解]由题意得2×2列联表如下:满意不满意总计男生50555女生301545总计8020100χ2=100×50×15-30×5280×20×55×45≈9.091>6.635,所以我们有99%的把握认为学生对创建工作的满意情况与性别有关.独立性检验应用时的关键要点1.解决此类问题的关键是正确列出2×2列联表,并代入公式求出χ2的值,然后判断得出结论,由于数据较多,在计算上容易出错应引起注意.2.独立性检验仍然属于用样本估计总体,由于样本抽取具有随机性,因而作出的推断可能正确,也可能错误,有95%(或99%)的把握说事件A与B有关,则推断结论为错误的可能性仅为5%(或1%).-6-3.有两个变量x与y,其一组观测值如下2×2列联表所示:yxy1y2x1a20-ax215-a30+a其中a,15-a均为大于5的整数,则a取何值时,有95%的把握认为x与y之间有关系?[解]由题意χ2=65[a30+a-20-a15-a]220×45×15×50=6565a-300220×45×15×50=1313a-6025400.∵有95%的把握认为x与y之间有关系,∴χ23.841,∴1313a-60254003.841,a7.7或a1.5.又a5,15-a5,∴7.7a10.又a∈N,∴a=8或a=9.1.利用2×2列联表判断两变量之间是否独立的步骤第一步:根据调查结果和数据,列出所要研究的两个变量之间的2×2列联表.第二步:计算总和,即变量A、B的总数.第三步:求频率.第四步:判断.2.独立性检验的基本思想是:要确认两个变量有关系这一结论成立的可信程度,首先假设结论“两个变量没有关系”成立,在该假设下我们构造的统计量χ2应该很小,如果用观测数据计算的统计量χ2很大,则在一定程度上说明假设不合理.由χ2与临界值的大小关系,作出判断.1.对分类变量X与Y的统计量χ2的值说法正确的是()A.χ2越大,“X与Y有关系”的把握性越小B.χ2越小,“X与Y有关系”的把握性越小C.χ2越接近于0,“X与Y无关系”的把握性越小D.χ2越大,“X与Y无关系”程度越大-7-B[χ2越大,X与Y越不独立,所以关联越大;相反,χ2越小,关联越小.]2.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算χ2≈8.01,则认为“喜欢乡村音乐与性别有关系”的把握性约为()χ2≥k0.1000.0500.0250.0100.001k2.7063.8415.0246.63510.828A.0.1%B.1%C.99%D.99.9%C[因为χ26.635,所以有99%以上的把握认为“喜欢乡村音乐与性别有关系”.]3.以下关于独立性检验的说法中,正确的是________.①独立性检验依据小概率原理;②独立性检验得到的结论一定正确;③样本不同,独立性检验的结论可能有差异;④独立性检验不是判断两分类变量是否相关的唯一方法.①③④[独立性检验得到的结论不一定正确,故②错,①③④正确.]4.(2019·全国卷Ⅰ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:χ2=nad-bc2a+bc+da+cb+dP(χ2≥k)0.0500.0100.001k3.8416.63510.828[解](1)由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)χ2=100×40×20-30×10250×50×70×30≈4.762.由于4.7623.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.-8-
本文标题:2019-2020学年高中数学 第1章 统计案例 2 2.2 独立性检验 2.3 独立性检验的基本思
链接地址:https://www.777doc.com/doc-8475895 .html