您好,欢迎访问三七文档
【课标要求】3.2独立性检验的基本思想及其初步应用了解独立性检验的基本思想、方法及其简单应用;理解判断两个分类变量是否有关系的常用方法、独立性检验中K2的含义及其实施步骤.能够根据题目所给数据列出列联表及求K2.(重点)独立性检验的基本思想和方法.(难点)1.2.1.2.【核心扫描】不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965为了研究吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)在不吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大。0.54%2.28%通过图形直观判断不患病比例患病比例我们通过分析数据和图形,得到的直观印象是吸烟和患肺癌有关,那么事实是否真的如此呢?这需要用统计观点来考察这个问题。分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的_________,像这样的变量称为分类变量.(2)列联表①定义:列出的两个分类变量的_______,称为列联表.②2×2列联表1.不同类别频数表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d独立性检验2.定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验公式K2=_______________________其中n=___________具体步骤①根据实际问题的需要,确定容许推断“两个分类变量有关系”犯错误概率的上界α.然后查表确定_________②利用公式计算随机变量K2的_________③如果_______,就推断“X与Y有关系”,这种推断_____________不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中_________________支持结论“X与Y有关系”a+b+c+d临界值k0观测值k犯错误的概率没有发现足够证据nad-bc2a+bc+da+cb+dk≥k03、独立性检验临界值表P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828合作探究1、在2×2列联表中,如果两个分类变量没有关系,则应满足什么条件?为什么?2、反证法原理与独立性检验原理的比较3、独立性检验的基本方法4、临界值表的作用不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d那么吸烟者中不患肺癌的比例应该与不吸烟者中相应的比例差不多即()()0acacdcababcdadbcadbcadbc即因此越小说明吸烟与患肺癌之间关系越弱;因此越大说明吸烟与患肺癌之间关系越强。0H假设:吸烟与患肺癌没有关系应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.2、反证法原理与独立性检验原理的比较反证法原理:在假设H0下,如果推出一个矛盾,就证明了H0不成立.独立性检验原理:在假设H0下,如果出现一个与H0相矛盾的小概率事件,就推断H0不成立,且该推断犯错误的概率不超过这个小概率.独立性检验的基本思想:(类似于数学上的反证法,对“两个分类变量有关系”这一结论成立可信程度的判断):(1)假设该结论不成立,即假设结论“两个分类变量没有关系”成立.(2)在假设条件下,计算构造的随机变量K2,如果由观测数据计算得到的K2很大,则在一定程度上说明假设不合理.(3)根据随机变量K2的含义,可以通过(2)式评价假设不合理的程度,由实际计算出的k6.635,说明假设不合理的程度约为99%,即“两个分类有关系”这一结论成立的可信程度约为99%.10.8287.8796.6355.0243.8412.7062.0721.3230.7080.445k0.0010.0050.0100.0250.050.100.150.50.400.502()PKk(1)如果k10.828,就有99.9%的把握认为“X与Y有关系”;(2)如果k7.879,就有99.5%的把握认为“X与Y有关系”;(3)如果k6.635,就有99%的把握认为“X与Y有关系”;(4)如果k5.024,就有97.5%的把握认为“X与Y有关系”;(5)如果k3.841,就有95%的把握认为“X与Y有关系”;(6)如果k2.706,就有90%的把握认为“X与Y有关系”;(7)如果k=2.706,就认为没有充分的证据显示“X与Y有关系”.4、临界值例1:在一次天气恶劣的飞行航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判定:在天气恶劣的飞行航程中,男乘客是否比女乘客更容易晕机?【解】根据题意,列出2×2列联表如下:晕机不晕机总计男乘客243155女乘客82634总计325789某校对学生课外活动进行调查,结果整理成下表:试用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?【例2】体育文娱总计男生212344女生62935总计275279某小学对232名小学生调查中发现:180名男生中有98名有多动症,另外82名没有多动症,52名女生中有2名有多动症,另外50名没有多动症,用独立性检验方法判断多动症与性别是否有关系?[错解]由题目数据列出如下列联表:误区警示因未理解P(K2≥k0)的含义而致错【示例】多动症无多动症总计男生9882180女生25052总计100132232k=232×98×50-2×822100×132×180×52≈42.117>10.828.所以有0.1%的把握认为多动症与性别有关系.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.试分别用列联表、独立性检验的方法分析学生选报文、理科与对外语的兴趣是否有关?【例3】下表是某地区的一种传染病与饮用水的调查表:【例4】得病不得病总计干净水52466518不干净水94218312总计146684830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.
本文标题:3-2独立性检验
链接地址:https://www.777doc.com/doc-3181829 .html