您好,欢迎访问三七文档
中油加生活不是等待风暴过去,而是要在风暴中学会展翅翱翔。你们要用奋斗实现梦想,用实力赢得尊严,用精彩绽放生命!3.2独立性检验的基本思想及初步应用或P()=1-P(A)AA•1了解分类变量的意义.•2.了解2×2列联表的意义.•3.了解随机变量K2的意义.•4.通过对典型案例分析,了解独立性检验的基本思想和方法.•1.2×2列联表的意义.(重点)•2.随机变量K2的计算及应用.(重点)•3.独立性检验的基本思想.(难点)对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.生活中的分类变量是否吸烟,宗教信仰,国籍…两个分类变量之间是否有关系性别是否喜欢数学课程吸烟患肺癌为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965那么吸烟是否对肺癌有影响?吸烟与患肺癌列联表列出两个分类变量的频数表,称为列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965%54.0%100781742%28.2%100214849吸烟者与不吸烟者患肺癌的可能性存在差异00.10.20.30.40.50.60.70.80.91不吸烟吸烟患肺癌不患肺癌从上面数据和图形可以看出吸烟和患肺癌有关从上面数据和图形可以看出吸烟和患肺癌有关我们能够有多大的把握认为“吸烟与患肺癌有关”?吸烟患肺癌吸烟与患肺癌列联表不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d假设H0:吸烟与患肺癌没有关系A:不吸烟B:吸烟P(AB)=P(A)(B)a:事件AB发生的频数a+b:事件A发生的频数a+c:事件B发生的频数H0成立时ncanbana(n=a+b+c+d)(a+b+c+d)a≈(a+b)(a+c)ad-bc≈0|ad-bc|越小吸烟与患肺癌之间的关系越弱|ad-bc|越大吸烟与患肺癌之间的关系越强构造一个随机变量dbcadcbabcadnK22建立统一标准(n=a+b+c+d)若H0成立K2应该很小根据前面数据632.569198742148781720994249777599652kK2的观察值在“吸烟与患肺癌没有关系”成立的条件下可以估算出01.0)635.6(2KPk≈56.6326.635远大于99%的把握认为“吸烟与患肺癌有关系”利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.确认“两个分类变量有关系”成立的可信程度•假设该结论不成•由观测数据计算K2的观测值k•通过概率评价该假设不合理的程度k6.635,假设不合理程度约为99%y1y2总计x1aba+bx1cdc+d总计a+cb+da+b+c+d假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表2×2列联表若要推断的论述为H1:“X与Y有关系”可以按如下步骤判断结论H1成立的可能性1.通过等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠度11211,XY,XY.,.xayabxycHcd在二维条形图中可以估计满足条件的个体中具有的个体所占的比例也可以估计满足条件的个体中具有的个体所占的比例两个比例值相差越大成立的可能性就越大2.可以利用独立性检验来考察两个分类变量是否有关系并且能较精确地给出这种判断的可靠程度.根据观测数据计算检验随机变量K2的观察值kP(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828当得到的观测数据a,b,c,d都不于5时,可以通过查阅下表来确定其可信程度独立性检验的基本思想(类似反证法)(1)假设结论不成立,即“两个分类变量没有关系”.0:H(2)在此假设下我们所构造的随机变量K2应该很小,如果由观测数据计算得到K2的观测值k很大,则在一定可信程度上说明不成立.即在一定可信程度上认为“两个分类变量有关系”;如果k的值很小,则说明由样本观测数据没有发现反对的充分证据。0H0H(3)根据随机变量K2的含义,可以通过评价该假设不合理的程度,由实际计算出的k的值与临界值比较,说明假设不合理的程度,即说明“两个分类变量有关系”这一结论成立的可信度0k上面这种利用随机变量K2来判断“两个分类变量有关系”的方法,称为两个分类变量的独立性检验。例1在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶。分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?解:根据题目所给数据得到如下列联表:患心脏病不患心脏病总计秃顶214175389不秃顶4515971048总计6657721437根据联表1-13中的数据,得到221437(214597175451)16.3736.635.3891048665772K所以有99%的把握认为“秃顶患心脏病有关”。P(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828独立性检验的步骤1.提出独立性假设H0,假设两个分类变量没有关系;2.列出2×2列联表,并计算K2的观测值k;3.将观测值k与临界值k0进行比较,并作出判断.22nadbcKabcdacbd(1)当K22.706,有_________的把握判定两个分类变量有关系;(2)当K23.841,有_________的把握判定两个分类变量有关系;(3)当K26.635,有_________的把握判定两个分类变量有关系;P(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.82890%95%99%例2春节期间,“厉行节约,反对浪费”之风悄然吹开,某市随机询问100名性别不同的居民是否能做到“光盘”行动,(1)完成如下列联表。(2)有多大的把握认为居民能否做到“光盘”与性别有关系?(3)能否在犯错误的概率不超过0.010的前提下认为居民能否做到“光盘”与性别有关系?10075总计15女5545男总计做到光盘做不到光盘“光盘”与性别列联表例题解析:03.345552575)10301545(10022K假设“性别与是否做到光盘之间没有关系”10.0)706.2(2KP有90%的把握认为居民能否做到“光盘”与性别有关。1002575总计451530女551045男总计做到光盘做不到光盘“光盘”与性别列联表10.8287.8796.6355.0243.8412.7062.0721.3230.7080.4550.0010.0050.0100.0250.050.100.150.250.400.5020()PKk0k706.203.345552575)10301545(10022K假设“性别与是否做到光盘之间没有关系”010.0)635.6(2KP不能在犯错误的概率不超过0.010的前提下认为居民能否做到“光盘”与性别有关系1002575总计451530女551045男总计做到光盘做不到光盘“光盘”与性别列联表10.8287.8796.6355.0243.8412.7062.0721.3230.7080.4550.0010.0050.0100.0250.050.100.150.250.400.5020()PKk0k635.6在犯错误的概率不超过0.010的前提下认为居民能否做到“光盘”与性别没有关系为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下联表:喜欢数学课程不喜欢数学课程总计男3785122女35143178总计72228300练习:1性别与喜欢数学课由表中数据计算K2的观测值k4.513.在多大程度上可以认为高中生的性别与是否喜欢数学课程之间有关系?为什么?喜欢数学课程不喜欢数学课程总计男3785122女35143178总计72228300练习:1性别与喜欢数学课这就意味着“性别与是否喜欢数学课程之间有关系”这一结论错误的可能性约为0.05,即有95%的把握认为“性别与是否喜欢数学课程之间有关系”.解:假设高中生的性别与是否喜欢数学课程之间没关系.由k4.5133.8412.某单位餐厅的固定餐椅经常有损坏,于是该单位领导决定在餐厅墙壁上张贴文明标语,并对文明标语张贴前后餐椅的损坏情况作了一个统计,具体数据如下:损坏餐椅数未损坏餐椅数总计文明标语张贴前39157196文明标语张贴后29167196总计68324392由表中数据计算K2约等于1.78.你认为在餐厅墙壁上张贴文明标语对减少餐椅损坏数有效果吗2.某单位餐厅的固定餐椅经常有损坏,于是该单位领导决定在餐厅墙壁上张贴文明标语,并对文明标语张贴前后餐椅的损坏情况作了一个统计,具体数据如下:损坏餐椅数未损坏餐椅数总计文明标语张贴前39157196文明标语张贴后29167196总计683243923、某班主任对全班50名学生作了一次调查得下表,由表中数据得到K2的观测值k≈5.059,于是________(能或不能)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关系。不能635.6059.501.0)635.6(2KP练习4、在吸烟和患肺癌这两个分类变量的计算中,下列说法正确的是()A、若K2的观测值k=6.635,我们在犯错的概率不超过0.010的前提下认为吸烟与患肺癌有关系,那么在100个吸烟的人中必有99人患有肺病B、从独立性检验可知有99%的把握认为吸烟与患肺癌有关系时,我们说某人吸烟,那么他有99%的可能患有肺病C、若从统计量中求出有5%的可能性使得推断出现错误,是指有95%的把握认为吸烟与患肺病有关系D、以上三种说法都不正确C解析:因为统计结果只是说明事件发生的概率大小,具体到一个个体不一定发生。独立性检验法步骤:•(1)列出列联表,•(2)假设两分类变量没有关系,•(3)计算K2观测值k,•(4)查临界值表,作出判断(两分类变量有关系的程度).数学源于生活服务于生活枣庄市第八中学东校数学组不渴望能够一跃千里,只希望每天能够前进一步。
本文标题:32独立性检验的基本思想及初步应用-山东省枣庄市第八中学人教A版高中数学选修2-3课件(共31张PP
链接地址:https://www.777doc.com/doc-7539743 .html