您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 高中数学《1.2独立性检验的基本思想及其初步应用》ppt课件6
1.2独立性检验的基本思想及其初步应用2×2列联表一般地,假设两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d独立性检验定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验公式K2=nad-bc2a+bc+da+cb+d,其中n=a+b+c+d题型一有关“相关的检验”【例1】某校对学生课外活动进行调查,结果整理成下表:试用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?体育文娱总计男生212344女生62935总计275279[思路探索]可用数据计算K2,再确定其中的具体关系.解判断方法如下:假设H0“喜欢体育还是喜欢文娱与性别没有关系”,若H0成立,则K2应该很小.∵a=21,b=23,c=6,d=29,n=79,∴k=nad-bc2a+bc+da+cb+d=79×21×29-23×6221+23×6+29×21+6×23+29≈8.106.P(K2≥7.879)≈0.005即我们得到的K2的观测值k≈8.106超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”.规律方法(1)利用K2=nad-bc2a+bc+da+cb+d求出K2的观测值k的值.再利用临界值的大小来判断假设是否成立.(2)解题时应注意准确代数与计算,不可错用公式,准确进行比较与判断.【变式1】为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查得到如下数据:判断学生的数学成绩好坏与对学习数学的兴趣是否有关?成绩优秀成绩较差总计兴趣浓厚的643094兴趣不浓厚的227395总计86103189解由公式得K2的观测值k=189×64×73-22×30286×103×95×94≈38.459.∵38.459>10.828,∴有99.9%的把握说学生学习数学的兴趣与数学成绩是有关的.题型二有关“无关的检验”【例2】为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.试分析学生选报文、理科与对外语的兴趣是否有关?[思路探索]要在选报文、理科与对外语有无兴趣之间有无关系作出判断,可以运用独立性检验的方法进行判断.解列出2×2列联表代入公式得K2的观测值k=361×138×52-73×982236×125×211×150≈1.871×10-4.∵1.871×10-4<2.706,∴可以认为学生选报文、理科与对外语的兴趣无关.理文总计有兴趣13873211无兴趣9852150总计236125361规律方法运用独立性检验的方法:(1)列出2×2列联表,根据公式计算K2的观测值k.(2)比较k与k0的大小作出结论.【变式2】某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:对于教育机构的研究项目,根据上述数据能得出什么结论.支持教育改革情况学历积极支持教育改革不太赞成教育改革总计大学专科以上学历39157196大学专科以下学历29167196总计68324392解根据列联表给出的数据,可计算出K2的观测值k=392×39×167-29×1572196×196×68×324≈1.78,因为1.78<2.706,所以我们没有充分理由说“人具有大学专科以上学历(包括大学专科)和对待教育改革的态度有关”.题型三独立性检验的基本思想【例3】某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在(29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出500件,量其内径尺寸,结果如下表:乙厂分组[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)[30.02,30.06)[30.06,30.10)[30.10,30.14)频数297185159766218分组[29.86,29.90)[29.90,29.94)[29.94,29.98)[29.98,30.02)[30.02,30.06)[30.06,30.10)[30.10,30.14)频数12638618292614甲厂(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.甲厂乙厂总计优质品非优质品总计附:K2=nad-bc2a+bc+da+cb+d,P(K2≥k0)0.050.01k03.8416.635(1)分别计算甲、乙两厂优质品的频数与500的比值即为所求.(2)根据已知数据填充2×2列联表,进行独立性检验.[规范解答](1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500=72%;(2分)乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500=64%.(4分)(2)甲厂乙厂总计优质品360320680非优质品140180320总计5005001000(8分)k=1000×360×180-320×1402500×500×680×320≈7.353>6.635,(10分)所以有99%的把握认为“两个分厂生产的零件的质量有差异”.(12分)【题后反思】(1)解答此类题目的关键在于正确利用K2=nad-bc2a+bc+da+cb+d计算k的值,再用它与临界值的大小作比较来判断假设检验是否成立,从而使问题得到解决.(2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握.【变式3】下表是某地区的一种传染病与饮用水的调查表:(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.得病不得病总计干净水52466518不干净水94218312总计146684830解(1)假设H0:传染病与饮用水无关.把表中数据代入公式得:K2的观测值k=830×52×218-466×942146×684×518×312≈54.21,∵54.21>10.828,所以拒绝H0.因此我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关.(2)依题意得2×2列联表:此时,K2的观测值k=86×5×22-50×9214×72×55×31≈5.785.由于5.785>5.024所以我们有97.5%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有97.5%的把握肯定.得病不得病总计干净水55055不干净水92231总计147286误区警示因未理解P(K2≥k0)的含义而致错【示例】某小学对232名小学生调查中发现:180名男生中有98名有多动症,另外82名没有多动症,52名女生中有2名有多动症,另外50名没有多动症,用独立性检验方法判断多动症与性别是否有关系?[错解]由题目数据列出如下列联表:多动症无多动症总计男生9882180女生25052总计100132232k=232×98×50-2×822100×132×180×52≈42.117>10.828.所以有0.1%的把握认为多动症与性别有关系.应该是有(1-P(K2≥10.828))×100%=(1-0.001)×100%的把握,而不是P(K2≥10.828)×100%=0.001×100%的把握.[正解]由题目数据列出如下列联表:多动症无多动症总计男生9882180女生25052总计100132232由表中数据可得到:k=232×98×50-2×822100×132×180×52≈42.117>10.828.所以有99.9%的把握认为多动症与性别有关系.本题的错误之处在于不能正确理解独立性检验步骤的含义,当计算的K2的观测值k大于临界值k0时,就可推断在犯错误的概率不超过α的前提下说X与Y有关系,这一点需牢记.
本文标题:高中数学《1.2独立性检验的基本思想及其初步应用》ppt课件6
链接地址:https://www.777doc.com/doc-6020855 .html