您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 3.2 独立性检验的基本思想及其初步应用
结束首页末页上一页下一页1.分类变量变量的不同“值”表示__________的不同类别,像这样的变量称为分类变量.独立性检验的有关概念[导入新知]3.2独立性检验的基本思想及其初步应用个体所属结束首页末页上一页下一页2.2×2列联表假设有两个分类变量X和Y,它们的取值分别为________和________,其样本频数列联表(也称为2×2列联表)为:项目y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d{x1,x2}{y1,y2}结束首页末页上一页下一页3.K2统计量为了使不同样本容量的数据有统一的评判标准,我们构造一个随机变量K2=_________________________,其中n=___________为样本容量.4.独立性检验利用随机变量K2来确定是否能以给定把握认为“____________________”的方法,称为两个分类变量独立性检验.nad-bc2a+bc+da+cb+da+b+c+d两个分类变量有关系结束首页末页上一页下一页[化解疑难]1.2×2列联表的特征2.在列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0.因此|ad-bc|越小,说明两个分类变量之间的关系越弱;|ad-bc|越大,说明两个分类变量之间的关系越强.结束首页末页上一页下一页独立性检验的思想:要确定“两个分类变量有关系”这一结论成立的可信程度,首先_______________,即假设结论“两个分类变量没有关系”成立.在该假设下我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2观测值k很大,那么在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过可信度表评价该假设不合理的程度,即“两个分类变量有关系”的可信程度.独立性检验的思想[导入新知]假设结论不成立结束首页末页上一页下一页1.P(K2≥6.635)≈0.01表明H0成立的概率很小,是小概率事件,可以判断H0不成立,也就是“两个分类变量之间没有关系”错误地判断为“两个分类变量之间有关系”的概率不超过0.01,也可以理解为“有99%的把握认为两个分类变量之间有关系”.2.利用独立性检验解决问题的基本步骤:(1)根据相关数据作列联表;(2)求K2的观测值;(3)与临界值作比较,得出结论.[化解疑难]结束首页末页上一页下一页[例1]某学校对高三学生作了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.做出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.列联表和等高条形图的应用结束首页末页上一页下一页[解]作列联表如下:项目性格内向性格外向总计考前心情紧张332213545考前心情不紧张94381475总计4265941020结束首页末页上一页下一页相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例.从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.结束首页末页上一页下一页[类题通法]进行独立性检验的前提是根据题中数据获得2×2列联表,常用等高条形图展示列联表数据的频率特征,即将aa+b与cc+d(或ba+b与dc+d)的值相比,由此能直观地反映出两个分类变量间是否相互影响,但是此方法较粗劣.结束首页末页上一页下一页[活学活用]为了研究子女吸烟与父母吸烟的关系,调查了1000多名青少年及其家长,数据如下:项目父母吸烟父母不吸烟总计子女吸烟23783320子女不吸烟6785221200总计9156051520利用等高条形图判断父母吸烟对子女吸烟是否有影响.结束首页末页上一页下一页解:等高条形图如下:由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.结束首页末页上一页下一页[例2]某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:根据表中数据,问能否在犯错误的概率不超过0.05的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.独立性检验的原理项目喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100结束首页末页上一页下一页[解]将2×2列联表中的数据代入公式计算,得k=nad-bc2a+bc+da+cb+d=100×60×10-20×10270×30×80×20=10021≈4.762.由于4.7623.841,故在犯错误的概率不超过0.05的前提下认为南方学生和北方学生在选用甜品的饮食习惯方面有差异.结束首页末页上一页下一页[类题通法]根据题意列出2×2列联表,计算K2的观测值.如果K2的观测值很大,说明两个分类变量有关系的可能性很大;如果K2的观测值比较小,则认为没有充分的证据显示两个分类变量有关系.这需要给出正确的计算,避免计算失误.结束首页末页上一页下一页[活学活用]在一次天气恶劣的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判定:在天气恶劣的飞机航程中,男乘客是否比女乘客更容易晕机?结束首页末页上一页下一页解:根据题意,列出2×2列联表如下:项目晕机不晕机总计男乘客243155女乘客82634总计325789结束首页末页上一页下一页假设在天气恶劣的飞机航程中男乘客不比女乘客更容易晕机.由公式可得K2的观测值k=nad-bc2a+bc+da+cb+d=8924×26-31×8255×34×32×57≈3.6892.706,故在犯错误的概率不超过0.10的前提下,认为“在天气恶劣的飞机航程中男乘客比女乘客更容易晕机”.结束首页末页上一页下一页[典例](12分)某工厂有工人1000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样的方法(按A类、B类分两层)从该工厂的工人中抽取100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数),结果如下表:4.独立性检验与统计的综合应用结束首页末页上一页下一页表1A类工人生产能力的频数分布生产能力分组[110,120)[120,130)[130,140)[140,150)人数8x32表2B类工人生产能力的频数分布生产能力分组[110,120)[120,130)[130,140)[140,150)人数6y2718结束首页末页上一页下一页(1)确定x,y的值;(2)完成下面2×2列联表,并回答能否在犯错误的概率不超过0.001的前提下认为工人的生产能力与工人的类别有关系.工人类别[110,130)[130,150)总计A类工人B类工人总计结束首页末页上一页下一页[解题流程]结束首页末页上一页下一页结束首页末页上一页下一页结束首页末页上一页下一页[活学活用]某学生对其亲属30人的饮食进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)结束首页末页上一页下一页(1)根据以上数据完成下面2×2列联表:项目主食蔬菜主食肉类总计50岁以下50岁以上总计(2)能否在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关?请写出简要分析.结束首页末页上一页下一页解:(1)2×2列联表如下:项目主食蔬菜主食肉类总计50岁以下481250岁以上16218总计201030(2)因为K2=30×8-128212×18×20×10=106.635,P(K26.635)=0.01.所以可以在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关.首页末页上一页下一页结束应用落实体验(单击进入电子文档)首页末页上一页下一页结束
本文标题:3.2 独立性检验的基本思想及其初步应用
链接地址:https://www.777doc.com/doc-6144040 .html