您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 独立性检验的基本思想及其初步应用
基本概念这种变量的不同取“值”表示个体所属的不同类别,这类变量称为分类变量分类变量对于性别变量,取值为:男、女分类变量在现实生活中是大量存在的,如是否吸烟,是否患肺癌,宗教信仰,国别,年龄,出生月份等等。吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)在不吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大0.54%2.28%通过等高条形图直观判断不患病比例患病比例上述方法只是粗略判断两个分类变量是否有关系,这种判断无法精确地给出所得结论的可靠程度,要想得到精确判断,采用独立性检验。不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d假设吸烟与患肺癌没有关系,那么吸烟者中不患肺癌的比例应该与不吸烟者中相应的比例差不多即()()0acacdcababcdadbcadbcadbc即因此越小说明吸烟与患肺癌之间关系越弱;因此越大说明吸烟与患肺癌之间关系越强。0H假设:吸烟与患肺癌没有关系独立性检验22n(ad-bc)K=(a+b)(c+d)(a+c)(b+d)引入一个随机变量作为检验在多大程度上可以认为“两个变量有关系”的标准。2000HKkkk在假设成立的前提下,的观测值应该比较小因此,当很小时,说明在一定的可信程度上H成立;很大时,说明没有充分的证据说明H成立。独立性检验吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965通过公式计算2242209956.63278172148987491K9965(777549)独立性检验已知在成立的情况下,0H2(6.635)0.01PK即在成立的情况下,K2大于6.635概率非常小,近似为0.010H现在的K2=56.632的观测值远大于6.635所以有理由断定不成立,即认为“吸烟与患肺癌”有关系,但这种判断会犯错误,犯错误的概率不会超过0.0100H独立性检验步骤:首先,假设两个分类变量没有关系(在这种假设下k应该很小)其次,由观测数据计算K的观测值k,(如果k很大,则在一定可信程度上说明H不成立,即两个分类变量之间有关系)最后,根据k的值判断假设是否成立2临界值表:0.500.400.250.150.100.050.0250.0100.0050.0010.4450.7081.3232.0722.7063.8415.0246.6357.87910.82820()PKk0kP(χ≥x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828828.102k635.62k706.22k706.22k0.1%把握认为A与B无关1%把握认为A与B无关99.9%把握认为A与B有关99%把握认为A与B有关90%把握认为A与B有关10%把握认为A与B无关没有充分的依据显示A与B有关,但也不能显示A与B无关例如例1.在500人身上试验某种血清预防感冒作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示。问:该种血清能否起到预防感冒的作用?未感冒感冒合计使用血清258242500未使用血清216284500合计4745261000解:设H0:感冒与是否使用该血清没有关系。075.7500500526474216242284258100022k因当H0成立时,k2≥6.635的概率约为0.01,故有99%的把握认为该血清能起到预防感冒的作用。有效无效合计口服584098注射643195合计12271193解:设H0:药的效果与给药方式没有关系。3896.19598711224064315819322k因当H0成立时,k2≥1.3896的概率大于15%,故不能否定假设H0,即不能作出药的效果与给药方式有关的结论。<2.072例2:为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查的结果列在表中,根据所选择的193个病人的数据,能否作出药的效果和给药方式有关的结论?例3:气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行对比,所得数据如表所示,问:它们的疗效有无差异?有效无效合计复方江剪刀草18461245胆黄片919100合计27570345解:设H0:两种中草药的治疗效果没有差异。098.11100245702759161918434522k因当H0成立时,k2≥10.828的概率为0.001,故有99.9%的把握认为,两种药物的疗效有差异。例4、对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作心脏病合计心脏搭桥手术39157196血管清障手术29167196合计68324392试根据上述数据比较这两种手术对对病人又发作心脏病的影响有没有差别。•解:假设做过心脏搭桥手术与又发作心脏病没有关系.•由于a=39,b=157,c=29,d=167,a+b=196,c+d=196,a+c=68,b+d=324,n=392,由公式可得χ2的观测值为•χ2===1.78.•因为χ2=1.78<2.706,所以我们没有理由说心脏搭桥手术与又发作心脏病有关系.1在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶。利用图形判断秃顶与患心脏病是否有关系。能够以99%的把握认为秃顶与患心脏病有关系吗?为什么?患心脏病换其他病总计秃顶214175389不秃顶4515971048总计665772143721437(214597175451)16.3736.6353891048665772k所以有99%的把握认为“秃顶与患心脏病有关”因为这组数据来自被调查的医院,因此此结论只是用于该医院住院的病人群体假设秃顶与患心脏病没有关系练习:1:某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了180名员工进行调查,所得数据如下表所示积极支持企业改革不赞成企业改革合计工作积极8020100工作一般404080合计12060180对于人力资源部的研究项目,根据上述数据能得出什么结论?2、在一次恶劣气候飞行航程中调查男女乘客在机上晕机的情况如下表所示,根据此资料您是否认为在恶劣气候飞行中男人比女人更容易晕机?晕机不晕机合计男人243155女人82634合计3257893、打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得的数据,试问:每一晚都打鼾与患心脏病有关吗?患心脏病未患心脏病合计每一晚打鼾30224254不打鼾2413551379合计5415791633
本文标题:独立性检验的基本思想及其初步应用
链接地址:https://www.777doc.com/doc-4882768 .html