您好,欢迎访问三七文档
数学选修1--21.会列2×2列联表,2.会从2×2列联表,直观粗略的判断出两个分类变量之间是否有关?3.了解独立性检验的基本思想和步骤弋阳二中2011.11.4研究两个变量的相关关系:定量变量:体重、身高、温度、考试成绩等等。变量分类变量:性别、是否吸烟、是否患肺癌、宗教信仰、国籍等等。两种变量:2定量变量——回归分析(画散点图、相关系数r、变量相关指数R、残差分析)分类变量——独立性检验一、两种变量及对应处理的问题1、2、根据这些数据能否断定:患病与吸烟有关吗?1、问题:某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人,调查结果是:吸烟的220人中37人患病,183人不患病;不吸烟的295人中21人患病,274人不患病。二、独立性检验患病不患病总计吸烟37183220不吸烟21274295总计584575152、为了研究这个问题,我们将上述问题用下表表示:在不吸烟者中患病的比重是在吸烟者中患病的比重是7.12%16.82%注.从列2×2联表分别计算患病在两类中的频率。患病不患病总计吸烟aba+b不吸烟cdc+d总计a+cb+da+b+c+d1、列出2×2列联表2、引入一个随机变量,卡方统计量:22nadbcKabcdacbd3、由观测数据计算得到随机变量K2的观测值k;4、以1-P(K2≥k)×100%的把握认为“X与Y有关系”;否则就说样本观测数据没有提供“X与Y有关系”的充分证据.10.837.8796.6355.0243.8412.7062.0721.3230.7080.445k0.0010.0050.0100.0250.050.100.150.50.400.502()PKka.如果k2.706,就有90%的把握认为“X与Y有关系”;b.如果k3.841,就有95%的把握认为“X与Y有关系”;c.如果k6.635,就有99%的把握认为“X与Y有关系”;二、独立性检验例1某医院,因为患心脏病而住院的665名男性病人中,有214人晕厥;而另外772名不是因为患心脏病而住院的男性病人中有175人晕厥。利用独立性检验方法判断秃顶与患心脏病是否有关系?解:根据题目所给数据得到如下列2×2联表:患心脏病不患心脏病总计晕厥214175389不晕厥4515971048总计6657721437根据列联表的数据,得到221437(214597175451)16.3736.635.3891048665772K所以有99%的把握认为“晕厥与患心脏病有关”。三、例题分析为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下联表:喜欢数学课程不喜欢数学课程总计男3785122女35143178总计72228300解:在假设“性别与是否喜欢数学课程之间没有关系”的前提下K2应该很小,并且例2.性别与喜欢数学课由表中数据计算K2的观测值k=4.513。在多大程度上可以认为高中生的性别与是否喜欢数学课程之间有关系?为什么?2(3.841)0.05,PK而我们所得到的K2的观测值k=4.513超过3.841,这就意味着“性别与是否喜欢数学课程之间有关系”这一结论错误的可能性约为0.05,即有95%的把握认为“性别与是否喜欢数学课程之间有关系”。三、例题分析(1)列出2×2列联表(2)计算K2的观测值k(3)查表得结论课堂小结:二、独立性检验的步骤2、利用随机变量K2来确定是否能以一定的把握认为“两个变量有关系”的方法,称为两个分类变量的独立性检验。一、独立性检验1、变量:定量变量:数值可以连续变化的不同值,如身高。分类变量:数值只可以取两种情况,如性别、是否吸烟。a.如果k10.828,就有99.9%的把握认为“X与Y有关系”;b.如果k7.879,就有99.5%的把握认为“X与Y有关系”;c.如果k6.635,就有99%的把握认为“X与Y有关系”;d.如果k5.024,就有97.5%的把握认为“X与Y有关系”;e.果k3.841,就有95%的把握认为“X与Y有关系”;f.如果k2.706,就有90%的把握认为“X与Y有关系”;g.如果k=2.706,就认为没有充分的证据显示“X与Y有关系”.{有一个颠扑不破的真理,那就是当我们不能确定什么是真的时,我们就应该去探求什么是最可能的。笛卡尔
本文标题:独立性检验课件
链接地址:https://www.777doc.com/doc-4682119 .html