您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 统计学概念和方法-第9章
主要内容•分类数据的检验•四格表及其独立性检验1分类数据的检验•例(Mendel的豌豆实验)•19世纪英国生物学家Mendel按颜色与形状把豌豆分为4类:黄而圆的,青而圆的,黄而有角度,青而有角的。遗传基因中,黄色是显性的,青色是隐性的;圆是显性的,有角是隐性的。Mendel指出这四类豌豆个数之比是9:3:3:1,即这四类豌豆的概率分别为9/16、3/16,3/16,1/16.他随机抽取了n=556颗豌豆,观察到这四类豌豆的个数分别为315、108、101、32。下面根据这些观察数据,对Mendel的遗传学理论进行检验。•分类数据检验问题根据某项指标,总体被分为r类:A1,…,Ar。H0:类Ai所占的比例为pi=pi0(i=1,…,r)设n个个体中属于Ai类的实际观察个数为ni,则npi0为理论频数。Mendel提出的问题实际上就是考虑实际频数与理论频数有无偏离。1900年,Pearson提出用作为衡量实际频数与理论频数的偏差的指标。•套用上页公式计算Mendel豌豆实验中的数据,计算如下:算得x2=0.47.这里r=4,自由度为r-1=3.查x2表,得p值=0.925431,给定a=0.1或者0.05,显然,pa,故不拒绝H0.我们认为观察数据符合遗传学上四种豌豆符合9/16、3/16,3/16,1/16的比例。也可在Excel中输入“=CHIDIST(0.47,3)”,得p=0.92543108•例某学校有十门新的选修课,下面的数字分别记录了选修每门课程的学生数。取水平0.05,检验:学生对这些课程的选择没有倾向性,即选各门课的人数比例相同。•这里H0:p=0.1,n=800,r=10套用公式算得x2=5.125,对应的P值=0.8232783490.05,故接受H0,学生对这些课程的选择没有倾向性,各门课选课人数的频率为0.1.课程12345678910人数749283798073777576912四格表及其独立性检验•设A,B为两个属性,那么四格表的形式为:•其中:n1+=n11+n12,n2+=n21+n22n+1=n11+n21,n+2=n12+n22n=n11+n12+n21+n22有B没有B合计有An11n12n1+没有An21n22n2+合计n+1n+1n•例对肺癌患者和对照组的调查结果:吸烟不吸烟合计患肺癌60363对照组321143合计9214106四格表的独立性•考虑上例中吸烟与患肺癌有无关系,亦即A与B是否独立,若A、B二因素独立,则患肺癌与吸烟无关。•记p1=P(B|A),p2=P(B|没有A)即p1=n11/n1+,p2=n21/n2+,•如果p1=p2,则属性A与属性B独立。•欲检验则属性A与属性B独立,只需检验:H0:p1=p2检验统计量为:对于上面的例子,在excel中输入“=CHIDIST(9.664,1)”,得到p=0.001879,p0.05,故拒绝H0,p1和p2不独立,亦即吸烟与患肺癌有关。吸烟不吸烟合计患肺癌60363对照组321143合计9214106•例在对人们休闲的一次调查中,共调查了124人,其中女性70人,男性54人。女性中有43人主要的休闲方式是看电视,另外27人的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动。•(1)2×2的列联表:休闲方式性别看电视运动合计女432770男213354合计6460124•(2)三维柱形图:•二维条形图:•等高条形图:•(3)假设休闲方式与性别无关,计算•在excel中输入“=CHIDIST(6.20123,1)”,得到p=0.012766,p0.025,故拒绝H0,p1和p2不独立,亦即有理由认为休闲方式与性别无关是不合理的,即我们有97.5%的把握认为休闲方式与性别有关。Excel2003中的部分统计函数案例:泰坦尼克号的真实故事•1912年4月10日,“泰坦尼克号”从英国的南安普顿出发驶往美国纽约。富家少女罗丝与母亲及未婚夫卡尔一道上船,另一边,不羁的少年画家杰克靠在码头上的一场赌博赢到了船票。罗丝不愿嫁给卡尔,打算投海自尽,被杰克抱住。很快,罗丝与杰克相爱了。可没想到惨绝人寰的悲剧突然发生了,泰坦尼克号与冰山相撞。杰克把生存的机会让给了爱人罗丝,自己则在冰海中被冻死。这是美国电影《泰坦尼克号》里的凄美爱情故事。但是背后真实的情况又是怎样的呢?就让我们从泰坦尼克号的死亡记录来寻找一些答案吧。•号称“永不沉没”的“泰坦尼克号”,重达46328吨,排水量66000吨,是当时世界上唯一超过四万吨吨位的客轮;其最高航行速度可达每小时30海里(约55.6公里)。船身全长260米,最大宽度为28米;客轮上下共11层,拥有762个舱室、7公里长的走廊和游步甲板。船上吃、喝、玩、乐设施应有尽有。船长和船员也经过严格的挑选,担任船长的是在银星轮船公司工作了38年的J.E.史密斯,是该公司最有经验的船长,而指挥“泰坦尼克号”首航横渡大西洋将为他的航海生涯画上圆满的句号。•1912年4月15日,世界上最大的豪华巨轮“泰坦尼克号”与冰山相撞而沉没的悲剧成了世纪之痛。这个灾难充满了神秘与巧合,而对于其致命的原因,解释也多种多样:有人认为是船长的疏忽,有人认为是设计者只考虑到了船体的正面冲击却忽视了高速侧撞的问题,有人认为是其过于自信而忽略了安全措施的准备等等。能载二千三百人的船,其救生艇却少得可怜,仅仅二十只,最多能载一千一百七十八人。面对死亡,人们又做出了怎样的选择?•文献记载数据:当时船上有1316名乘客和892名船员共2208人,事故发生后幸存718人,约2/3的人在海难中丧生。•有关数据(单位:人)整理如下:(一)死亡与性别是否有关检验假设H0:死亡与性别之间不存在依赖关系。P值={x2=449.19}=1.0824E-990.01,故应拒绝H0,可认为死亡与性别存在依赖关系。•我们发现,如果死亡与性别之间不存在依赖关系,那么幸存下来的男性应该接近期望值565,但实际上幸存下来的男性只有374人;女性的幸存期望值为153,实际上幸存下来的女性远远大于这个数字,为344人。•由此,我们可以得出这样的结论:当时社会上可能存在着一种可贵人性,即遵守“男性绅士风度”和“优先救助妇女”的守则,因而逃生的结果是约73.2%的女性都存活下来了,而男性的存活率只有21.5%。思考•1976年至1977年美国佛罗里达州29个区的凶杀案件中凶手的肤色和是否被判死刑的326个犯人的情况如下,问是否存在种族歧视与审判不公?凶手死刑判决是否合计白人19141160黑人17149166合计36290326•Theend!•谢谢!
本文标题:统计学概念和方法-第9章
链接地址:https://www.777doc.com/doc-3792601 .html