您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 国内外标准规范 > 第四讲Mood中位数及Wilcoxon秩和检验
非参数统计分析实验指导书朱宁编2012.3.181第四讲Mood中位数及Wilcoxon秩和检验1.实验目的1)理解Mood中位数检验法的基本思想;2)会用Minitab、SAS软件对Mood中位数检验法、Wilcoxon秩和检验法进行统计分析;3)能够用Minitab软件解决实际问题。2.实验要求1)理解Mood中位数检验法的基本步骤;2)理解Wilcoxon秩和检验法的基本步骤;3)会用Minitab软件按要求解决问题并给出处理结果和检验结果;4)对处理结果进行分析和小结。3.实验原理《1》Mood中位数检验法样本mxxx,,,21和nyyy,,,21分别来自相互独立的连续型随机变量总体X和Y。分别记总体X和Y的中位数为xme和yme。则Mood中位数检验法检验的三种原假设和备择假设的情况是:原假设均是yxmemeH:0,而备择假设1H分别是yxmeme、yxmeme和yxmeme。进一步是将样本mxxx,,,21和nyyy,,,21合在一起,记合样本nmyyyxxx,,,,,,,2121的样本中位数为me,则可得到四格表如下:表1:中位数四表格meme合计X的样本11N12N1NY的样本21N22N2N合计1N2NN注:其中11N和12N分别是X的样本中,小于和大于合样本中位数me观测值的个数;其中21N和22N分别是Y的样本中,小于和大于合样本中位数me观测值的个数;显然:a)当合样本的容量mn为偶数时有,N=mn,122NNN,12,NmNn;b)当mn为奇数时有,1Nmn,122NNN,当合样本中位数me属于2X的样本时,121,NmNn;而me属于Y的样本时,12,1NmNn在四格表方法中通常取11N为统计量且11N服从超几何分布,它的概率记为),,,(1111NNNNP。则其检验方法为:1)当0H为yxmeme,1H为yxmeme时,在11N比较小的时候拒绝原假设,从而认为yxmeme。检验的p值为11,,,11NkNNNkP;2)当0H为yxmeme,1H为yxmeme时,在11N比较大的时候拒绝原假设,从而认为yxmeme。检验的p值为11,,,11NkNNNkP;3)当0H为yxmeme,1H为yxmeme时,在11N比较小或比较大的时候拒绝原假设,从而认为yxmeme。此时的检验的p值分为一下两种情况:情况1.在11N比较小,以至于115.0,,,11NkNNNkP时,检验的p值为11,,,,,,1111NkakNNNkPNNNkP,其中akNkNNNkPNNNkPaa11,,,,,,:inf1111.情况2.在11N比较大,以至于115.0,,,11NkNNNkP时,检验的p值为11,,,,,,1111NkakNNNkPNNNkP,其中akNkNNNkPNNNkPaa11,,,,,,:sup1111《2》Wilcoxon秩和检验法1)基本思想当两组配对资料近似服从正态分布,它们差值的检验可以使用配对t检验法。如果配对资料的正态分布的假设不能成立,就可以使用FrankWilcoxon(1945)符号秩检验,它是一种非参数检验方法。对配对资料的差值采用符号秩方法来检验。它的基本要求是差值数据设置为最小的序列等级和两组配对资料是相关的(配成对)。用数据的秩代替原数据进行的假设检验的方法为秩和检验。如果相比较组之间秩次之和十分接近,则认为各组之间没有差别;如果相比较组之间的秩和相差十分悬殊,则认为3各组间存在差别。2)Wilcoxon秩和检验的基本步骤先将原始资料在不分组别的情况下从小到大排序、编秩,然后将所编秩次相加、求和、假设检验。a.建立检验假设:两总体分布相同;b.两样本混合统一编秩次,相同观测值(即相同秩)在不同组时取平均秩次,计算两组秩和。表2符号假设检验问题的解0H1H水平的拒绝域p值的计算00})(:inf{**cWPcccWyy,),,,,,(11的值算得的由ynmyWyyxxWP0})(:sup{**dWPdddWyy,11(,,,,,)ymnyPWxxyyW由算得的的值0}2)(:inf{c}2)(:sup{****cWPccWdWPdddWyy,或,时,的值由样本数据算得的4)1N(nW;的值算得的由),,,,,(2y11yWyyxxWPnm时,的值由样本数据算得的4)1N(nW),,,,,(2y11y的值算得的由WyyxxWPnm记两个独立的连续型随机变量总体X和Y的样本分别为mxxx,,,21和nyyy,,,21,不妨假设合样本的各个之间互不相等。记合样本容量为nmN。原假设为:yxmemeH:0在理论上,假设两个总体X和Y的分布函数具有相同的形式,但不一定对称分布。即假设:yxmeyYmexFX~,~从而原假设yxmemeH:0等价于:同分布和YXH:0。将两组样本混合,求出每个样本在合样本中的秩。记样本njyj,,2,1,在合样本中的秩为jR,则NRj,,2,1。令YW表示总体Y的样本nyyy,,,21的秩之和,即njjYRW1.同样定义XW为X样本mxxx,,,21的秩之和,我们称YW或XW为Wilconxon秩和检验统计量。44.应用实例哪一个企业职工的工资高?(单位:千元)这里有22名职工,其中的12名职工来自企业1,另外的10名职工来自企业2。他们的工资如下:企业1:111213141516171819204060企业2:3456789103050请分别用Mood中位数检验法、Wilcoxon秩和检验法解决该问题。用Mood中位数的检验法解决的步骤如下:①给出原假设和备择假设。针对该问题,经计算,这企业1职工工资的中位数高于企业2职工工资的中位数,因此,这个假设检验问题的原假设和备择假设分别为:0xyHmeme:vs1xyHmeme:②用统计软件Minitab进行符号检验的步骤:a)输入数据:将企业1的12名职工的工资输入到C1列的第1到第12个单元格,将企业2的10名职工的工资输入到C1列的第13到第22个单元格;b)输入数据的类别:在C2列分别输入1、2,是企业1的对应输入“1”,是企业2的对应输入“2”,结果如下图1;图1.Minitab中输入的数据c)选择Stat(统计)下拉菜单;d)选择Nonparametric(非参数)选项;e)在Nonparametric的下拉菜单中选择Mood’sMedianTest(Mood中位数检验)选项;f)在对话框的Response(响应)方框内键入C1,Factor(因子)方框内键入C2.如图2所示;5图2.Mood中位数检验对话框g)单击OK(确定).输出结果如下图:图3.输出的检验结果图从输出的结果可以看出,对于给定的α=0.05的检验水平,从得出的p值=0.010α,我们可以得出结论:拒绝原假设0xyHmeme:,从而认为企业1职工的工资比企业2职工的工资高.用Wilcoxon秩和检验法求解步骤如下:1Minitab软件求解○1给出原假设和备择假设。原假设为0H:这两个企业职工的工资没有差异,备择假设为1H:企业1职工的职工的工资比企业2职工的工资高.○2用统计软件Minitab进行Wilcoxon秩和检验的步骤:a)输入数据:将企业1的12名职工的工资输入到C1列的第1到第12个单元格,将企业2的10名职工的工资输入到C2列的第1到第10个单元格;结果如下图4;6图4.Minitab中输入的数据b)选择Stat(统计)下拉菜单;c)选择Nonparametric(非参数)选项;d)在Nonparametric的下拉菜单中选择Mann-Whitney子选项;e)在对话框的第一样本(F)方框内键入C1,第二样本(S)方框内键入C2.备择方框中在本例选择大于,如图5所示;图5.Wilcoxon秩和检验对话框f)单击OK(确定)注:○1Wilcoxon秩和检验方法与mann-whitneyU统计量检验方法没有本质的差别,所以在Minitab软件中选择mann-whitney子选项就是wilcoxon秩和检验.○2Minitab算得的秩和是第一个样本(数据输入到c1列)的秩和.7输出结果如下图:图6.输出的检验结果图由上图的输出结果可以看出,1177cw即为企业1职工工资秩的和,在00056p0.05,拒绝原假设,故ETA1=ETA2与ETA1ETA2的检验结果显著,即企业1的职工工资高于企业2的职工工资。注:由于Wilcoxon秩和检验临界值表中的秩和w是容量比较小的那一个样本的秩和,故无法根据177w去查临界表。此时做法如下:在图5的Wilcoxon秩和检验对话框中,第一个样本对话框输入的应是容量较小的样本的变量,第二个样本对话框输入的应是容量较大的样本,此时相应的改备择假设即可。例如,本例改成如图7,图7.Minitab中输入的数据及Wilcoxon秩和检验对话框根据图7,第一个样本输入c2(容量为10),第二个样本输入c1(容量为12),由于第一个样本的中位数小于第二个样本的中位数,故备择选择小于。8输出的结果:图8.输出的检验结果图由图8可知,276cw可以根据该值去查临界表,(76)0.005apd0.05,故拒绝原假设,从而企业2职工的工资低于企业1职工的工资。2SAS软件求解代码如下:dataa;dogroup=1to2;inputn;doi=1ton;inputx@@;output;end;end;cards;12111213141516171819204060103456789103050;procnpar1waydata=awilcoxon;/*对于非参数统计分析方法功能的实现,主要是由nparlway过程完成*/classgroup;varx;run;程序说明:建立输入数据集a,数据的输入和成组t检验相同,先输入本组数据的总数,然后输入组中每个数据。分组变量为group,共有两组取值为1和2。输入变量为x,存放每组中的数据。过程步调用npar1way过程,后面用选择项wilcoxon要求进行wilcoxon秩和检验。要注意,如果两组样本是配对样本,应该使用配对t检验或wilcoxon符号检验,因为使用wilcoxon秩和方法,将损失配对信息。class语句后给出分组变量名group,var语句后给出要分析的变量x。主要结果见图9所示。9图9用npar1way过程进行Wilcoxon秩和检验的输出结果由图9的结果说明:组1和组2的秩和(SumofScores)分别为177和76。原假设(组1和组2的总体分布相同)为真时,期望秩值(Expected)分别为(177+76)×12/(12+10)=138和(177+76)×10/(12+10)=115,标准差(StdDev)为15.165751。每组平均得分(MeanScore)分别为177/12=14.750和76/10=7.6。Wilcoxon两样本秩和统计量(较小的秩和)S=76.0,正态近似检验统计量Z=-2.5386(连续性修正因子为0.5,加在分子上),正态分布的单尾p值之和为0.0056,拒绝原假设。同时还给出了近似t检验和卡方检验的结果:近似t检验的p=0.0096,近似卡方检验统计量为6.6130,自由度为1,p=0.0101。结果都是相同的,拒绝原假设。总结:sas软件求解的结果与Minitab软件求解结果一致,p值都为0.0056,说明sas系统与Minitab软件只能给出近视z检验的分析结果。需要注意的是:当样本量较小时,需要通过临界表确定p值(查临界表的0.005
本文标题:第四讲Mood中位数及Wilcoxon秩和检验
链接地址:https://www.777doc.com/doc-6277151 .html