您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 两配对样本非参数检验
SPSS16实用教程第10章非参数检验10.7两配对样本非参数检验10.7.1统计学上的定义和计算公式定义:两配对样本(2RelatedSamples)非参数检验是在对总体分布不很清楚的情况下,对样本来自的两配对总体进行检验。配对样本的理解:两配对样本非参数检验一般用于同一研究对象(或两配对对象)分别给予两种不同处理的效果比较,以及同一研究对象(或两配对对象)处理前后的效果比较。前者推断两种效果有无差别,后者推断某种处理是否有效。如:判断服用某种药品前后某项关键生理指标值有无变化、同一个家庭夫妻两人的寿命有无差别等等两配对样本非参数检验的前提要求两个样本应是配对的。在应用领域中,主要的配对资料包括:具有年龄、性别、体重、病况等非处理因素相同或相似者。首先两个样本的观察数目相同,其次两样本的观察值顺序不能随意改变。SPSS中有以下3种两配对样本非参数检验方法。1.两配对样本的McNemar(麦克尼马尔)变化显著性检验McNemar变化显著性检验以研究对象自身为对照,检验其两组样本变化是否显著。原假设:样本来自的两配对总体分布无显著差异。McNemar变化显著性检验要求待检验的两组样本的观察值是二分类数据,在实际分析中有一定的局限性。McNemar变化显著性检验基本方法采用二项分布检验。它通过对两组样本前后变化的频率,计算二项分布的概率值。Table1.两组样本的交叉二维频数表010aba+b1cdc+da+cb+dtotal在原假设条件下应该有(a+b)=(a+c)或者(c+d)=(b+d)即b=c大样本下有近似自由度为1的卡方统计量:X2=(b-c)2/(b+c)第一组样本第二组样本2.两配对样本的符号(Sign)检验当两配对样本的观察值不是二值数据时,无法利用前面一种检验方法,这时可以采用两配对样本的符号(Sign)检验方法。原假设为:样本来自的两配对样本总体的分布无显著差异。检验步骤:1.将第二组样本的各个观察值减去第一组样本对应的观察值,如果得到差值是一个正数,则记为正号;差值为负数,则记为负号。2.计算正号的个案数N+和负号的个案数N-。(出现差值等于0时,删除此个案,样本数n相应地减少。)如果正号的个数和负号的个数大致相当,则可以认为两配对样本数据分布差距较小;正号的个数和负号的个数相差较多,可以分为两配对样本数据分布差距较大。SPSS将自动对差值正负符号序列作单样本二项分布检验,计算出实际的相伴概率值(原假设对应的理论概率等于0.5)。如果得到的概率值小于或等于用户的显著性水平,则应拒绝零假设H0,认为两配对样本来自的总体分布有显著差异;如果概率值大于显著性水平,则不能拒绝零假设H0,认为两配对样本来自的总体分布无显著差异。)21,(~NN:H-0nB、3.两配对样本的Wilcoxon符号平均秩检验两配对样本的符号检验考虑了总体数据变化的性质,但没有考虑两组样本变化的程度。两配对样本的Wilcoxon符号平均秩检验考虑了这方面的因素。原假设为:样本来自的两配对样本总体的分布无显著差异。检验步骤:1.按照符号检验的方法,将第二组样本的各个观察值减去第一组样本对应的观察值,如果得到差值是一个正数,则记为正号;差值为负数,则记为负号。(出现差值等于0时,删除此个案,样本数n相应地减少。)2.保留差值数据。根据差值数据的绝对值大小按升序排序,并求出相应的秩。3.分别计算符号为正号的秩和W+、负号秩总合W−以及正号平均秩、负号平均秩。4.W=min(W+,W−)这里的n是删除差值等于0的个案以后的样本容量。5.根据检验统计量计算相伴概率值,与设定的显著性水平进行比较作出检验判断。24/)12)(1(4/)1(WnnnnnZ研究问题分析10个学生接受某种方法进行训练的效果,收集到这些学生在训练前、后的成绩,如表10-9所示。表格的每一行表示一个学生的4个成绩。其中第一列表示,训练前的成绩是否合格,0表示不合格,1表示合格;第二列表示训练后的成绩是否合格,0表示不合格,1表示合格;第三列表示训练前学生的具体成绩;第四列表示训练后学生的具体成绩。问训练前后学生的成绩是否存在显著差异?10.7.2SPSS中实现过程表10-9训练前后的成绩训练前训练后训练前成绩训练后成绩0158.0070.001170.0071.000145.0065.000156.0068.000045.0050.000050.0055.001161.0075.001170.0070.000155.0065.001160.0070.00通过前两列数据可以运用McNemar检验,而后两列数据适合做符号检验和Wilcoxon符号平均秩检验实验步骤图10-23在菜单中选择“2RelatedSamples”命令图10-24“Two-Related-SamplesTests”对话框设置配对的样本配对样本的几种检验方法,(其中MarginalHomogeneity检验是McNemar检验针对多取值有序数据的推广方法)图10-25选择两个变量配对根据前两个指标值进行配对样本的McNemar检验图10-27选择两个变量配对根据后两个指标数据进行符号检验和Wilcoxon符号平均秩检验10.7.3结果和讨论(1)描述性统计部分结果如下表所示。(2)McNemar检验结果如下两表所示。2*2交叉列联表相伴概率值为0.125,应该认为训练前后学生成绩没有变化(3)Wilcoxon检验结果如下两表所示。出现了一个差值等于零的个案,删除此个案,于是样本容量从10变成了9。符号为正的有9个,秩和为45,符号为负的有0个,秩和为0。这样,统计量W=0,构造的Z=-2.673,近似相伴概率值p=Pr{|Z|=-2.673}=0.008,(Z服从标准正态分布。)因而拒绝原假设,认为训练前后学生的成绩有显著性差异。差值为第二组减第一组(4)符号检验结果如下两表所示。差值为第二组减第一组差值等于0的有一个个案,需要删除。之后N+=9,N-=0N+,N-在原假设下服从B(9,1/2)分布。相伴概率(双边检验2-tailed)P=2*Pr{N+=9}=2*(1/2)9=0.00390625所以和平均秩检验一样拒绝原假设认为训练前后学生的成绩有显著性差别。McNemar检验中,只要训练前后都是及格或都是不及格就认为没有差别,而没有考虑到虽然同样及格或不及格但是分数有可能增加了。作业!要求:在进行符号检验和Wilcoxon平均秩检验时,差值计算,符号赋值,编秩等工作要在数据文件中体现。统计量的计算过程包括相伴概率的计算表达式。1.书上研究问题。2.经调查得知某厂8名职工的入厂技术成绩(即技术培训前成绩)和进行技术培训后的技术成绩如下。分析技术培训前后,职工的技术成绩有无显著差异?(数据中0表示不合格,1表示合格)培训前培训后培训前成绩培训后成绩1078581160610156811165790145670053520059460154573.某厂生产豪华型和普通型两种家用电器。由各个零售店抽样得到的这两种型号电器的销售价格如下:厂方建议这两种型号电器的销售价格有100元的差价,利用样本数据检验:它们的差价是否是100元?a.两种型号电器的销售价格服从正态分布。(T检验)b.销售价格的分布未知。(符号检验和符号平均秩检验)零售点销售价格零售点销售价格豪华型普通型豪华型普通型13902706390340239028073502903450350840032043803009370280540030010430320
本文标题:两配对样本非参数检验
链接地址:https://www.777doc.com/doc-3618514 .html