您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > SPSS统计分析-第10章非参数检验
第10章非参数检验•在前面内容的介绍中,不论是平均数差异性检验,或者是方差分析,这些都对数据类型和分布形态有一定要求,如数据连续,总体正态,这些称之为参数检验。但是很多情况下,研究者对于数据的总体分布形态并不清楚,数据的类型也不一定是连续的,如果这时仍然采用参数检验的方法,涂赡芑岬贸错误的结论,因此在这种情况下做数据分析就需要使用本章将要介绍的的非参数检验。•从SPSS18.0版本开始,非参数检验增加了新的命令菜单,使得操作更加的方便,同时也保留了之前的SPSS版本中原有的旧菜单。在SPSS18.0中,非参数检验的菜单如图所示。•非参数检验是一种重要的统计检验方法,它不依赖于特定的总体分布,而且适合于各种类型的数据,应用十分广泛。本节就来认识非参数检验同之前了解的参数检验的异同及其特点。10.1非参数检验概述•统计推断的一个重要问题就是通过观测到的样本数据推断总体特征,它的基本内容有参数估计和假设检验两个方面。由于实验条件和测量水平的不同,也相应的需要不同的检验方法,一般常用的有参数检验和非参数检验两种。•1.参数检验•参数检验(ParameterTest)是统计推断的重要组成部分,它是根据样本数据对相应总体统计参数进行推断的方法。10.1.1参数检验与非参数检验•2.非参数检验•非参数检验(NonparametricTests)相对于参数检验而言,它不考虑总体的参数和总体的分布形态,而是从样本本身获取信息对其所代表的总体的分布或分布位置进行假设检验。•参数检验和非参数检验的对比如表所示。•非参数检验主要适用于以下几种情况:•(1)等级数据•(2)数据分布形态未知或呈偏态•(3)方差不齐性•(4)来自不同总体的数据•(5)小样本数据•(6)资料的初步分析10.1.2非参数检验的适用范围•非参数检验的优点主要有以下几个方面:•不需要严格的假设前提•稳定性•计算简单•特别适用于小样本数据、总体分布形态未知或偏态数据、方差不齐或混杂样本等,这些一般使用参数检验是无法实现的,但是非参数检验能简单快速的对数据进行处理。•除了上面的列举的一些非参数检验相对于参数检验的优势,其自身也有一些缺点和不足:•检验效能低10.1.3非参数检验的优缺点•单样本非参数检验是对单个总体的分布形态等进行统计推断的方法,包括二项式检验、卡方检验、K-S检验、Wilcoxon符号秩检验和游程检验等。在SPSS18.0版本中,非参数检验增加了新的命令菜单,同时也使用了新的操作界面。下面首先一起来认识单样本非参数检验的新操作界面及其功能。•在SPSS18.0版本中将非参数检验命令下的子菜单分为单样本非参数检验、独立样本非参数检验和相关样本非参数检验,卡方检验、二项式检验和游程检验等均放入了单样本非参数检验界面中。同时还在“旧对话框”子菜单中保留了原有的菜单命令,适用于对非参数检验较为熟悉和熟练的老用户。10.2单样本非参数检验新功能介绍•在SPSS18.0版本中,操作界面也不同于之前版本的界面。打开主对话框后,显示“目标”、“字段”和“设置”三个选项卡,用户在使用时更加的简明和方便。•在功能上,新的操作界面可以根据数据类型自动选择合适的非参数检验方法,特别适用于对非参数检验了解不是太多的新用户。同时还可以在设置中自行选择适合的非参数检验方法并设置其参数,使检验结果更加的精确。•在建立数据文件之后,选择“分析”“非参数检验”“单样本”命令,打开“单样本非参数检验”对话框,即可显示单样本非参数检验“目标”选项卡,如图所示。在该选项卡中显示非参数检验的用途及适用条件,并用于指定单样本非参数检验的目标。10.2.1“目标”选项卡•单击“字段”标签,下方将显示“字段”选项卡,如图所示,在该选项卡中可以选择要进行检验的字段。10.2.2“字段”选项卡•单击“设置”标签,下方将显示“设置”选项卡,如图所示。在该选项卡中可以选择检验方法、检验选项及缺失值处理方法。在左侧的“选择项目(S)”列表框中可以选择相应的项目并对其进行设置。10.2.3“设置”选项卡•在现实生活和科学研究过程中,经常会涉及离散型变量的处理,如在做判断题的时候就会有对和错两种结果,抛掷一枚硬币可能会出现正面或反面的结果。这种在每一次试验中,可能出现的结果只有两种的试验就称为二项试验。10.3二项式检验•二项试验是指在每次试验中可能出现的结果只有两种的试验,在一次二项试验中,如果关心的事件A出现记为“成功”,事件A不出现记为“失败”,那么对于n次二项试验,事件A出现的次数X的概率分布服从二项分布(Binomialdistribution)。二项分布是一种具有广泛用途的离散型随机变量的概率分布,它是由贝努里始创的,所以又叫贝努里分布。因为在二项分布中只可能出现两种事件,这两种事件又是对立的,所以二项分布又可说是两个对立事件的概率分布。二项分布的计算为:()(0,1,2,,),kknknPXkCpqkn10.3.1基本原理•在某校初中二年级的三个班中抽取了部分同学的期末考试成绩(总分100分),根据以往经验,该校学生的各科及格率都在95%以上,试根据这些学生的考试成绩检验今年的期末考试成绩及格率是否都达到了95%。•1.操作过程•2.输出结果10.3.2实例分析:考试成绩及格率•某村准备集资建工厂,为了更好的了解群众对该工程的意见,研究人员对一些群众进行了调查,选项包括“赞成、中立和反对”,如何了解群众中这三种意见的人数是否存在明显差异?通过上节内容的学习,对于类别数量为两类的分类数据可以使用二项检验进行统计分析,在选项类别数量多于两类的时候,就需要采用本节要学习的卡方检验。10.4卡方检验•除了上节的二项检验,卡方检验也可以用于对按属性分类的计数资料进行分析,由于对数据资料的分布形态不作任何假设,适用于分析称名资料和等级资料,所以它是一种检验计数数据分布状态的最常用的非参数检验方法。•卡方检验依据的分布为卡方分布,卡方分布是一种正偏态分布,随着自由度的不同,分布曲线的倾斜程度也不同,如图所示是几种不同自由度时的卡方分布曲线图。10.4.1基本原理•回到本节开始时提到的案例,某村准备集资建工厂,为了解群众对该工程的意见,研究人员对一些群众进行了调查,选项包括“赞成、中立和反对”,分别以1、2、3代表“赞成”、“中立”和“反对”三种意见,如何了解群众中这三种意见的人数是否存在明显差异?•1.操作过程•2.输出结果10.4.2实例分析:群众意见调查•在根据样本数据推断总体数据是否符合某一理论分布时,除了可以使用前面10.4节中的卡方分析之外,还可以使用本节要学习的K-S检验,而且K-S检验相对于卡方检验是一种更精确的非参数检验方法。10.5K-S检验•卡方检验和K-S检验都可用于检验样本所在的总体分布与理论分布的拟合情况,二者的不同在于卡方检验主要适用于分类数据,而K-S检验主要适用于连续数据,卡方检验虽然有时也可以用于连续数据,但需要对连续变量进行分组(如将学习成绩分为差、中、优等),并要求彼此独立,相对而言,K-S检验可以不需要分组直接使用原始数据进行检验,对数据的使用更加完整,检验结果也更加的精确。10.5.1基本原理•仍以二项检验一节中学生成绩为例,在模型浏览器的连续字段信息视图中可以看出学生的英语学习成绩有正态分布趋势,而K-S检验可以推断总体数据是否符合某一理论分布,因此可以使用K-S检验进一步分析学生期末考试成绩是否符合正态分布。•1.操作过程•2.输出结果10.5.2实例分析:考试成绩的分布形态•在2011年上半年一段时期,受日本地震影响,食盐价格快速上涨,也有一些不法商户利用此次机会哄抬盐价,重量上缺斤短两。为更好的保障消费者权益,某市质检部门对商场中出售的食盐进行了抽查。但抽查样本量较小,而且又不了解食盐重量的总体分布情况,监察人员又该如何判断该商场的食盐重量是否符合要求呢?使用本节将要了解的Wilcoxon符号秩检验可以解决这种问题。10.6Wilcoxon符号秩检验•在了解符号秩检验之前首先要明确“符号”和“秩”的概念。•符号指的其实就是平时所说的正负号,符号检验就是根据正号和负号的数目对某种假设做出判定的非参数检验方法。•秩是数据按照升幂排列之后,每个观测值的位置。•符号秩检验的基本过程为:首先计算每一对数据的差值,若差值为0则剔除该对数据,然后将差值的绝对值按照由小到大的顺序排列并标注其秩次,最后再将各个差值的正负符号标注在该差值对应的秩次前。如果两样本无显著差异,则正号的秩次之和和负号的秩次之和应大致相等。10.6.1基本原理•回到本节开始时提到的食盐质量检查情况的案例,该种食盐包装标明的净重为1000克,质检部门对商场中出售的食盐重量抽查结果如下(单位:克):•99599199910041004100310031002100210011000998994•9989979971001997996996992995990994993•1.操作过程•2.输出结果10.6.2实例分析:产品的重量合格么?•在统计分析过程中,常常要求总体中抽取的样本是随机的,因为这将影响到最终的统计推断。但通过传统的参数检验只能得到数据的总体特征和分布形态,要判断数据的随机性却十分困难,而本节的游程检验是一种能有效检验一组数据是否随机的方法。10.7游程检验•为了检验数据是否随机,可以采用游程检验。所谓游程(Run),是指某序列中同类元素的一个持续的最大主集。•游程检验的虚无假设:总体某个变量的变量值出现是随机的,备则假设:总体某个变量的变量值出现不是随机的。10.7.1基本原理•股市的波动牵动着千万股民的心,已知某一股票在过去一段时间中表现如下,用1代表股票价格上涨,用0代表股票价格下跌,得到如下数据序列:11110001100001011001,请问能否根据这只股票在过去这段时间的表现判断这只股票未来的走向?•1.操作过程•2.输出结果10.7.2实例分析:股票的涨跌•在前面章节中,我们了解到如果想比较两个或多个总体平均数之差,可以使用t检验或方差分析,但是这些都是参数检验,要求数据连续,且总体分布正态。但由于种种原因,往往满足不了这些条件要求,在不了解数据分布形态且样本量较小时比较总体平均数差异就需要使用本节和下节要介绍的独立样本和相关样本非参数检验。10.8独立样本非参数检验•独立样本非参数检验是在对总体分布不太了解情况下,通过样本数据推断样本来自的两个或多个独立总体分布是否存在差异。检验方法主要有以下几种:•1.Mann-WhitneyU检验•Mann-WhitneyU主要用于比较两总体均值的差异,检验统计量的计算公式为:(1)2nnUW10.8.1独立样本非参数检验的基本原理•2.两样本K-S检验•K-S检验主要用于推测两个样本是否来自具有相同分布的总体,适用于大样本情况。检验统计量为:•3.Moses极端反应检验•4.Wald-Wolfowitzruns游程检验•5.多样本K-W检验•6.中位数检验•7.多样本J-T检验12max12nnZDnn•独立样本非参数检验在SPSS18.0中的操作过程如下:•(1)打开或建立数据文件。10.8.2独立样本非参数检验的操作过程•(2)打开主对话框:选择“分析”“非参数检验”“独立样本”命令,打开“非参数检验:两个或更多独立样本”对话框,如图所示。•(3)确定目标•(4)选择检验字段•(5)选择检验方法•某学校调查了三个班的部分新生入学时的数学中考成绩,请试根据这三个班级部分学生的数学成绩判断这三个班级数学水平是否存在差异?•1.操作过程•2.结果分析10.8.3实例分析:班级成绩差异•在实际生活中经常要涉及配对数据,如病人在治疗前后的症状,学生在学习前后的学习效果等。在样本量较少且不清楚总体分布时无法直接使用参数检验,就需要使用相关样本非参数检验。10.9相关样本非参数检验•相关样本非参数检验是在总体分布不是太了解情况下,通过样本数据推断相关总体分布差异的检验方法。相关样本非参数检验一般用于对同一研究对象分布给予不同
本文标题:SPSS统计分析-第10章非参数检验
链接地址:https://www.777doc.com/doc-2860048 .html