您好,欢迎访问三七文档
SPSS应用统计主讲胡章明13535088511QQ:4619143412019/9/8广东青年职业学院胡章明1项目六:SPSS的非参数检验在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。SPSS中进行非参数检验由【Analyze(分析)】菜单中的【NonparametricTests(非参数检验)】菜单项导出。其中包括以下命令。●Chi-squaretest:卡方检验。●Binomialtest:二项分布检验。●Runstest:游程检验。●1-SimpleK-Stest:单样本K-S检验。●2IndependentSampletest:两个独立样本非参数检验。●KIndependentSamplestest:多个独立样本非参数检验。●2RelatedSampletest:两个相关样本非参数检验。●KRelatedSampletest:多个相关样本非参数检验。6.1非参数检验概述6.1.1非参数检验的提出非参数检验是不依赖总体分布的统计推断方法。它是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法一般不涉及总体参数而得名。这类方法的假定前提比参数假设检验方法少得多,也容易满足,适用于计量信息较弱的资料且计算方法也简便易行,所以在实际中有广泛的应用。6.1.2非参数检验的特点和参数方法相比,非参数检验方法的优势如下:(1)稳健性。因为对总体分布的约束条件大大放宽,不至于因为对统计中的假设过分理想化而无法切合实际情况,从而对个别偏离较大的数据不至于太敏感。(2)对数据的测量尺度无约束,对数据的要求也不严格,什么数据类型都可以做。(3)适用于小样本、无分布样本、数据污染样本、混杂样本等。表6-1参数检验和非参数检验的效率比较应用参数检验非参数检验对正态总体的非参数检验的效率评价配对样本数据两个独立样本多个独立样本相关随机性t检验或者z检验t检验或者z检验方差分析(F检验)线性相关无可用的参数检验符号检验Wilcoxon检验Wilcoxon检验K-W检验秩相关检验游程检验0.630.950.950.950.91没有可比较的基础6.2SPSS在卡方检验中的应用1.使用目的卡方检验(Chi-SquarTest)也称为卡方拟合优度检验,是K.Pearson给出的一种最常用的非参数检验方法。它用于检验观测数据是否与某种概率分布的理论数值相符合,进而推断观测数据是否是来自于该分布的样本的问题。2.基本原理进行卡方检验时,首先提出零假设:样本X来自的总体分布服从期望分布或某一理论分布。接着,利用实际观测值的频数与理论的期望频数之间的差异来构造检验统计量,它描述了观察值和理论值之间的偏离程度。3.软件使用方法SPSS会自动计算出χ2统计量及对应的相伴概率P值。0H6.2.2卡方检验的SPSS操作详解Step01:打开主菜单选择菜单栏中的【Analyze(分析)】→【NonparametricTests(非参数检验)】→【LegacyDialogs(旧对话框)】→【Chi-Square(卡方)】命令,弹出【Chi-SquareTest(卡方检验)】对话框。Step02:选择检验变量在【Chi-SquareTest(卡方检验)】对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【TestVariableList(检验变量列表)】列表框中,表示需要进行进行卡方检验的变量。Step03:确定检验范围在【ExpectedRange(期望全距)】选项组中可以确定检验值的范围,对应有两个单选项。Step04:选择期望值在【ExpectedValues(期望值)】选项组中可以指定期望值,对应有两个单选项。Step05:选择计算精确概率单击【Exact】按钮,弹出【ExactTests(精确检验)】对话框,该对话框用于选择计算概率P值的方法。Step06:其他选项选择单击【Options】按钮,弹出【Options(选项)】对话框,该对话框用于指定输出内容和关于缺失值的处理方法.Step07单击【OK】按钮,结束操作,SPSS软件自动输出结果。6.2.3实例图文分析:人员结构的调动1.实例内容某公司经营多年,形成了一套成熟的企业文化和管理体系,例如根据多年的运营经验,经理层、监察员、办事员三种职务类别人员比例大约在15:5:80为宜,这样运行效率最高。目前公司进行人事调整,公司人员结构发生变动,有员工担心是否人事调整已经导致职务类型比例的失调。请利用数据文件6-1.sav来解决该问题。三种职务的期望构成比为15%、5%和80%。而目前样本中观察到的三种职务的人数比为84:27:363,构成比分别是17.7%、5.7%和76.6%,和理论值有差异。那么这种差异是由随机误差造成的,还是真的构成比和以前有所变化?该问题就可以用χ2检验来实现。相应的假设检验如下。H0:目前三个职业的总体构成比仍然是15%、5%和80%。H1:目前三个职业的总体构成比不再是15%、5%和80%。Step01:打开对话框打开数据文件6-1.sav,选择菜单栏中的【Analyze(分析)】→【NonparametricTests(非参数检验)】→【LegacyDialogs(旧对话框)】→【Chi-Square(卡方)】命令,弹出【Chi-SquareTest(卡方检验)】对话框。其中,“jobcat”变量表示职业类型,“1”表示办事员,“2”表示监察员,“3”表示经理。Step02:选择检验变量在左侧的候选变量列表框中选择“jobcat”变量作为检验变量,将其添加至【TestVariableList(检验变量列表)】列表框中。Step03:选择期望值在【ExpectedValues(期望值)】选项组中点选【Values】单选钮,以指定期望概率值。接着在Values的文本框中分别输入0.8、0.05和0.15这三个数值,并且单击【Add】按钮加以确定。Step04:完成操作最后,单击【OK(确定)】按钮,操作完成。3实例结果及分析SPSS的结果报告中列出了期望频数和实际频数,显然残差值越小,说明实际频数与期望频数越接近。ObservedNExpectedNResidualClerical363379.2-16.2Custodial2723.73.3Manager8471.112.9Total474(1)频数表(2)卡方检验表具体包括统计量(Chi-Square)、自由度(df)和近似概率P值(Asymp.Sig.)。可见,统计量等于3.492,自由度等于2,对应的概率P值0.174大于显著性水平0.05。因此接受零假设,认为目前三个职业的总体构成比仍然是15%、5%和80%,人数的调动只是随机误差造成的,公司人员结构没有显著性改变。2c2cEmploymentCategoryChi-Square3.492adf2Asymp.Sig..1746.3SPSS在二项分布检验中的应用6.3.1二项分布检验的基本原理1.方法概述事件要服从二项分布,则应该具备下列基本的条件。(1)各观察单位只能具有相互对立的一种结果。(2)已知发生某一结果(阳性)的概率为π,其对立结果的概率为1-π。(3)n次试验在相同条件下进行,且各个观察单位的观察结果相互独立,即每个观察单位的观察结果不会影响到其他观察单位的结果。2.软件使用方法SPSS二项分布检验过程是推断总体的分布是否等于指定的某个二项分布。其假设检验过程如下。H0:样本来自的总体与某个指定的二项分布无显著性差异。H1:样本来自的总体与某个指定的二项分布有显著性差异。SPSS会自动计算出二项分布检验相应的检验统计量及对应的概率P值。如果概率P值小于或等于用户设定的显著性水平,则拒绝零假设,认为总体与某个指定的二项分布有显著性差异;相反的,如果概率P值大于显著性水平,则接受零假设。需要注意的是,二项分布检验过程要求变量必须是数值型的二元变量(只取两个可能值的变量)。假如变量是字符型的,可以使用重编码功能将其转化为数值型变量;假如变量不是二元变量,需要设置断点将数据分为两个部分,将大于断点值的归为一组,其余归为另一组。6.3.2二项分布检验的SPSS操作详解Step01:打开主菜单选择菜单栏中的【Analyze(分析)】→【NonparametricTests(非参数检验)】→【LegacyDialogs(旧对话框)】→【Binomial(二项式)】命令,弹出【BinomialTest(二项式检验)】对话框。Step02:选择检验变量在【BinomialTest(二项式检验)】对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【TestVariableList(检验变量列表)】列表框中,表示需要进行进行二项分布检验的变量。Step03:定义二元变量在【DefineDichotomy(定义二分法)】选项组中可以定义二元变量。Step04:指定检验概率值在【TestProportion(检验比例)】选项组中可以指定二项分布的检验概率值。系统默认的检验概率值是0.5,这意味着要检验的二项是服从均匀分布的。如果所要检验的二项分布不是同概率分布,参数框中要键入第一组变量所对应的检验概率值。Step05:选择计算精确概率【Exact】按钮用于选择计算概率P值的方法。Step06:其他选项选择【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step07:单击【OK】按钮,结束操作,SPSS软件自动输出结果。6.3.3实例图文分析:灯泡是否合格1.实例内容某灯泡厂生产的一种特制灯泡按照工艺技术标准的要求,其合格灯泡的寿命必须大于960小时。通常在生产稳定的时候,该厂的这种产品合格品率为95%,为检验产品质量,今从新生产的一大批产品中随机抽查了30只灯泡,测得它们的寿命的数据资料,试根据这些样品数据检验该批产品的合格率是否等于95%。10701073958958975969107996496894796297010549879679699671001994993108410129859949649529519879639572.实例操作Step01:打开对话框打开数据文件6-2.sav,选择菜单栏中的【Analyze(分析)】→【NonparametricTests(非参数检验)】→【LegacyDialogs(旧对话框)】→【Binomial(二项式)】命令,弹出【BinomialTest(二项式检验)】对话框。Step02:选择检验变量在左侧的候选变量列表框中选择“time”变量作为检验变量,将其添加至【TestVariableList(检验变量列表)】列表框中。Step03:定义二元变量在【DefineDichotomy(定义二分法)】选项组中点选【Cutpoint(割点)】,以指定断点。接着在其文本框中输入“960”,表示以它作为分界点将原始样本分为两组。Step04:指定检验概率值在【TestProportion(检验比例)】文本框中输入指定概率值“0.05”。Step05:描述性统计量输出单击【Options】按钮,弹出【Options(选项)】对话框。在【Statistics(统计量)】选项组中勾选【Descriptive(描述性)】和【Quartiles(四分位数)】复选框,表示输出基本统计量。再单击【Continue】按钮,返回【BinomialTest(二项式检验)】对话框。Step06:完成操作最后,单击【OK(确定)】按钮,操作完成。3.实例结果及分析(1)基本统计量SPSS首先输出了样本的描述性统计量表。这里共选择了30个灯泡寿命样本作二项分布检验,灯泡的平均寿命等于989.13小时,标准差等于40.968小时,灯泡寿命最小值等于947小时,寿命最大值等于1084小时。同时其25%、50%和75%
本文标题:项目六非参数检验
链接地址:https://www.777doc.com/doc-805864 .html