您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 第六章 SPSS参数检验
第六章SPSS参数检验与非参数检验第一节参数检验6.1参数检验概述6.1.1推断统计与假设检验推断统计是根据样本数据推断总体或样本数量特征的统计分析方法。推断统计通常包括以下两个内容:一是总体分布已知,根据样本数据对总体分布的统计参数(如均值、方差)进行推断,此时采用的推断方法称为参数估计或者参数检验;二是总体分布未知,根据样本数据对总体的分布形式进行推断,此时采用的推断方法称为非参数检验。6.1.2假设检验的基本思想1.事先对总体或样本参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立;2.采用逻辑上的反证法,依据统计上的小概率原理。6.1.3假设检验的步骤提出原假设(零假设)H0;确定适当的检验统计量;计算检验统计量的值发生的概率(P值);给定显著性水平;作出统计决策。6.2单样本的T检验6.2.1检验目的•检验单个变量的均值是否与给定的常数(总体均值)之间是否存在显著差异。如:分析学生的IQ平均分是否为100分;大学生考研率是否为5%。•要求样本来自的总体服从或近似服从正态分布。6.2.2单样本T检验的实现思路•提出原假设:•计算检验统计量和概率P值给定显著性水平与p值做比较:如果p值小于显著性水平,小概率事件在一次实验中发生,则我们应该拒绝原假设,反之就不能拒绝原假设。nSXt000:H6.2.3单样本T检验的基本操作步骤1、选择选项Analyze-Comparemeans-One-SamplesTtest,出现窗口:2、在TestValue框中输入检验值。3、单击Option按钮定义其他选项。Option选项用来指定缺失值的处理方法。其中,Excludecasesanalysisbyanalysis表示计算时涉及的变量上有缺失值,则剔除在该变量上为缺失值的个案;Excludecaseslistwise表示剔除所有在任意变量上含有缺失值的个案后再进行分析。可见,较第二种方式,第一种处理方式较充分地利用了样本数据。在后面的分析方法中,SPSS对缺失值的处理方法与此相同,不再赘述。另外,还可以输出默认95%的置信区间。至此,SPSS将自动计算t统计量和对应的概率p值。练习1.根据某省2010年25个旅游区的旅客增长率、旅游投资、资金来源、投资类型、经济增长率,分析该省2010年的旅游投资与2009年投资的均值1480是否有显著差异。2.根据各保险公司人员构成情况数据,对我国目前保险公司从业人员的受高等教育的程度和年轻化的程度进行推断:•保险公司具有高等教育水平的员工比例的平均值不低于0.8;•年轻人比例的平均值与0.5无显著差异。6.3两独立样本的T检验6.3.1两独立样本T检验的目的•独立样本是指两个样本之间彼此独立没有任何关联,两个独立样本各自接受相同的测量,研究者的主要目的是利用来自两个总体的独立样本,推断两个总体的均值是否存在显著性差异;•两独立样本的样本容量可以相等,也可以不相等;•样本来自的总体服从或近似服从正态分布。方差齐性检验(LeveneF方法):•计算两组样本的均值计算各个样本与本组均值的平均离差绝对值;利用单因素方差分析推断两独立总体平均离差绝对值是否有显著差异。在对两独立样本进行T检验时,两组样本方差相等和不等时使用的计算t值的公式不同,所以首先进行方差F检验。用户需要根据F检验的结果自己判断选择t检验输出中的哪个结果,得出最后结论。如果推断两总体方差相等则看方差相等的T检验值和P值,如果推断两总体方差不相等则看方差不相等的T检验值和P值。6.3.2两独立样本T检验的实现思路•提出原假设两总体均值不存在显著差异:计算统计量和P值:首先利用F检验确定两个总体的方差是否相等;然后再选择合适的T统计量计算观测值和概率P值;根据显著性水平和概率P值进行统计决策。021•6.3.3两独立样本t检验的基本操作步骤进行两独立样本t检验之前,正确地组织数据是一个非常关键的任务。SPSS要求将两组样本数据存放在一个SPSS变量中,同时,为区分哪些样本来自哪个总体,还应定义一个分类变量。SPSS两独立样本t检验的基本操作步骤是:1、选择菜单Analyze-Comparemeans-Independent-SamplesTTest,出现窗口2、选择检验变量到TestVariable(s)框中。3、选择总体标志变量到GroupingVariables框中。4、单击DefineGroups按钮定义两总体的标志值。其中:Usespecifiedvalues表示分别输入两个不同总体的变量值;Cutpoint框中应输入一个数字,大于等于该值的对应一个总体,小于该值的对应另一个总体。5、两独立样本t检验的Option选项含义与单样本t检验的相同。至此,SPSS会首先自动计算F统计量,并计算在两总体相等会不相等下的均值差的方差和t统计量的观测值以及各自对应的双尾概率p值。•6.3.4两独立样本t检验的应用举例例1:本地住户与外地住户家庭收入金额的均值比较目标1:利用居住状况调查数据,分析本地住户与外地住户家庭收入金额是否存在显著差异?分析:该问题中,由于本地住户与外地住户可以看成两个总体,且家庭收入金额可近似认为服从正态分布,且样本数据的获取是独立抽样的,因此,可以用两独立样本t检验的方法进行分析。零假设是本地住户与外地住户的家庭收入金额无显著差异,即目标2:利用居住状况调查数据,分析平均居住面积(以均值为界)不同的家庭收入金额是否存在显著差异?120例2:根据保险公司人员构成情况数据,分析全国性保险公司与外资和合资保险公司中具有高等教育水平员工比例的均值有无显著差异。例3:工作认可度与工作状态的分析利用某机构工作人员对自己工作环境看法的调查数据,借助项目分析法的核心思想,研究工作人员对自己工作环境的不同认可程度是否会影响工作时的态度。假设T3至T7表示工作人员对工作环境认知变量,T1和T2代表工作态度变量,对自己工作环境的综合得分计算,计算变量T3至T7的综合得分,T3至T7的权重分别为20%、20%、25%、20%、15%.按照综合得分进行分组,试分析低分组和高分组人群在变量T1和T2上是否存在显著差异。6.4两配对样本的T检验6.4.1两配对样本T检验的目的•一般用于同一研究对象(或两配对对象)分别给予两种不同处理的效果比较,以及同一研究对象(或两配对对象)处理前后的效果比较。前者推断两种效果有无差别,后者推断某种处理是否有效。•两配对样本的样本容量应该相等,两组样本观察值的顺序一一对应,不能随意改变;•样本来自的总体服从或近似服从正态分布。6.4.2两配对样本T检验的实现思路•提出原假设:两总体均值不存在显著差异;•选择检验统计量。两配对样本T检验是间接通过单样本T检验实现的。配对样本T检验实际上是先求出每对观测值之差值,对差值变量求平均。检验配对变量均值之间差异是否显著,实质是检验差值变量的均值与0之间差异的显著性;•计算样本统计量观测值和概率P值;•根据显著性水平和概率P值进行统计推断。6.4.3两配对样本t检验的基本操作步骤1、选择菜单Analyze-Comparemeans-Paired-SamplesTTest,出现窗口2、把一对或若干对检验变量选择到PairedVariables框。3、两配对样本t检验的Option选项含义与单样本t检验相同。至此,SPSS将自动计算t统计量和对应的概率p值。6.4.4两配对样本t检验的应用举例为研究某种减肥茶是否具有明显的减肥效果,某美体健身机构对35名肥胖志愿者进行了减肥跟踪调研。首先将其喝减肥茶以前的体重记录下来,三个月后再依次将这35名志愿者喝茶后的体重记录下来。通过这两组样本数据的对比分析,推断减肥茶是否具有明显的减肥作用。这里,体重可以近似认为服从正态分布。从样本数据的获取过程看,这两组样本是配对的,可借助两配对样本t检验的方法,通过检验喝茶前后体重的均值是否发生显著变化来确定减肥茶的减肥效果。第二节非参数检验样本所来自的总体分布难以用某种函数式来表达,还有一些资料的总体分布的函数式是未知的。只知道总体分布是连续型的或离散型的,解决这类问题的一种不依赖总体分布的具体形式的统计分法。出于这类方法不受总体参数的限制,放称非参数统计法,或称为不拘分布的统计分析方法,又称为无分布型式假定的统计分析方法:它检验的是分布,而不是参数。6.5卡方检验卡方检验法,也称为卡方拟合优度检验法,它是K.Pearson给出的一种最常用的非参数检验方法,用于检验观测数据是否与某种概率分布的理论数值相符合,进而推断观测数据是否是来自于该分布的样本的问题。检验实际观测值的频数(频率)与理论的期望颠数(频率)之间的差异是依据Pearson给出的服从卡方分布的检验统计量来测度的。对定序类变量的总体分布检验常采用卡方检验。例如根据掷骰子试验中出现的点数检验骰子是否均匀,即各点出现的概率是否均为1/6。6.5.1卡方检验的参数设置选择菜单“分析→非参数检验→旧对话框→卡方检验”。1.变量设置①检验变量列表选项栏:用于从列表框中选入检验变量,必须是数值型分类变量,若选入多个变量,则分别处理。②期望全距选项栏:用于设置检验变量取值的区间范围。从数据中获取:表示检验变量每个唯一的取值都作为一个类别,为系统默认选项;使用指定的范围:用户自定义,选中后则激活其下的“下限”、“上限”选择框。③期望值选项栏:用于设置待检验理论期望值的具体取值。所有类别相等:表示每个类别的期望取值都相等;值:用户自定义的期望值,输入期望值以后则激活其下的“添加”、“更改”、“删除”按钮。2.精确设置如图所示,单击“精确”按钮,则弹出如图所示对话框。仅渐进法:只计算近似概率;MonteCarlo:利用MonteCarlo方法计算精确概率,其下选项框用于自行设置置信区间和抽样次数;精确:在给定时间内计算精确概率值,如果超过给定时间则停止计算。3.选项设置单击“选项”按钮,则弹出如图所示对话框。统计量:输出统计量。描述性表示描述性统计量;还有四分位数。缺失值:缺失值处理方法。按检验排除个案表示对每一个检验变量来个别地排除缺失值;按列表排除个案表示凡含有缺失值的观测量全部从分析中排除。应用举例一周内各天心脏病猝死的比例近似为2.8:1:1:1:1:1:1,根据文件“心脏病猝死”推断其总体分布是否与理论分布吻合。6.6二项分布检验二项分布即指数理统计的0—1分布。spss提供的二项检验过程用于对二元变量的两个分类的观测频数与某个具有确定的概率参数的二项分布的期望频数进行比较的假设检验问题。例如从某家工厂的成品中随机地抽查200件产品,结果发现15件废品,据此检验该厂全部产品的废品率是行为5%?二项检验过程要求检验变量必须是数值型的二元变量(只取两个变量值的变量)。假如变量是字符型的,可以通过AutomaticRecodeprocedure(自动赋值过程)将共转换为数值型变量;假如变量不是二元变量,需要设置断点将数据分为构部分,将大于断点值的归为一组,其余归为一组。6.6二项分布检验6.6.1二项分布检验的参数设置选择菜单“分析→非参数检验→旧对话框→二项式”。①变量选择:如图中左上角为待变量列表。检验变量列表:检验变量选项框,用于放置检验变量,可以选入多个检验变量。定义二分法:定义二元变量选项框,当检验变量已经是二元变量时,选择“从数据中获取”选项;当检验变量不是二元变量时,则选择“割点”选项,并在其后的空白栏内输入断点值。检验比例:用于指定检验的零假设。系统默认为0.50。②精确设置:与卡方检验设置对话框一致。③选项设置:与卡方检验设置对话框一致。6.6.2实例分析根据文件“产品合格率”可知,从某批产品中随机抽取23个样品进行检测到的数据,用1表示一级品,用0表示非一级品,检验该批产品的以及频率是否为90%。6.7游程检验单样本变量值的随机性检验是对某变量的取值出现是否随机进行检验,也称为游程检验(Run过程)。单样本变量值的随机性检验是由Wald提出的,它的零假设
本文标题:第六章 SPSS参数检验
链接地址:https://www.777doc.com/doc-3994690 .html