您好,欢迎访问三七文档
SPSS23.0统计分析——在心理学与教育学中的应用2021/1/5第五章交叉表分析全书目录第一章SPSS23.0简介与基本操作第二章数据编辑与整理第三章数据转换第四章描述统计分析第五章交叉表分析第六章比较平均值第七章方差分析第八章相关分析第九章回归分析第五章交叉表分析第一节交叉表格的独立性检验及效应量计算第二节分层交叉表的独立性检验第三节一致性卡方检验第四节列联表的品质相关分析第五节交叉表格分析的报告参考样例交叉表是指两个或多个分类变量各水平的频数分布表,又称频数交叉表,列联表。本章交叉表分析过程,既可以对数据进行汇总,也可以包括了独立性卡方检验、品质相关性检验(Phi相关检验)。卡方检验、Phi相关检验是分析交叉表资料常用的假设检验方法,这两类分析处理的数据都是属于类别数据(名义变量数据)。一、独立性检验:是指两个或两个以上的分类变量之间是相互独立的或者是相互联系的假设检验。独立性检验,在有些研究中也称为同质性检验。原假设为:所观测的两个分类变量之间没有关联。备择假设为:所观测的两个分类变量之间有关联,或存在相关。二、品质相关性检验:是指两个或两个以上的分类变量(顺序变量)之间相关性程度的假设检验。原假设为:所观测的两个分类变量之间的相关性为0。备择假设为:所观测的两个分类变量之间的相关性显著。第一节交叉表格的独立性检验及效应量计算一般交叉表分析使用的数据形式有两种情况:①第一种情况是已整理的汇总表数据;②第二种情况是对原始数据进行交叉表分析。以下分别举例。交叉表分析的类型变量水平无论是2*2,还是R*C(R2,C2),都是使用相同的SPSS菜单命令。5.1.1汇总表数据的交叉表分析及效应量计算案例【例5-1】探讨慢性胃病的影响因素,研究者调查了339人,得到调查数据初步汇总情况如下:患慢性胃病未患慢性胃病精神焦虑患者43162非精神焦虑患者13121SPSS操作步骤如下:第1步:输入数据。怎样将实际问题中的数据准确转化、表达为SPSS中的数据,也是SPSS学习过程中需要注意学习的一个方面,这是由实际问题到数据处理、研究分析的一个“桥梁”。在本例中,需要定义两个变量“焦虑情况”,“患胃病情况”;变量“焦虑情况”有两个水平:1为精神焦虑,2为非精神焦虑;“患胃病情况”有两个水平:1为患病,2为不患病;变量“人数”为计数频数。第2步:进行人数加权。在单击菜单命令【数据】【个案加权】,打开【个案加权】对话框。第3步:启动分析过程。点击菜单【分析】【描述统计】【交叉表】菜单命令第4步:设置分析变量。选择“焦虑情况”变量选入“行:”变量框中。选择“患胃病情况”变量选入“列:”变量框中。第5步:输出复式条形图和分布表。选中“显示簇状条形图”复选框。第6步:统计量选择。点击【统计】按钮,弹出“交叉表:统计”的对话框第7步:设置交叉表的显示。第8步:设置输出格式。第9步:在主对话框中点击【确定】按钮,提交执行。第10步:结果分析。第一个表格:统计摘要表。(略)第二个表格:精神焦虑与患胃病情况的交叉表。第三个表格:卡方检验。从表中可看出,皮尔逊卡方检验的卡方值为7.469,显著值Sig值为0.0060.05,应拒绝原假设,即认为精神焦虑与患慢性胃病是不独立的,两变量之间存在着关联。第四个表格:对称测量计算皮尔逊卡方检验的卡方值的效应量和统计检验力,其统计原理与计算公式可参见参考胡竹菁《心理统计学》的第十一章第三节(胡竹菁.心理统计学.2010年,第1版.北京:高等教育出版社)。第三步:根据克莱姆V系数值的大小和自由度查表确定克莱姆V系数的统计检验力。在本例中,由前面计算的效应量,和第二步查询评定表的结果,可知卡方检验为小效应量,总自由度为(2-1)*(2-1)=1,总体N为339,查询表5-3统计检验力表,可知统计检验力为大约0.29,也就是说,本例中精神焦虑与患慢性胃病这两个变量之间存在着关联,其可能性为29%左右。总之,在本例中,统计量检验显著(P小于0.05,拒绝原假设),并且是小效应量。此时说明统计结论的可靠性较低,还需进一步的研究资料佐证此结论,研究结果推广时要慎重。第四个表格:风险评估。[分析]:比值比(OR值)为2.471,也就是说,在精神焦虑的人群患胃病是非精神焦虑时的2.471倍。2.471可由表中2.162/0.875。5.1.2原始数据的交叉表分析及效应量计算案例:【例5-2】这里以“大学生学习与消费调查问卷.sav”的数据为例,分析大学生的男女性别与英语四级通过情况、考研意向(考研、不考研、暂未定)、消费观念倾向水平(分为高、中、低三个等级)变量之间是否有关联?SPSS操作步骤如下:第1步:打开分析数据。打开“大学生学习与消费调查问卷.sav”文件。第2步:启动分析过程。点击【分析】【描述统计】【交叉表】菜单命令.第3步:设置分析变量。第4步:输出复式条形图和分布表。选中“显示簇状条形图”复选框。第5步:统计量选择。点击【统计】按钮,弹出“交叉表:统计”的对话框。本例选中“卡方”,表示将进行卡方检验分析。其他复选框都不选择。第6步:设置交叉表的显示。点击【单元格】按钮,弹出“交叉表:单元显示”的对话框。在“计算”栏内:在本例中,选中“实测”、“期望”。在“百分比”栏内:选中“行”。其他复选框在本例中,均不选择。第7步:设置输出格式。第8步:点击【确定】按钮,提交执行。第9步:结果分析。第一个表格:统计摘要表。(略)第二个表格:性别与英语四级的交叉表第三个表格:性别与英语四级的卡方检验表。皮尔逊卡方检验的卡方值为22.292,显著值Sig值为0.0000.05,应拒绝原假设,即认为性别与英语四级通过情况之间不独立的,两变量之间存在着关联。换句话说,男女性别在英语四级通过情况上存在差异,结合前面的交叉表的计数人数,认为女生在四级通过人数比例远远大于男生,而未通过的人数比例小于男生。计算性别与英语四级的卡方值的效应量和统计检验力。第一步:效应量克莱姆V系数为0.279。第二步:根据Cohen(1992)对克莱姆V系数效应量大小的评定表(查询表5-2),效应量0.279,很接近0.30,为中效应量。第三步:根据克莱姆V系数值的大小和自由度查表确定统计检验力。这里卡方检验为中效应量,总自由度为(2-1)*(2-1)=1,总体N为286,查询表5-3统计检验力表,可知统计检验力为大约0.99,即99%左右。由以上计算可知,在本例中,统计量检验显著(P小于0.05,拒绝原假设),并且是中效应量。此时说明统计结论(拒绝原假设的结论)的可靠性尚可,基本可以认同此结论(拒绝原假设)第四个表格:交叉表(省略)。第五个表格:性别与考研意向类型的卡方检验表。[分析]:在性别与考研意向类型的卡方检验表中,皮尔逊卡方检验的卡方值为2.857,显著值Sig值为0.2400.05,接受原假设,即性别与考研意向类型之间是独立的,两变量之间不存在着关联。换句话说,男女性别在考研意向上不存在差异。计算性别与消费倾向类型的卡方值的效应量和统计检验力。第一步:效应量克莱姆V系数为0.10。第二步:根据Cohen(1992)对克莱姆V系数值效应量大小的评定表(查询表5-2),本例中更小自由度为1,在该评定表中的第一行中查找,克莱姆V系数等于0.10,也就是说,为小效应量。此时统计检验力则不需要查询。由以上计算可知,本例的统计量检验不显著(P大于0.05,接受原假设),并且是小效应量。此时可以认同此统计结论(接受原假设),在此情境下不需要进一步探讨研究。第六个表格:性别与消费倾向类型的交叉表。(省略)第七个表格:性别与消费倾向类型的卡方检验表。(省略)具体分析,由同学们思考。【思考题】在实际应用中,大部分测量数据都是获得原始数据,即获得每个作答的具体信息,在SPSS录入的数据集中,一个被试占一行记录。当然,有时也会获得的是计数数据,例如统计满意度调查,或者简要汇总某些教育信息时。无论是原始数据、还是汇总数据,最后所得的卡方检验结果是一样的。不同的是,汇总数据在SPSS操作时,需要对“人数”等变量进行加权。由【例5-1】的原始资料录入为原始数据文件“精神焦虑与慢性胃病的调查原始信息数据.sav”,在SPSS中一行代表一个被试记录,请对原始数据文件分析精神焦虑与慢性胃病是否存在联系;并与【例5-1】的分析结果对比,比较两种情况下的统计结果是否有差异。第五章交叉表分析第一节交叉表格的独立性检验及效应量计算第二节分层交叉表的独立性检验第三节一致性卡方检验第四节列联表的品质相关分析第五节交叉表格分析的报告参考样例第二节分层交叉表的独立性检验分层交叉表分析也可称为分层卡方分析,分层卡方检验是把对象分解成不同的层次,每层分别研究检验行变量与列变量的独立性。如果分层卡方分析的分层变量在几个分层之间的分布不均,既可能削弱了原本存在的行变量与列变量之间的关系,也可能使得原本不存在关系的两个变量的关系呈现统计学显著性存在关系。因此有利有弊。为了避免分层卡方分析带来的误差,分层卡方分析往往需要大样本数据。用于分层的变量往往是性别、年级、职业、地区等人口学变量。案例:【例5-3】为了解大学生的专业承诺、与大学生的学习兴趣、学习成绩之间的关系,通过问卷调查获得了数据文件“专业承诺与学习兴趣、学习成绩的关系.sav”。考虑的男女性别可能有差异,性别可能是一个额外变量或控制变量,因此将性别变量作为分层变量。第1步:打开分析数据。打开“专业承诺与学习兴趣、学习成绩的关系.sav”文件。第2步:启动分析过程。点击【分析】【描述统计】【交叉表】菜单命令。第3步:设置分析变量。选择“专业承诺”变量选入“行:”变量框中。选择“学习兴趣”、“学习成绩”变量选入“列:”变量框中。此外,在“层1的1”框内,将性别变量从左边选择到分层变量框内。第4步:统计量选择。点击【统计】按钮,弹出“交叉表:统计”的对话框。本例选中“卡方”复选框,,“柯克兰和曼特尔-亨塞尔统计”,其他复选框都不选择。第5步:设置交叉表的显示。点击【单元格】按钮,弹出“交叉表:单元显示”的对话框。在“计算”栏内:在本例中,选中“实测”。其他复选框在本例中,均不选择。第6步:设置输出格式。点击【格式】按钮,弹出对话框。在本例中,按系统默认选择“⊙升序”。第7步:在主对话框中点击【确定】按钮。第8步:结果分析。。第二个表格:专业承诺*学习兴趣*性别的交叉表。第三个表格:专业承诺*学习兴趣*性别的卡方检验表第四个表格:对称测量表中“总计”所对应的卡方检验值,也就是未分层前的卡方检验值。由结果可知,在“性别”=女、“性别”=男、总计三个栏目上的卡方值分别为15.479、35.371、51.591,所对应的概率分别为0.000、0.000、0.000,都小于0.05,拒绝原假设,即在性别各个层次上,专业承诺与学习兴趣两个变量存在着关联,换句话说,无论是男性、还是女性,专业承诺与学习兴趣存在紧密的联系。计算效应量和统计检验力。第一步:“性别”=女、“性别”=男、总计三个栏目的效应量克莱姆V系数分别为:0.321,0.481,0.413。第二步:根据Cohen(1992)对克莱姆V系数效应量大小的评定表(查询本书的表5-2),本例中更小自由度为1,在该评定表中的第一行中查找,“性别”=女、“性别”=男、总计的克莱姆V系数都介于0.3与0.5之间,为中效应量。第三步:克莱姆V系数的大小和自由度查表确定统计检验力。在本例中,性别”=女、“性别”=男、总计三个栏目的自由度都为(2-1)*(2-1)=1,人数N分别为150,153,303,查询表5-3统计检验力表,并根据表中的已有数据使用线性插值方法计算,可得统计检验力分别为0.92,0.92,0.99,也就是说,男性、女性,以及总体上的专业承诺与学习兴趣存在紧密的联系,其可能性分别为92%,92%
本文标题:5第五章交叉表分析
链接地址:https://www.777doc.com/doc-7372201 .html