您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 4第四章-描述统计分析
SPSS23.0统计分析——在心理学与教育学中的应用2016-8-4第四章描述统计分析全书目录第一章SPSS23.0简介与基本操作第二章数据编辑与整理第三章数据转换第四章描述统计分析第五章交叉表分析第六章比较平均值第七章方差分析第八章相关分析第九章回归分析第十章信度和效度分析第十一章非参数检验第十二章多选变量分析第十三章SPSS应用案例——问卷调查分析第十四章SPSS应用案例——测验质量分析第十五章探索性因子分析及案例应用第十六章基本统计图表的制作第十七章SPSS应用分析归纳小结第四章描述统计分析第四章描述统计分析从第四章开始讲解【分析】菜单命令下的数据分析方法,点击【分析】菜单命令下拉子菜单。包括:【报告】,【描述统计】,【定制表】,【比较平均值】,【一般线性模型】,【广义线性模型】,【混合模型】,【相关】,【回归】,【对数线性】,【神经网络】,【分类】,【降维】,【标度】,【非参数检验】,【时间序列预测】,【生存分析】,【多重响应】,【缺失值分析】,【多重插补】,【复杂抽样】,【质量控制】,【ROC曲线图】,【时间和空间建模】。第一节频数分析第二节描述分析第三节探索分析第四节P-P图第五节SPSS表格处理:三线表的制作第四章描述统计分析第四章描述统计分析统计分析往往是从了解数据的基本特征开始的。描述数据分布特征的统计量可分为两类:一类表示变量的中心位置,另一类表示变量的变异程度(或称离散程度),两者相互补充,共同反映数据的全貌。通过【分析】【描述统计】菜单中的过程来完成描述统计分析。描述统计分析(DescriptiveStatistics)包括子菜单:【频率】、【描述】、【探索】、【交叉表】、【PP图】等。【交叉表】涉及到卡方检验、品质相关检验等,本书将交叉表分析及其检验分析方法作为第五章进行讲述。第一节频数分析频率分布分析主要通过频率分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。案例:【例4-1】试对某一次测验的测验总分进行频率分析,描述测验分数的分布表,以及累计百分比表,并绘制分数分布直方图。第1步:打开分析数据。打开“测验数据文件.sav”文件。第2步:启动分析过程。点击【分析】【描述统计】【频率】菜单命令。第3步:设置分析变量。从左边的源变量框里选择一个和多个变量进入右边的“变量:”框里。在本例中选“总分”变量进入“变量:”框。第4步:输出频率分布表。在主界面中“显示频率表”,系统默认为选中显示,在本例中也选中。第5步:设置输出的统计量。第6步:统计图形输出设置。如果某一变量为连续性的变量,则可以选择直方图;如果某一变量为离散型的变量,只有少量的变化值,则选择饼图、条形图。第7步:设置频率表格式。第8步:点击【确定】,提交执行。第9步:结果分析。第一个表:统计量在此表中列出的信息有:有效观察值有810个,缺失值0个,平均数62.25,标准差18.751。以及百分位27所对应50分,百分位72所对应74分。第二个表:频率表第三个图:频率分布的条形图图中的右边标明了标准差、平均数、样本量。此图就表明,这批数据基本接近正态分布曲线。【思考题】在智力测验分析中,往往根据分数将智力分为几个等级,然后再统计报告各个智力等级的人数,如下表所示(在下表的数据仅为参考,实际统计数字以数据文件的统计结果为准)。以“智力测验分数.sav”文件为例,在SPSS中如何实现如下分析结果?第四章描述统计分析第一节频数分析第二节描述分析第三节探索分析第四节P-P图第五节SPSS表格处理:三线表的制作第二节描述分析描述统计分析(Descriptives)过程是对变量进行描述统计分析,包括计算集中趋势、离散趋势、分布等统计指标,而且可将原始数据转换成标准Z分值并存入数据集中。所谓Z分值是指某原始数值比其均值高或低多少个标准差,高时为正值,低时为负值,相等时为零。案例:【例4-2】试对某一次测验的测验总分进行分析,描述该测验分数的基本描述信息,以及将每个被试的分数转化为标准化分数。第1步:打开分析数据。打开“测验数据文件.sav”文件。第2步:启动分析过程。点击【分析】【描述统计】【描述】菜单命令,打开如图所示的对话框。第3步:设置分析变量。从左边的源变量框里选择一个和多个变量进入右边的“变量:”框里。在本例中选“总分”、“智商分数”变量进入“变量:”框。选中“□将标准化值另存为变量”复选框,将计算该变量的z值并保存结果到当前数据集中。第4步:选定统计分析选项。单击【选项】按钮,打开图所示的对话框,该对话框用于选择统计量:集中趋势的统计量:第一个框:离散第二个框:分布第5步:点击【确定】按钮,提交执行。SPSS在输出窗口的输出结果。第6步:结果分析。第一个表:统计量在原数据集最右边,多了一列数据“Z智商分数”、“Z总分”,分别是智商分数、总分的z分数,如下图所示:第四章描述统计分析第一节频数分析第二节描述分析第三节探索分析第四节P-P图第五节SPSS表格处理:三线表的制作第三节探索分析调用探索性分析过程可对变量的分布进行更为深入详尽的描述性分析。它在一般描述统计指标的基础上,增加观察数据的分布描述、发现数据是否有异常值或极值,以及有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案。案例:【例4-3】试对10岁少儿的智力测验分数进行探索分析,对该测验分数进行正态分布检验、分析茎叶图。第1步:打开分析数据。打开“10岁少儿的智力测验分数.sav”文件。第2步:启动分析过程。点击【分析】【描述统计】【探索】命令,打开如图所示的对话框。第3步:统计量选择。点击【统计】按钮,弹出“探索:统计量”对话框□描述:输出均数、中位数、众数、5%修正均数、标准误、方差、标准差、最小值、最大值、范围、四分位全距、峰度系数、峰度系数的标准误、偏度系数、偏度系数的标准误;□M-估计量:作中心趋势的粗略最大似然确定,输出四个不同权重的最大似然确定数;□离群值:输出五个最大值与五个最小值;□百分位数:输出第5%、10%、25%、50%、75%、90%、95%位数;本例以上四个复选框全部选择第4步:设置绘图。点击【图】按钮,弹出“探索:图”对话框。在“描述”栏内,同时选择“茎叶图”、“直方图”两个复选框,要求作茎叶描述,以及直方图显示。同时,选择“含检验的正态图”。第5步:设置选项。点击【选项】按钮,弹出“探索:选项”对话框。第6步:在主对话框中点击【确定】按钮。SPSS在输出窗口的输出结果。第7步:结果分析。第一个统计表:个案处理摘要(略)第二个统计表:描述统计表。在该表中,性别变量分男、女分别输出均数为、中位数、方差、标准差、极小值、极大值、全距、四分位距、偏度、峰度等一些统计量。通过此表,能较全面的反映数据的集中趋势、离散趋势。第三个统计表:M-估计输出四个不同权重下作中心趋势的粗略最大似然确定数,对于伴有长拖尾的对称分布数据或带有个别极端数值的数据,用粗略最大似然确定数替代均数或中位数,结果更准确。第四个统计表:输出百分位数。有两种计算方式:加权平均、图基枢纽。计算的百分位数能较好分析数据的百分位参照点。第五个统计表:输出极值。按男、女分组,分别输出最大五个数和最小五个数。第六个统计表:正态性检验。(1)柯尔莫戈洛夫-斯米诺夫的检验所对应的显著性水平sig为0.200,大于0.05,接受原假设,即男生、女生的智力测验分数服从正态分布(2)夏皮洛-威尔克的检验所对应的显著性水平sig为0.368,和0.598,大于0.05,接受原假设,即男生、女生的智力测验分数服从正态分布第七个统计图:直方图。(省略)第八个统计图:茎叶图。茎叶图描述,在男孩的智力测验分数的茎叶图中的第二行,频率是数量为1,也就是有1个数值,茎(Stem)为8,叶(Leaf)为5,其实该数值是85;第三行,频率是数量为5,有5个数值是茎为9,叶为16889,其实这5个数值是91、96、98、98、99。其余数据依此类推。第九个统计图:正态Q-Q图。Q-Q图是用变量数据分布的分位数与所指定分布的分位数之间的关系曲线来进行检验的。这里是与正态分布进行检验,因而称为正态Q-Q图。原假设H0:一个变量的数据服从正态分布,正态Q-Q图将是一条直线。当性别为男时,正态Q-Q图中的点都是在直线附近,也就是说,智力测验分数服从正态分布的假设可以接受。当性别为女时,正态Q-Q图中的点也都是在直线附近,也就是说,智力测验分数服从正态分布的假设可以接受。去趋势,也就是实测数据值距离正态期望值的偏差,当性别为男时,去趋势正态Q-Q图中的点也都是在0.00附近(只有一个点比较大,为0.9;大部分点都在0.25以内),可以反映实测数据值与正态期望值的具体差距情况。当性别为女时,去趋势正态Q-Q图中的点也都是在0.00附近(相对于性别男来说,有多个点大于0.25)。第十个统计图:箱图。图中方箱为四分位数的箱图,中心粗线为中位数(50%百分位的观察值),箱图的上线、下线为(25%、75%百分位的观察值),外部的两端线为最大值与最小值。第四节P-P图P-P图通过变量分布累计比与某一分布累计比生成的图形。通过P-P图可以检验数据是否符合指定的分布。原假设H0为:观察变量的数据完全符合指定分布时,P-P图中各点近似呈一条直线。如果P-P图中各个观测点不呈直线,但有一定规律,可以对变量数据进行转换,使转换后的数据更接近指定分布或另外指定的分布。Q-Q图同样可以用于检验数据的分布,其检验效果是一样的。所不同的是,Q-Q图是用变量数据分布的分位数与所指定分布的分位数之间的关系曲线来进行检验的。在本章中仅介绍P-P图。案例:【例4-4】试对某一次测验的测验分数对该测验分数进行正态分布图形描述。第1步:打开分析数据。打开“测验数据文件.sav”文件。第2步:启动分析过程。点击【分析】【描述统计】【P-P图】】菜单,打开对话框。第3步:设置分析变量。从左边的变量列表,通过单击向右按钮可选择“总分”变量进入“变量”(Variables)列表框中。当然,可以同时选择多个变量,本例中仅选择一个。第4步:设置分析参数。在对话框的“转换(Transform)”栏:“自然对数转换”,对当前变量的数据取自然对数,即将原有变量转换成以自然数e为底的对数变量。“将值标准化”,将当前变量的数据转换为标准值,即转换后变量数据的均值为0,方差为1。“差异”,对当前变量的数据进行差分转换,即利用变量中连续数据之间的差值来转换数据。选择此项以后,后面的文本框变为可用,在其中输入一个正整数,以确定转换的差分度,默认值为1。“季节性差异”,用于确定指明计算时间序列的季节差分。只有在对当前变量的数据序列定义了周期以后才可用,如果当前周期为0,将不能计算季节差分。需要注意的是,这些数据转换并不改变变量中的变量值,只影响正态概率图。检验分布栏:可选择不同的分布类型,检验变量数据是否符合所选分布。单击选项分布栏下的箭头可选择不同的分布类型。SPSS默认的检验分布是正态,即正态分布(Normal)。P-P图可检验的分布还包括:拉布拉斯分布、Logistic分布、对数正态分布、正态分布、学生t分布、均匀分布、威布尔分布、帕累托分布等等分布。在选择某一分布时,“自由度”的复选框变亮:在该文本框中输入正整数,表示所选分布的自由度。在分布参数栏:在该栏中可输入所选分布类型的参数,选择的分布不同,参数输入窗口也不同。“根据数据估算”:为系统默认选项。选择此项,系统将自动从数据中推测数据分布的参数,否则就要在该选项下方的参数框中根据需要自行指定。在“比例估算公式”栏(单选项组):按系统默认方式。在“分配给绑定值的秩”栏(单选项组),也按系统默认方式。第5步:在主对话框中点击【确定】按钮,提交执行。SPSS在
本文标题:4第四章-描述统计分析
链接地址:https://www.777doc.com/doc-7884707 .html