您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 用spss作基本统计分析
SPSS基本统计分析有了数据,可以利用SPSS的各种分析方法进行分析,但选择何种统计分析方法,即调用哪个统计分析过程,是得到正确分析结果的关键。SPSS有数字分析和作图分析两类方法SPSS统计分析功能概述SPSS数值分析过程SPSS数值统计分析过程均在Analyze菜单中,包括:a、基本统计分析:Reports,DescriptiveStatisticsb、均值比较与检验:CompareMeansc、方差分析:ANOVAModelsd、相关分析:Correlatee、回归分析:Regressionf、聚类与判别:Classifyg、因子分析:DataReductionh、非参数检验:NonparametricTests等等基本统计分析概述基本统计分析是进行其他更深入的统计分析的前提,通过基本统计分析,用户可以对分析数据的总体特征有比较准确的把握,从而选择更为深入的分析方法对分析对象进行研究。在SPSS的Analyze菜单中包括了一系列统计分析过程。其中Reports和DescriptiveStatistics命令项中包括的功能是对单变量的描述统计分析。DescriptiveStatistics包括的统计功能有:Frequencies:频数分析Descriptives:描述统计量分析Explore:探索分析Crosstabs:多维频数分布交叉表(列联表)Reports包括的统计功能有:OLAPCubes:OLAP报告摘要表CaseSummaries:观测量列表ReportSummariesinRow:行形式输出报告ReportSummariesinColumns:列形式输出报告第5章SPSS基本统计分析SPSS统计分析功能概述SPSS数值分析过程基本统计分析概述5.1案例说明5.2计算基本描述统计量5.3变量的频数统计5.4交叉分组下的频数分析5.5多选项分析案例说明◆1999年全国普通高等学校人文社会科学活动人员情况◆居民储蓄调查数据第5章SPSS基本统计分析SPSS统计分析功能概述SPSS数值分析过程基本统计分析概述5.1案例说明5.2计算基本描述统计量5.3变量的频数统计5.4交叉分组下的频数分析5.5多选项分析基本描述统计量集中趋势分析:①均值:一组数据的简单算术平均数或加权算术平均数。适合于正态分布或对成分布资料;②中位数:将数据排序后位于正中间的数值。适合于所有分布类型的数据;③众数:出现频率最高的数。离散趋势分析①极差:数据最大值减去最小值,最简单的离散程度测度值②标准差、方差:最常用的离散程度测侧度值,一般适合于正态分布资料③最小值、最大值④标准误:样本平均数的标准差偏度、峰度测量①偏度系数:Skewness②峰度系数:Kurtosis计算基本描述统计量的基本操作步骤:1.菜单:Analyze→Descriptive→Statistics→Descriptive2.将若干频数分析变量选择到Variables框中例:对案例1分析99年人员在各学科上的平均投入情况及差异情况分组计算描述统计量数据拆分:数据拆分与数据排序很相似,但也有一个重要的不同点,即数据拆分不仅是按指定变量进行简单排序,更重要的是根据变量对数据进行分组,为以后所进行的分组统计分析提供便利。1.菜单:Data→SplitFile2.选择拆分变量到GroupsBasedon框中3.选择结果的输出方式4.选择是否需要对拆分变量进行排序例:对不同职称的职工,分析工资收入情况。第5章SPSS基本统计分析SPSS统计分析功能概述SPSS数值分析过程基本统计分析概述5.1案例说明5.2计算基本描述统计量5.3变量的频数统计5.4交叉分组下的频数分析5.5多选项分析变量的频数统计(一维)利用频数分布表可以方便地对数据按组进行归类整理,形成各变量的不同水平(分组)的频数分布表何图形,以便对各变量的数据特征何观测量分布状况有一个概括的认识。例如,在问卷数据分析中,通常应首先对本次调查的被调查者的状况,如被访者的总人数、年龄特点、职业特点、性别特征等进行分析和总结,通过这些分析,能够在一定程度上反映样本是否具有总体代表性,并以此证明以后相关问题分析的代表性和可信性。这些可以通过频数分析来实现。频数分析的基本操作步骤:1.菜单:Analyze→Descriptive→Statistics→Frequencies2.将若干频数分析变量选择到Variables框中3.单击Statistics,选择其他基本描述统计量;单击Charts,选择绘制统计图形;单击Format,对频数分布表的格式进行调整应用举例利用居民储蓄调查数据进行频数分析,达到两个分析目标:1、分析储户的户口和职业的基本情况。2、分析储户一次存(取)款金额的分布,并对城镇储户和农村储户进行比较。储户户口和职业基本情况的分析该分析的特点是:◆涉及的两个变量均是名义水准的变量◆可通过基本频数分析实现◆职业变量的取值数目较多,为使频数分布表更一目了然,应对内容的输出顺序进行调整。储户一次存(取)款金额的分布分析该分析的特点是:◆涉及的变量是定距型变量◆需要分别对城镇和农村户口的储户进行分析◆利用频数分析的扩展功能进行分析分析思路:◆由于存(取)款金额是定距型变量,直接采用频数分布不利于对其分布形态的把握,因此考虑对数据分组后再编制频数分布表。◆进行数据拆分,分别计算城镇储户和农村储户的一次存(取)款金额的四分位数,并通过四分位数比较两者分布上的差异。储户一次存(取)款金额的分布分析分析过程:◆数据分组。将存(取)款金额重新分成五组。五组的区间分别为:少于500元、500~2000元、2000~3500元、3500~5000元、5000元以上。进行频数分析并绘制带正态曲线的直方图。◆利用频数分析计算所有样本的存(取)款金额的四分位数,然后,按照户口类型对数据进行拆分(Splitfile)并重新计算分位数,分别得到城镇户口和农村户口存(取)款金额的四分位数。第5章SPSS基本统计分析SPSS统计分析功能概述SPSS数值分析过程基本统计分析概述5.1案例说明5.2计算基本描述统计量5.3变量的频数统计5.4交叉分组下的频数分析5.5多选项分析交叉分组下的频数分析目的和基本任务通过频数分析能够掌握单个变量的数据分布情况。实际分析中,不仅要了解单变量的分布特征,还要分析多个变量不同取值下的分布,掌握多变量的联合分布特征,进而分析变量之间的相互影响和关系。交叉分组下的频数分析目的和基本任务例如,对居民储蓄问题的分析,通过频数分析能够了解储户的基本情况以及他们对所调查问题的总体看法。如果进一步需要掌握不同特征的储户群(不同户口、职业)对调查问题的态度,并希望分析储户特征和所调查问题之间是否存在一定的关联性时,频数分布就显得力不从心,因为它涉及两个或两个以上的变量。对此,通常利用交叉分组下的频数分析来完成。交叉分组下的频数分析目的和基本任务两大基本任务:第一,根据收集到的样本数据,产生二维或多维交叉列联表;第二,在交叉列联表的基础之上,对两两变量间是否存在一定的相关性进行分析。交叉分组下的频数分析交叉列联表的主要内容编制交叉列连表是交叉分组下频数分析的第一个任务。交叉列联表是两个或两个以上的变量交叉分组后形成的频数分布表。户口*什么合算Crosstabulation1138720056.5%43.5%100.0%65.7%79.1%70.9%59238272.0%28.0%100.0%34.3%20.9%29.1%17211028261.0%39.0%100.0%100.0%100.0%100.0%Count%within户口%within什么合算Count%within户口%within什么合算Count%within户口%within什么合算城镇户口农村户口户口Total买东西存钱什么合算Total交叉分组下的频数分析户口*什么合算Crosstabulation1138720056.5%43.5%100.0%65.7%79.1%70.9%59238272.0%28.0%100.0%34.3%20.9%29.1%17211028261.0%39.0%100.0%100.0%100.0%100.0%Count%within户口%within什么合算Count%within户口%within什么合算Count%within户口%within什么合算城镇户口农村户口户口Total买东西存钱什么合算Total这是一张涉及两变量的二维交叉列联表,反映了不同户口的储户对储蓄是否合算的不同看法。表中的户口变量称为行变量,什么合算称为列变量。行标题和列标题分别是两个变量的变量值(或分组值)。表格中间是观测频数和各种百分比。交叉分组下的频数分析的基本操作步骤:1.菜单:Analyze→Descriptive→Statistics→Crosstabs2.分别选定行变量和列变量。3.选择Displayclusteredbarcharts,指定绘制各变量交叉分组下频数分布柱型图。Suppresstables表示不输出列联表,在仅分析行列变量间关系时可选择。4.单击Cells,指定列联表单元格中的输出内容,各选项的含义见P86。5.单击Format指定列联表各单元的输出排列顺序。6.单击Statistics指定用哪种方法分析行变量和列变量之间的关系。交叉分组下的频数分析的应用举例利用居民储蓄数据进行分析,实现以下分析目标:分析城镇和农村储户对“未来两年内收入状况的变化趋势”是否持相同的态度;交叉分组下的频数分析的应用举例如果列联表如P86所示,两个变量的关系就一目了然,但绝大多数情况下,观测频数是分散在列联表的各个单元格中的,因此就不大容易直接发现行列变量之间的关系和它们关系的强弱程度。为此需要借助一些方法进行分析。通常采用的是卡方()检验和相关性检验等。2交叉列联表的卡方检验卡方检验属于假设检验的范畴,有四个步骤:1、建立零假设()列联表分析中卡方检验的零假设为行变量与列变量独立。2、选择和计算检验统计量列联表分析卡方检验的检验统计量是Pearson卡方统计量,其数学定义为:0H交叉列联表的卡方检验ricjeijeijijfff1122021)1(~)(),(列数-行数-3、确定显著性水平和临界值4、结论和决策例:对城镇和农村储户对未来收入看法的一致性进行卡方检验其中,r为列联表的行数,c为列联表的列数;为观察频数,为期望频数。期望频数的分布反映的是行列变量互不相干下的分布。0ijfeijf交叉分组下的频数分析户口*什么合算Crosstabulation1138720056.5%43.5%100.0%65.7%79.1%70.9%59238272.0%28.0%100.0%34.3%20.9%29.1%17211028261.0%39.0%100.0%100.0%100.0%100.0%Count%within户口%within什么合算Count%within户口%within什么合算Count%within户口%within什么合算城镇户口农村户口户口Total买东西存钱什么合算Total,113011f122%9.7017211ef,59021f5012217250%9.2017221ef练习利用居民储蓄数据进行分析要求:形成城镇和农村储户对储蓄是否合算的列联表;在列联表的基础上进行卡方检验。第5章SPSS基本统计分析SPSS统计分析功能概述SPSS数值分析过程基本统计分析概述5.1案例说明5.2计算基本描述统计量5.3变量的频数统计5.4交叉分组下的频数分析5.5多选项分析多选项分析什么是多选项问题SPSS中的多选项分析是针对问卷调查中的多选题的,多选项问题在问卷调查中普遍存在,它是根据实际调查需要,要求被调查者从问卷给出的若干个可选答案中选择一个以上的答案。如何处理多选项问题第一,将多选项问题分解;第二,利用前面讲到的频数分析或交叉分组下的频数分析等方法进行分
本文标题:用spss作基本统计分析
链接地址:https://www.777doc.com/doc-2202718 .html