您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 基本统计分析spss2
2020/1/28第7章基本统计分析2020/1/28本章内容SPSS统计分析功能概述SPSS数值分析过程基本统计分析概述7.1一维频数分布表Frequencies7.2描述统计分析过程Descriptives7.3探索分析Explore7.4多维频数分布表(交叉表,列联表)7.5OLAP报告摘要表OLAPCubes补充:Reports的其他分析过程练习题2020/1/28SPSS统计分析功能概述有了数据,可以利用SPSS的各种分析方法进行分析,但选择何种统计分析方法,即调用哪个统计分析过程,是得到正确分析结果的关键。SPSS有数字分析和作图分析两类方法2020/1/28SPSS数值分析过程SPSS数值统计分析过程均在Analyze菜单中,包括:a、基本统计分析:Reports,DescriptiveStatisticsb、均值比较与检验:CompareMeansd、方差分析:ANOVAModelsb、相关分析:Correlatee、回归分析:Regressionf、聚类与判别:Classifyg、因子分析:DataReductionh、非参数检验:NonparametricTests等等2020/1/28基本统计分析概述基本统计分析是进行其他更深入的统计分析的前提,通过基本统计分析,用户可以对分析数据的总体特征有比较准确的把握,从而选择更为深入的分析方法对分析对象进行研究。在SPSS的Analyze菜单中包括了一系列统计分析过程。其中Reports和DescriptiveStatistics命令项中包括的功能是对单变量的描述统计分析。DescriptiveStatistics包括的统计功能有:Frequencies:频数分析Descriptives:描述统计量分析Explore:探索分析Crosstabs:多维频数分布交叉表(列联表)Reports包括的统计功能有:OLAPCubes:OLAP报告摘要表CaseSummaries:观测量列表ReportSummariesinRow:行形式输出报告ReportSummariesinColumns:列形式输出报告2020/1/287.1一维频数分布表Frequencies1、了解变量的取值分布情况对整体把握数据的特征是非常有利的。2、求分类(定类、定序)变量的频数和作Bar图3、求定距变量(连续变量)的分布情况和作直方图Histogram比Descriptives多百分位,在Statistics选项(见Excel第三章数据描述与分析)和Format选项)4、对连续变量进行分组(recode)后再求频数,如老中青(35,60)的比例,文化程度(中学、大学及以上)的人数及比例等5、Analyze+DescriptiveStatistics+Frequencies6、例子p105-106:对1991年美国社会调查情况数据(data07-01)进行统计处理。分析不同年龄(age变量)和最高受教育年限(educ变量)各水平的频数分布情况。2020/1/287.2描述统计分析过程Descriptives1、功能:了解数据的基本统计特征和对指定的变量值进行标准化处理(标准化后的新变量的均值为0,标准差为1,目的是为了消除各变量间变量值在数量级上的差异,从而增强数据间的可比性)。2、描述统计分析过程通过平均值(Mean)、算术和(Sum)、标准差(StdDev)、最大值(Maximum)、最小值(Minimum)、方差(Variance)、范围(Range)、平均数标准误(S.E.Mean)等统计量对变量进行描述。3、一般是求定距变量的描述统计量,从中分析差异性(max,min)4、Analyze+DescriptiveStatistics+Descriptives5、例子:1985年美国联邦调查局对50个州各种犯罪情况调查的数据(data07-02)进行描述统计分析50个州总的情况不同地区region的情况(2种方法:SplitFile+Descriptives,第8章的Means)2020/1/287.3探索分析Explore1.考察数据的奇异性和分布特征奇异性:数据的过大或过小(找出、分析原因、是否剔除)分布特征:数据是否来自正态分布总体考察方法:统计量和统计图形(箱图、茎叶图(频数、茎和叶)、方差齐次性检验Spreadvslevel图)2.一般是考察定距变量3.Analyze+DescriptiveStatistics+Explore因(分析)变量(DependentList):定距变量分组变量(FactorList):分类变量标识变量(LabelCasesby):为方便查找输出观测量如id4.例子p112:考察银行数据(data07-03)中的不同性别的工资情况2020/1/287.4多维频数分布表(交叉表,列联表)二维或多维交叉频数表(列联表),分析事物(变量)之间的相互影响和关系Analyze+DescriptiveStatistics+Crosstabs行变量(Row):需分类变量列变量(Column):需分类变量分层变量(Layer):条件(若有,需分类变量)Statistics选项:Chi-square复选项及其四种检验结果Correlations复选项:相关系数例子:银行数据(data07-03)中:如求男女的民族分布情况,可得到白种人多,男性多的结论(注意cell选项,一般选频数和百分比),如求每一工种的男女分布情况(人数)P118:1991年美国社会调查情况数据(data07-01):男女对生活的认识。2020/1/287.5OLAP报告摘要表OLAPCubesOLAP(OnlineAnalyticalProcessing)在线分析处理过程以分组变量为基础,计算各组的总计、均值和其他统计量。而输出的报告摘要则是指每个组中所包含的各种变量的统计信息。Analyze+Reports+OLAPCubesSummaryVariables:要进行统计汇总的数值型变量GroupingVariables:分组变量(分类变量),注意:此分组变量在实际的运算过程中并不发挥分组的功能,而是确定进入统计的观测量的范围。如选择数学成绩作为摘要分析变量,而性别作为分组变量,要计算数学平均成绩,则结果中显示的并不是男生的数学平均成绩和女生的数学平均成绩,而是所有男女生观测量的数学成绩的总平均值。即所有性别有值(非MissingValue)的Case,才参与分析计算Statistics选项:Sum和、NumberofCases观测量数目、Mean均值、Median中位数、Maximum最大…等等例子p122:1991年美国社会调查情况数据(data07-01):对不同种族race的孩子childs和教育educ情况进行报告摘要分析。2020/1/28补充:Reports的其他分析过程Reports的其他分析过程有:CaseSummaries:观测值摘要分析ReportSummariesinRow:行形式输出报告ReportSummariesinColumns:列形式输出报告2020/1/28CaseSummaries:观测量列表察看或打印所需要的变量值Analyze+Reports+CaseSummariesVariables:要显示的变量名GroupingVariables:分组变量(分类变量)结果显示:多行或单行2020/1/28行形式输出报告Summary按行,如:sum、mean、max、min、count、stddev、variance、percentage(above,below,inside)等菜单:Analyze+Reports+ReportSummariesinRowsDataColumn:报告变量BreakColumn:分组变量及其Summary(多个交叉)Report:可对全部数据进行描述统计(GrandTotal)DisplayCases:是否显示每一个观测量2020/1/28列形式输出报告Summary按列,如:sum、mean、max、min、count、stddev、variance、percentage(above,below,inside)等菜单:Analyze+Reports+ReportSummariesinColumnsDataColumn:报告变量一一对应的SummaryInsertTotal:汇总列,可汇总两列或多列的信息BreakColumn:分组变量(多个交叉)及SubtotalReport:可对全部数据进行描述统计(GrandTotal)2020/1/28练习题关于计算机课程教学情况的调查.DOC请用Word提交分析报告,包括:用什么命令(如Frequencies,Descriptive)和分析的变量结果(表格或图形)结果分析
本文标题:基本统计分析spss2
链接地址:https://www.777doc.com/doc-3348151 .html