您好,欢迎访问三七文档
第四章摘要性分析第一节Frequencies过程4.1.1主要功能4.1.2实例操作第二节Descriptives过程4.2.1主要功能4.2.2实例操作第三节Explore过程4.3.1主要功能4.3.2实例操作第四节Crosstabs过程4.4.1主要功能4.4.2实例操作摘要性分析是对原始数据进行描述性分析,这是统计工作的出发点。统计学的一系列基本描述指标,不仅让人了解资料的特征,而且可启发人们对之作进一步的深入分析。通过调用摘要性分析的诸个过程,可完成许多统计学指标,对于计量资料,可完成均数、标准差、标准误等指标的计算;对于计数和一些等级资料,可完成构成比、率等指标的计算和χ2检验。本章将介绍其操作方法。第一节Frequencies过程4.1.1主要功能调用此过程可进行频数分布表的分析。频数分布表是描述性统计中最常用的方法之一,此外还可对数据的分布趋势进行初步分析。返回目录返回全书目录4.1.2实例操作[例4-1]调查100名健康女大学生的血清总蛋白含量(g%)如下表,试作频数表分析。7.437.886.887.807.048.056.977.127.358.057.957.567.507.887.207.207.207.437.127.207.507.357.887.437.586.507.437.126.976.807.357.507.206.437.588.036.977.437.357.357.587.586.887.657.047.128.127.507.046.807.047.207.657.437.657.766.737.207.507.437.357.957.357.476.507.658.167.547.277.276.727.657.277.047.726.886.736.736.737.277.587.357.507.277.357.357.278.167.037.437.357.957.047.657.277.728.437.507.657.044.1.2.1数据准备激活数据管理窗口,定义血清总蛋白含量的变量名为X,然后输入血清总蛋白含量的原始数据,结果见图4.1。图4.1输入血清总蛋白含量值4.1.2.2统计分析激活Statistics菜单,选Summarize中的Frequencies...命令项,弹出Frequencies对话框(图4.2)。现欲对血清总蛋白含量值进行频数表分析,故在对话框左侧的变量列表中选x,点击钮使之进入Variable(s)框。同时可点击Format...钮弹出Frequencies:Format对话框,在Orderby栏中有四个选项:Ascendingvalues为根据数值大小按升序从小到大作频数分布;Descendingvalues为根据数值大小按降序从大到小作频数分布;Ascendingcounts为根据频数多少按升序从少到多作频数分布;Descendingcounts为根据频数多少按降序从多到少作频数分布。在PageFormal栏中可定义结果输出的格式。本例选Ascendingvalues项后点击Continue钮返回Frequencies对话框。图4.2频数表分析对话框点击Statistics...钮,弹出Frequencies:Statistics对话框(图4.3),可点击相应项目,要求系统在作频数表分析的基础上,附带作各种统计指标的描述,特别是可进行任何水平的百分位数计算。本例要求计算四分位数(Quartiles)、均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)、标准差(Std.deviation)、方差(Variance)、全距(Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)、偏度系数(Skewness)和峰度系数(Kurtosis),选好后点击Continue钮返回Frequencies对话框。图4.3频数表分析的统计指标对话框点击Charts...钮,弹出Frequencies:Charts对话框,用户可选两种图形,一是直条图(Barchart),适用于非连续性的变量;另一是直方图(Histogram),适用于连续性的变量。本例要求对变量x绘制直方图,故选择Histogram项,并要求绘制正态曲线(Withnormalcurve),点击Continue钮返回Frequencies对话框,再点击OK钮即可。4.1.2.3结果解释在输出结果窗口中将看到如下统计数据:系统对变量x的原始数据作频数分布表,Value为原始值、Frequency为频数、Percent为各组频数占总例数的百分比、Validpercent为各组频数占总例数的有效百分比、CumPercent为各组频数占总例数的累积百分比。XValidCumValueLabelValueFrequencyPercentPercentPercent6.4311.01.01.06.5022.02.03.06.7211.01.04.06.7344.04.08.06.8022.02.010.06.8833.03.013.06.9733.03.016.07.0311.01.017.07.0477.07.024.07.1244.04.028.07.2077.07.035.07.2777.07.042.07.351111.011.053.07.4388.08.061.07.4711.01.062.07.5077.07.069.07.5411.01.070.07.5611.01.071.07.5855.05.076.07.6577.07.083.07.7222.02.085.07.7611.01.086.07.8011.01.087.07.8833.03.090.07.9533.03.093.08.0311.01.094.08.0522.02.096.08.1211.01.097.08.1622.02.099.08.4311.01.0100.0--------------------Total100100.0100.0接着输出各基本统计指标,其中均数为7.366,标准误为0.039,中位数为7.350,众数为7.350,标准差为0.394,方差为0.155,峰度系数为0.034,峰度系数的标准误为0.478,偏度系数为0.06,偏度系数的标准误为0.241,全距为2.000,最小值为6.430,最大值为8.430,25%位数为7.120,50%位数为7.350,75%位数为7.580,共100个观察值,无缺失值。Mean7.366Stderr.039Median7.350Mode7.350Stddev.394Variance.155Kurtosis.034SEKurt.478Skewness.060SESkew.241Range2.000Minimum6.430Maximum8.430PercentileValuePercentileValuePercentileValue25.007.12050.007.35075.007.580Validcases100Missingcases0最后系统输出带有正态曲线的直方图(图4.4),由图中可见,数据基本呈现正态分布形状。X8.508.258.007.757.507.257.006.756.50HistogramFrequency3020100Std.Dev=.39Mean=7.37N=100.00图4.4频数分布的直方图从上述内容可知,系统在未特别指定的情形下,频数分布表是按照原始数值逐一作频数分布的,这与日常需要的等距分组、且组数保持在8~15组的要求不符。为此,在调用Frequencies过程命令之前,可先对原始数据进行算术处理:已知最小值为6.430,最大值为8.430,全距为2.000,故可要求分成10组,起点为6.4,组距为0.2。选Transform菜单Recode项的IntoDifferentVariable...命令项,在弹出的RecodeIntoDifferentVariable对话框中选x点击钮使之进入NumericVariableOutputVariable框,在OutputVariable栏的Name处输入x1,点击Change钮表示新生成的变量名为x1。点击OldandNewValues钮弹出RecodeIntoDifferentVariable:OldandNewValues对话框,在Oldvalue栏内选Range项,输入第一个分组的数值范围:6.4~6.599,在Newvalue栏内输入新值:6.4,点击Add钮,依此将各组的范围及对应的新值逐一输入,最后点击Continue钮返回RecodeIntoDifferentVariable对话框,再点击OK钮即完成。系统在原数据库中生成一新变量为x1,这时调用Frequencies过程命令将输出等距分组且组数为10的频数分布表。X1ValidCumValueLabelValueFrequencyPercentPercentPercent6.4033.03.03.06.6055.05.08.06.8088.08.016.07.001212.012.028.07.202525.025.053.07.402323.023.076.07.601010.010.086.07.8077.07.093.08.0066.06.099.08.4011.01.0100.0---------------------Total100100.0100.0Validcases100Missingcases0返回目录返回全书目录第二节Descriptives过程4.2.1主要功能调用此过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,且可将原始数据转换成标准Z分值并存入数据库,所谓Z分值是指某原始数值比其均值高或低多少个标准差单位,高的为正值,低的为负值,相等的为零。返回目录返回全书目录4.2.2实例操作[例4-2]调查20名男婴的出生体重(克)资料如下,试作描述性统计。277029152795299528602970308731263125465422723503341839212669421837072310257338814.2.2.1数据准备激活数据管理窗口,定义男婴出生体重的变量名为X,然后输入男婴出生体重的原始数据。4.2.2.2统计分析激活Statistics菜单选Summarize中的Descriptives...命令项,弹出Descriptives对话框(图4.5)。现欲对男婴出生体重进行描述性分析,故在对话框左侧的变量列表中选x,点击钮使之进入Variable(s)框;本例要求将原始数据转换成z分值,故选Savestandardizedvalueasvariables项。图4.5描述性统计对话框点击Options...钮,弹出Descriptives:Options对话框(图4.6)。框中各指标的意义请读者参阅本章第一节。选好项目后点击Continue钮返回Descriptives对话框,再点击OK钮即可。图4.6描述性统计指标对话框4.2.2.3结果解释在结果输出窗口中将看到如下统计数据:均数为3188.450,标准误为140.681,标准差为629.146,方差为395824.997,峰度系数为0.118,峰度系数的标准误为0.992,偏度系数为0.732,偏度系数的标准误为0.512,全距为2382.000,最小值为2272,最大值为4654,有效例数为100,无缺失值。Numberofvalidobservations(listwise)=20.00VariableXMean3188.450S.E.Mean140.681StdDev629.146Variance395824.997Kurtosis.118S.E.Kurt.992Skewness.732S.E.Skew.512Range23
本文标题:第四章摘要性分析
链接地址:https://www.777doc.com/doc-2169363 .html