第四章Frequencies过程

第四章摘要性分析第一节Frequencies过程4.1.1主要功能4.1.2实例操作第二节Descriptives过程4.2.1主要功能4.2.2实例操作第三节Explore过程4.3.1主要功能4.3.2实例操作第四节Crosstabs过程4.4.1主要功能4.4.2实例操作摘要性分析是对原始数据进行描述性分析，这是统计工作的出发点。统计学的一系列基本描述指标，不仅让人了解资料的特征，而且可启发人们对之作进一步的深入分析。通过调用摘要性分析的诸个过程，可完成许多统计学指标，对于计量资料，可完成均数、标准差、标准误等指标的计算；对于计数和一些等级资料，可完成构成比、率等指标的计算和χ2检验。本章将介绍其操作方法。第一节Frequencies过程4.1.1主要功能调用此过程可进行频数分布表的分析。频数分布表是描述性统计中最常用的方法之一，此外还可对数据的分布趋势进行初步分析。返回目录返回全书目录4.1.2实例操作[例4-1]调查100名健康女大学生的血清总蛋白含量（g%）如下表，试作频数表分析。7.437.886.887.807.048.056.977.127.358.057.957.567.507.887.207.207.207.437.127.207.507.357.887.437.586.507.437.126.976.807.357.507.206.437.588.036.977.437.357.357.587.586.887.657.047.128.127.507.046.807.047.207.657.437.657.766.737.207.507.437.357.957.357.476.507.658.167.547.277.276.727.657.277.047.726.886.736.736.737.277.587.357.507.277.357.357.278.167.037.437.357.957.047.657.277.728.437.507.657.044.1.2.1数据准备激活数据管理窗口，定义血清总蛋白含量的变量名为X，然后输入血清总蛋白含量的原始数据，结果见图4.1。图4.1输入血清总蛋白含量值4.1.2.2统计分析激活Statistics菜单，选Summarize中的Frequencies...命令项，弹出Frequencies对话框（图4.2）。现欲对血清总蛋白含量值进行频数表分析，故在对话框左侧的变量列表中选x，点击钮使之进入Variable(s)框。同时可点击Format...钮弹出Frequencies：Format对话框，在Orderby栏中有四个选项：Ascendingvalues为根据数值大小按升序从小到大作频数分布；Descendingvalues为根据数值大小按降序从大到小作频数分布；Ascendingcounts为根据频数多少按升序从少到多作频数分布；Descendingcounts为根据频数多少按降序从多到少作频数分布。在PageFormal栏中可定义结果输出的格式。本例选Ascendingvalues项后点击Continue钮返回Frequencies对话框。图4.2频数表分析对话框点击Statistics...钮，弹出Frequencies:Statistics对话框（图4.3），可点击相应项目，要求系统在作频数表分析的基础上，附带作各种统计指标的描述，特别是可进行任何水平的百分位数计算。本例要求计算四分位数(Quartiles)、均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)、标准差(Std.deviation)、方差(Variance)、全距(Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)、偏度系数（Skewness）和峰度系数(Kurtosis)，选好后点击Continue钮返回Frequencies对话框。图4.3频数表分析的统计指标对话框点击Charts...钮，弹出Frequencies:Charts对话框，用户可选两种图形，一是直条图（Barchart），适用于非连续性的变量；另一是直方图（Histogram），适用于连续性的变量。本例要求对变量x绘制直方图，故选择Histogram项，并要求绘制正态曲线（Withnormalcurve），点击Continue钮返回Frequencies对话框，再点击OK钮即可。4.1.2.3结果解释在输出结果窗口中将看到如下统计数据：系统对变量x的原始数据作频数分布表，Value为原始值、Frequency为频数、Percent为各组频数占总例数的百分比、Validpercent为各组频数占总例数的有效百分比、CumPercent为各组频数占总例数的累积百分比。XValidCumValueLabelValueFrequencyPercentPercentPercent6.4311.01.01.06.5022.02.03.06.7211.01.04.06.7344.04.08.06.8022.02.010.06.8833.03.013.06.9733.03.016.07.0311.01.017.07.0477.07.024.07.1244.04.028.07.2077.07.035.07.2777.07.042.07.351111.011.053.07.4388.08.061.07.4711.01.062.07.5077.07.069.07.5411.01.070.07.5611.01.071.07.5855.05.076.07.6577.07.083.07.7222.02.085.07.7611.01.086.07.8011.01.087.07.8833.03.090.07.9533.03.093.08.0311.01.094.08.0522.02.096.08.1211.01.097.08.1622.02.099.08.4311.01.0100.0--------------------Total100100.0100.0接着输出各基本统计指标，其中均数为7.366,标准误为0.039,中位数为7.350,众数为7.350,标准差为0.394,方差为0.155,峰度系数为0.034,峰度系数的标准误为0.478,偏度系数为0.06,偏度系数的标准误为0.241,全距为2.000,最小值为6.430,最大值为8.430,25%位数为7.120,50%位数为7.350,75%位数为7.580，共100个观察值，无缺失值。Mean7.366Stderr.039Median7.350Mode7.350Stddev.394Variance.155Kurtosis.034SEKurt.478Skewness.060SESkew.241Range2.000Minimum6.430Maximum8.430PercentileValuePercentileValuePercentileValue25.007.12050.007.35075.007.580Validcases100Missingcases0最后系统输出带有正态曲线的直方图（图4.4），由图中可见，数据基本呈现正态分布形状。X8.508.258.007.757.507.257.006.756.50HistogramFrequency3020100Std.Dev=.39Mean=7.37N=100.00图4.4频数分布的直方图从上述内容可知，系统在未特别指定的情形下，频数分布表是按照原始数值逐一作频数分布的，这与日常需要的等距分组、且组数保持在8～15组的要求不符。为此，在调用Frequencies过程命令之前，可先对原始数据进行算术处理：已知最小值为6.430，最大值为8.430，全距为2.000，故可要求分成10组，起点为6.4，组距为0.2。选Transform菜单Recode项的IntoDifferentVariable...命令项，在弹出的RecodeIntoDifferentVariable对话框中选x点击钮使之进入NumericVariableOutputVariable框，在OutputVariable栏的Name处输入x1，点击Change钮表示新生成的变量名为x1。点击OldandNewValues钮弹出RecodeIntoDifferentVariable:OldandNewValues对话框，在Oldvalue栏内选Range项，输入第一个分组的数值范围：6.4～6.599，在Newvalue栏内输入新值：6.4，点击Add钮，依此将各组的范围及对应的新值逐一输入，最后点击Continue钮返回RecodeIntoDifferentVariable对话框，再点击OK钮即完成。系统在原数据库中生成一新变量为x1，这时调用Frequencies过程命令将输出等距分组且组数为10的频数分布表。X1ValidCumValueLabelValueFrequencyPercentPercentPercent6.4033.03.03.06.6055.05.08.06.8088.08.016.07.001212.012.028.07.202525.025.053.07.402323.023.076.07.601010.010.086.07.8077.07.093.08.0066.06.099.08.4011.01.0100.0---------------------Total100100.0100.0Validcases100Missingcases0返回目录返回全书目录第二节Descriptives过程4.2.1主要功能调用此过程可对变量进行描述性统计分析，计算并列出一系列相应的统计指标，且可将原始数据转换成标准Z分值并存入数据库，所谓Z分值是指某原始数值比其均值高或低多少个标准差单位，高的为正值，低的为负值，相等的为零。返回目录返回全书目录4.2.2实例操作[例4-2]调查20名男婴的出生体重（克）资料如下，试作描述性统计。277029152795299528602970308731263125465422723503341839212669421837072310257338814.2.2.1数据准备激活数据管理窗口，定义男婴出生体重的变量名为X，然后输入男婴出生体重的原始数据。4.2.2.2统计分析激活Statistics菜单选Summarize中的Descriptives...命令项，弹出Descriptives对话框（图4.5）。现欲对男婴出生体重进行描述性分析，故在对话框左侧的变量列表中选x,点击钮使之进入Variable(s)框；本例要求将原始数据转换成z分值，故选Savestandardizedvalueasvariables项。图4.5描述性统计对话框点击Options...钮，弹出Descriptives:Options对话框（图4.6）。框中各指标的意义请读者参阅本章第一节。选好项目后点击Continue钮返回Descriptives对话框，再点击OK钮即可。图4.6描述性统计指标对话框4.2.2.3结果解释在结果输出窗口中将看到如下统计数据：均数为3188.450,标准误为140.681,标准差为629.146,方差为395824.997,峰度系数为0.118,峰度系数的标准误为0.992,偏度系数为0.732,偏度系数的标准误为0.512,全距为2382.000,最小值为2272,最大值为4654,有效例数为100，无缺失值。Numberofvalidobservations(listwise)=20.00VariableXMean3188.450S.E.Mean140.681StdDev629.146Variance395824.997Kurtosis.118S.E.Kurt.992Skewness.732S.E.Skew.512Range23

第四章Frequencies过程

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

农业气象知识试题库

旅游规划-旅游目的地形象策划的流程

气动刹车橡胶活塞膜ANSYS分析及设计Ξ

行政行为作业

某保健类洁眼液产品市场实战方案

XXXX年关于中国品牌的培育更需要什麽样的

经管学院商务礼仪讲座

汤敏生-时间管理与工作效率提升

中国企业对外直接投资现状和策略的分析

沙埕湾经济开发区规划环境影响报告

相关文档

相关搜索