您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 二SPSS基本统计分析报告
《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析1第二章:SPSS基本统计分析SPSS软件的基本统计计算和绘图功能主要通过Analyze菜单中的DescriptiveStatistics以及Reports来完成的。另外,基本统计分析的报表是利用Analyze菜单中Tables制作的。为更清楚地讨论SPSS基本统计分析,可引入实际的案例加以介绍。以《世界500强公司》的数据为例:我们想统计世界500强中,主营业务为电信的公司出现的频率怎么做?我们想计算500强公司营业收入的均值、差异程度,怎么做?本章学习内容:1.1数据的基本统计描述量1.2频数分析(Frequencies)1.3描述统计(Descriptives)1.4探索分析(Explore)1.5报告输出具体内容:1.1数据的基本统计描述量表示集中趋势的统计量总和(Sum)所有数据的算术和均值(Mean)算术平均值众数(Mode)n个数据中出现次数最多的数中位数(Median)排在中间位置的数百分位数(Percentile)数据从小到大排序,处在k%位置的数称为第k百分位数表示离散程度的统计量方差(Variance)标准差(Std.Deviation)极差(Range)最大值与最小值之差四分位极差(Interquartile)第75百分位数与第25百分位数之差表示分布形状特征的统计量偏度(Skewness)接近0,对称分布;0,右偏态;0,左偏态。峰度(Kurtosis)接近0,为正态分布;0,陡峭;0,平缓。1.2频数分析(Frequencies)1.2.1主要作用可对数据按组进行归类整理,形成对某一变量不同水平的频数分布表和图形,以便于对数据的分布趋势作出初步判断。1.2.2实例分析打开文件《世界500强公司》,对世界500强公司数据进行频数分析:(1)对世界500强公司主营业务进行频数分析;(2)对世界500强公司的营业收入进行频数分析并画出直方图;《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析2(3)对我国进入500强的公司进行频数分析。具体操作如下:题1.对世界500强公司主营业务进行频数分析:AnalyzeDescriptiveStatisticsFrequencies,打开Frequencies对话框,如下图。2134《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析3《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析4题2.对世界500强公司的营业收入进行频数分析并画出直方图题目分析:由于营业收入属于数值型变量,其中每一数值都不相同,所以直接做频数分析没有意义。应将其按数值大小分成不同区间,然后作频数分析;而这一步应首先基于对数值进行描述统计,找出最小值和最大值。具体步骤分为描述统计、分组(通过“重新编码”(Recode))、频数分析等三步。描述统计:AnalyzeDescriptiveStatisticsDescriptives,打开如下对话框。DescriptiveStatistics50010096.2219812.01E+00728019.919500百万美元ValidN(listwise)NMinimumMaximumSumMean根据最小值和最大值,对原数据中营业收入进行重新分组:(0-29999.9),(30000-59999.9),(60000-89999.9),(90000-119999.9),(120000-149999.9),(150000-179999.9),(180000-209999.9),(210000-)分组(通过“重新编码”(Recode)):TransformRecodeIntoDifferentVariables(重新编码为新的变量)2134《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析52134《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析6此时我们会看到数据编辑窗口中变量栏多了一个:收入分组。频数分析:现在可以对新的变量:收入分组进行频数分析了(Charts选项中选择histograms,并勾选正态曲线)。步骤同一。结果如下两图。收入分组36272.472.472.410120.220.292.6204.04.096.671.41.498.051.01.099.03.6.699.61.2.299.81.2.2100.0500100.0100.01.002.003.004.005.006.007.008.00TotalValidFrequencyPercentValidPercentCumulativePercent10.008.006.004.002.000.00收入分组4003002001000Frequency1135720101362Mean=1.42Std.Dev.=0.89061N=500Histogram题3:对我国进入500强的公司进行频数分析。(1)首先挑选出中国的公司,可以通过筛选观测量来完成。具体操作:DataSelectCases,点选If对话框,然后设定“总部所在”为“中国”(总部所在=“中国”)。将未被选中的数据进行删除,将选中的数据以“中国”为名另存到桌面上。见下图。《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析7Ok之后将文件另存到桌面。(2)对中国进入500强公司进行频数分析。打开中国.sav文件,AnalyzeDescriptiveStatisticsFrequencies,打开Frequencies对话框,在charts选项中选择“BarCharts”,输出结果如下。Statistics主营业务110ValidMissingN《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析8主营业务19.19.19.1218.218.227.319.19.136.419.19.145.519.19.154.519.19.163.6436.436.4100.011100.0100.0电力电信化学贸易炼油贸易能源银行TotalValidFrequencyPercentValidPercentCumulativePercent银行能源贸易炼油化学贸易电信电力主营业务43210Frequency主营业务1.3描述统计(Descriptives)1.3.1主要作用对变量进行描述性统计分析,计算均值、标准差、全距和均值标准误差等。1.3.2实例分析刚才已经使用过。可对500强进行描述统计,操作后输出结果如下:DescriptiveStatistics500209715.810096.2219812.028019.9191152.301625766.257E+0083.527.10916.472.218500百万美元ValidN(listwise)StatisticStatisticStatisticStatisticStatisticStd.ErrorStatisticStatisticStatisticStd.ErrorStatisticStd.ErrorNRangeMinimumMaximumMeanStd.DeviationVarianceSkewnessKurtosis对结果的解释可参照教科书。习题:对“frequencies-舒张压.sav”文件中的数据进行频数分析(以10分组);练习2《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析91.4探索分析(Explore)1.4.1主要功能:此过程可检查数据是否有错误、考察样本分布特征及对样本分布规律作初步考察。剔除奇异值和错误数据。探测数据的错误来源人为的数据差错仪器测量的误差输入数据时的手误,如:小写的“l”与“1”、“o”与“0”数据探测的重要性由于数据的采集和输入可能出现的差错,在分析之前要检查数据的真实性。1.4.2实例分析(1)对日本进入500强的企业进行探索分析,并用茎叶图和箱线图显示。首先筛选出日本公司,步骤同上。Analyze--DescriptiveStatistics--Explore顺序单击,打开Explore主对话框。如图:点击ok后,会出现输出窗口,如下:《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析10CaseProcessingSummary87100.0%0.0%87100.0%总部所在=日本(FILTER)Selected百万美元NPercentNPercentNPercentValidMissingTotalCasesDescriptives27871.1022598.804122704.85133037.35424610.88817826.1006E+00824240.0310096.2120814.4110718.217289.52.058.2583.879.511MeanLowerBoundUpperBound95%ConfidenceIntervalforMean5%TrimmedMeanMedianVarianceStd.DeviationMinimumMaximumRangeInterquartileRangeSkewnessKurtosis总部所在=日本(FILTER)Selected百万美元StatisticStd.ErrorPercentiles10397.78010627.52012939.10017826.10030228.60063848.00092525.52013070.85017826.10029705.900总部所在=日本(FILTER)SelectedSelected百万美元百万美元WeightedAverage(Definition1)Tukey'sHinges5102550759095Percentiles《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析11125000.0100000.075000.050000.025000.0百万美元403020100Frequency1021111415381940Mean=27871.102Std.Dev.=24240.0314N=87forfilter_$=SelectedHistogram百万美元Stem-and-LeafPlotforfilter_$=SelectedFrequencyStem&Leaf33.001.00000000000001111222223333333344415.001.55666666677899911.002.000011223336.002.5556692.003.03.003.7.004.00113331.004.912.00Extremes(=54997)Stemwidth:10000.0Eachleaf:1case(s)茎叶图从左到右分为三部分:频数、茎和叶、茎是整数部分,叶是小数部分,Stemwidth表示茎宽。每行的茎和叶组成的数字再乘以茎宽,即得到实际数据的近似值,实际数据中与该近似值靠近的值的个数即为频数表示的个数。例如:从茎叶图中可以看出,25000cases30000的数据一共6个,分别大致为25000、25000、25000、26000、26000、29000(根据所在位数的数字,而非四舍五入)。《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析12(2)按主营业务绘制日本500强公司的箱线图首先用SelectCases选出500强中的所有银行业(If=”银行”)。然后用GraphsBoxplot,打开箱线图对话框,如图:《数据统计分析与SPSS应用》讲稿第二章:SPSS基本统计分析13邮政邮递饮料银行烟草铁路运输汽车零件汽车、摩汽车贸易轮胎橡胶零售炼油金属制品金属胶卷计算机、计算机化学航空公司广告工业农业工程建筑工程建设电子、娱电子、机电子电信电力出版印刷玻璃保险办公设备主营业务125000.0100000.075000.050000.025
本文标题:二SPSS基本统计分析报告
链接地址:https://www.777doc.com/doc-5651374 .html