您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > SPSS基本统计分析资料
第四章SPSS基本统计分析对样本数据的刻画与描述2提要频数分析计算基本描述统计量交叉分组下的频数分析多选项分析比率分析要求:掌握每种方法的基本功能、作用掌握每种方法的基本操作方法掌握每种方法的适用范围3一、频数分析频数分析,用于了解变量取值的状况,有利于把握数据的分布特征(一)基本概念频数:频率,变量值落在给定区间的次数(数目)百分比:各频数占总样本数的百分比有效百分比:各频数占有效样本数的百分比有效样本数:不包含缺失值的样本的个数=总样本数-缺失样本数累积百分比:各百分比逐级累加起来的结果注意:频数,只针对单个变量进行!4(二)基本分析步骤1.选择菜单AnalyzeDescriptiveStatisticsFrequencies2.选择分析对象变量在Variable(s)框中,放置要进行频数分析的变量;可放置多个,但分析是分别进行的3.调正输出分布表中数据的输出顺序Format…按钮,可按变量值的升降,频数Counts的升降进行排序4.选择输出图形Chart…按钮,可选择显示的内容:频数Frequencies,百分比Percentanges5.输出裁剪可视分析的具体情况,对结果做必要的裁剪(去掉某些变量的分析结果)图形可被编辑:双击图形,出现ChartEdit图形编辑窗口5(三)扩展功能Statistics计算分位数(PercenticleValues)、计算集中趋势(CentralTendency)、计算离散趋势(Dispersion)、描述分布形态(Distribution)等计算分位数:变量在不同区段内的取值情况、数目(PercenticleValues)注意:分位数的分位范围为0~100,作用:描述数据离散程度,差越大,说明在相应位段上的离散程度越大*拆分会对以后的分析操作一直起作用,即,都会是在每个拆分的组上分别进行分析!6频数分析过程(Frequencies)该过程可计算数据资料的各种描述统计指标、给出变量简单频数分布表、绘制几种变量分布图。Analyze→DescriptiveStatistics→Frequencies出现对话框7案例4-1:住房状况分析打开对话框选择频数表选择柱状图8从业状况50416.816.816.8130043.443.460.346715.615.675.91424.74.780.62859.59.590.12959.99.9100.02993100.0100.0行政事业单位国营企业私营企业大专院校科研单位失业其它TotalValidFrequencyPercentValidPercentCumulativePercent房屋产权71523.923.923.942014.014.037.9612.02.040.02147.27.247.1145648.648.695.89.3.396.11183.93.9100.02993100.0100.0无产权部分产权二手房经济适用房多层商品房高层商品房其它TotalValidFrequencyPercentValidPercentCumulativePercent910111213Statistics家庭收入2993017696.1615000.0010000.0015298.802E+0085.546.04555.425.089248800.001200.00250000.005E+00710000.0015000.0020000.00ValidMissingNMeanMedianModeStd.DeviationVarianceSkewnessStd.ErrorofSkewnessKurtosisStd.ErrorofKurtosisRangeMinimumMaximumSum255075Percentiles描述统计量表平均数中位数众数标准差方差偏度系数峰度系数全距(极差)最小值最大值百分比14次级数据资料分析—扩展分析1、对资料进行分组TransformRecodeIntoDifferentVariable2、对已分组的资料进行频数分析(1)、对频数进行加权DataWeightCases(2)、求分组数据的频数分析表和描述统计量Analyze→DescriptiveStatistics→Frequencies15分组后的人均面积33711.311.311.3134244.844.856.183527.927.984.047916.016.0100.02993100.0100.010平米以下10~20平米20~30平米30平米以上TotalValidFrequencyPercentValidPercentCumulativePercentStatistics人均面积2993013.666719.625026.6667ValidMissingN255075Percentiles案例4-216本市户口人均面积2825013.666719.400026.6667ValidMissingN255075Percentiles外地户口人均面积168013.437521.125035.0000ValidMissingN255075Percentiles1718二、计算基本描述统计量若要对定距型数据的分布特征进行更精确的把握,可通过计算基本描述统计量来实现,如:计算均值、标准差、偏度、峰度等。常用基本描述统计量:刻画集中趋势的描述统计量刻画离散程度的描述统计量Dispersion刻画分布形态的描述统计量Distribution191.刻画集中趋势的描述统计量集中趋势:一组数据向某一中心值靠拢的倾向。目的:找到能够反映数据一般水平的“代表值”常用的中心值:均值Mean:(算术平均值)中位数Median:按升序排列后,处于中间位置的数据值;评价社会老龄化程度众数Mode:一组数据中出现次数最多的数据值;生产鞋号的生产计划均值标准误差StandardErrorofMean:反映样本均值与总体均值间的差异程度20各种平均数之间的关系不同的平均数适用于研究不同的问题,各种平均数都具有自己的含义、特点和应用场合。如算术平均数适用于正态分布的资料,中位数则适用于所有分布类型的资料,几何平均数适用于对数正态分布。刻画数据集中程度的特征量21刻画数据集中程度的特征量算术平均数、中位数和众数的关系若根据光滑的频数曲线来解释这三种测度,可以说均值是变量分布的平衡点或重心;中位数把这个分布正好划分两半;众数正好在分布顶端出现。在频数分布完全对称的情况下,均值=中位数=众数在频数分布右偏时,众数<中位数<均值在频数分布左偏时,均值<中位数<众数左偏分布均值中位数众数对称分布均值=中位数=众数右偏分布众数中位数均值222.刻画离散程度的描述统计量Dispersion离散程度:一组数据远离其中心值的程度,即所有数据相对于中心值的疏密程度;越密,离散程度越小,中心值的代表性越强。目的:结合中心值,给出数据更全面、完整的描述常用统计量:样本标准差StandardDeviation(StdDev):表示变量取值距均值的平均离散程度;值越大,差异越大样本方差Variance:意义同上;值越大,差异越大全距Range:极差,数据最大值与最小值间的绝对差;全距大笔全距小的数据分散23方差(Varance)和标准差(StandardDeviation)A、方差方差是每个变量与其算术平均数之间差的平方的算术平均数。设从某个总体中抽取的数据为,则样本方差为:nxxx,,,21212)(11niixxns设该总体的全部数据就是,则总体方差为:212)(1NiixxNnxxx,,,2124B、标准差设从某个总体中抽取的数据为,则样本标准差为:设该总体的全部数据就是则总体标准差为:nxxx,,,21nxxx,,,21niinxxS1211)(NiiNxx121)(25例:样本方差3.816)5.88()5.85()5.810(1)(2221221nxxSniin原始数据:1059136826例:样本标准差88.23.81)(121nxxSniin27标准差是测定数据离散程度的最常用的方法。标准差广泛应用于相关与回归分析、抽样推断、统计预测等各方面。28C、极差(全距)1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响未考虑数据的分布计算公式为未分组数据R=max(Xi)-min(Xi)组距分组数据R=最高组上限-最低组下限293.刻画分布形态的描述统计量Distribution数据形态:指数据分布是否对称、偏斜程度、分布陡缓程度等;作为集中趋势和离散程度的补充常用统计量:偏度系数Skewness:描述变量取值分布形态对称性的统计量;绝对值越大,偏斜程度越大;为0,表示对称;正,正偏/右偏,低于平均标准;负,负偏/左偏,高于评价标准峰度系数Kurtosis:描述变量取值分布形态陡缓程度的统计量(与标准正态图做对比);0,相同;正数,更陡(尖峰分布),少数人占东西的多,低于平均标准;负数,更缓(平峰分布),大家比较平均,高于平均标准30偏态与峰度分布的形状左偏分布右偏分布扁平分布尖峰分布偏态峰度与标准正态分布比较!31偏态1.数据分布偏斜程度的测度2.偏态系数=0为对称分布3.偏态系数0为右偏分布4.偏态系数0为左偏分布5.计算公式为3133NFXXKiii32峰度1.数据分布扁平程度的测度2.峰度系数=3扁平程度适中3.偏态系数3为扁平分布4.偏态系数3为尖峰分布5.计算公式为4144NFXXKiii33基本分析步骤选择菜单:AnalyzeDescriptiveStatisticsDescriptives选择分析变量到Variable(S)中设置要分析的方法Option最上:描述集中趋势Dispersion:描述离散程度Distribution:描述分布形态设置输出特点DisplayOrder:输出显示规律Variablelist:按变量在数据窗口中从左到右的次序输出Alphabetic:按变量名字母顺序输出Ascendiingmeans:按均值升序输出Descendingmeans:按均值降序输出34数据描述过程(Descriptives)该过程计算数据资料的各种描述统计指标,但不给出分布图。Analyze→DescriptiveStatistics→Descriptives出现对话框35DescriptiveStatistics2825112.602.40115.0021.725812.17539148.2402.181.0468.311.0922825人均面积(本市户口)ValidN(listwise)StatisticStatisticStatisticStatisticStatisticStatisticStatisticStatisticStd.ErrorStatisticStd.ErrorNRangeMinimumMaximumMeanStd.DeviationVarianceSkewnessKurtosisDescriptiveStatistics16897.673.33101.0026.716518.96748359.7651.429.1872.121.373168人均面积(外地户口)ValidN(listwise)StatisticStatisticStatisticStatisticStatisticStatisticStatisticStatisticStd.ErrorStatisticStd.ErrorNRangeMinimumMaximumMeanStd.DeviationVarianceSkewn
本文标题:SPSS基本统计分析资料
链接地址:https://www.777doc.com/doc-4441494 .html