您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 第一节基本统计分析一`频数分布表
SPSS在社会统计中的应用社会统计中的统计软件SPSS基础SPSS在社会统计学中的应用描述性统计(DescriptiveStatistics)相关分析(Correlate)回归分析(Regression)均值比较与检验(CompareMeans)社会统计中的统计软件统计分析软件是数据分析的主要工具完整的数据分析过程包括:数据的收集数据的整理数据的分析统计学为数据分析过程提供一套完整的科学的方法论。统计软件为数据分析提供了实现手段。统计分析软件的一般特点功能全面,系统地集成了多种成熟的统计分析方法;有完善的数据定义、操作和管理功能;方便地生成各种统计图形和统计表格;使用方式简单,有完备的联机帮助功能;软件开放性好,能方便地和其他软件进行数据交换。常用统计软件简介SAS:真正的巨无霸。被誉为国际上的标准统计软件和最权威的组合式优秀统计软件。SPSS:统计软件中的贵族S-Plus:S语言(AT&T贝尔实验室)的后续发展Stata:软件小巧、功能强大以下,我们介绍的主要是SPSS。SPSS(PASW)基础软件名称StatisticalPackageforSocialScience(1975-2000年)StatisticalProductandServiceSolutions(2000年-2009年4月)PredictiveAnalyticsSoftware(2009年4月起)软件发展1960年代:美国斯坦福大学三位研究生研制1970年代:SPSS总部成立于芝加哥,推出SPSS中小型机版SPSSX—1980年代:微机版(V1~3SPSS/PC+3)1990年代:Windows版(v5~17)2009年4月:被IBM公司收购,改名为PASW。第一节描述性统计频数分布(Frequencies)数据描述(Descriptives)数据探索(Explore)交互列联表(Crosstab)一、频数分布在SPSS中可以很容易地得出频数分布表,平均数,标准差等。频数分布:可以概略地看到资料的分布情况,可做初步整理之用,从中还可检查数据输入情况。命令选择:Analyze——DescriptiveStatistics——Frequencies备注:可选入多个变量GeneralHappiness46730.831.131.187257.558.089.016510.911.0100.0150499.1100.013.91517100.0VeryHappyPrettyHappyNotTooHappyTotalValidNAMissingTotalFrequencyPercentValidPercentCumulativePercentNumberofChildren41927.627.827.825516.816.944.737524.724.969.521514.214.283.81278.48.492.2543.63.695.8241.61.697.3231.51.598.9171.11.1100.0150999.5100.08.51517100.001234567EightorMoreTotalValidNAMissingTotalFrequencyPercentValidPercentCumulativePercentStatistics:Dispersion(离差栏):Std.Deviation标准差Variance方差Range全距Minimum最小值Maximum最大值S.E.mean均值的标准误CentralTendency(集中趋势栏)Mean均值Median中位数Mode众数Sum总和Skewness偏度(0,1.5,0.5,-0.5)Kurtosis峰度(0,正,负)例:09-01Statistics15091510871.9012.88.045.0772.0012.000121.7652.9843.1148.9041.034-.168.063.0631.060.710.126.12682000820286919455ValidMissingNMeanStd.ErrorofMeanMedianModeStd.DeviationVarianceSkewnessStd.ErrorofSkewnessKurtosisStd.ErrorofKurtosisRangeMinimumMaximumSumNumberofChildrenHighestYearofSchoolCompletedNumberofChildren41927.627.827.825516.816.944.737524.724.969.521514.214.283.81278.48.492.2543.63.695.8241.61.697.3231.51.598.9171.11.1100.0150999.5100.08.51517100.001234567EightorMoreTotalValidNAMissingTotalFrequencyPercentValidPercentCumulativePercent还可直接作出图形(Charts):Barcharts:条形图PieCharts:圆图、饼图Histograms:直方图,只适用于连续的数值型变量。HighestYearofSchoolCompleted20.017.515.012.510.07.55.02.50.07006005004003002001000Std.Dev=2.98Mean=12.9N=1510.00NumberofChildrenEightorMore76543210MissingCount5004003002001000二、数据描述分析过程适用条件:对于定距以上变量,可以进行集中趋势和离中趋势的统计命令:Analyze——DescriptiveStatistics——Descriptives变量要求:可多选可选项:Mean、Std.deviation、MinimumDescriptiveStatistics1509081.901.765151002012.882.9841504131.80.6171495NumberofChildrenHighestYearofSchoolCompletedGeneralHappinessValidN(listwise)NMinimumMaximumMeanStd.Deviation三、数据探索1、对数据进行初步考察:检查数据是否有错误:过大或过小的数据有可能是奇异值、影响点或错误数据。一要找出,二要分析原因,三要决定是否从中剔除。数据分布特征:许多分析方法对数据的分布有一定要求。从数据是否服从正态分布,决定他们是否可以选用只对正态分布数据适用的分析方法。Explore:进行初步探索分析09-03四、交互列联表适用条件:根据变量的层次,统计学中有各种不同的相关系数来描述,在社调中常见的两个定类(或一个定类、一个定序)命令:Analyze——DescriptiveStatistics——Crosstabs变量:选择一个或多个变量进入Rows,Column框对复选框的解释(1)Chi-square,卡方检验。PearsonChi-squaretestLikehoodrationChi-squaretest似然比卡方检验Fisher’sexactlytest费雪精确检验(2)Correlation复选框。Pearson,Spearman(只适用于数值型)(3)NominalData栏,适用于定类变量的统计量。Lambda复选项(4)OrdinalData栏:适用于定序变量的统计量Gamma、Kendall”stau-b、Kendall”stau-c(5)NominalbyInterval:一个定类一个定距以上变量Eta统计量,如收入和性别的关联性Flagsignificantcorrelations:用星号标记有统计学意义的相关关系。第二节相关分析相关分析是研究变量间密切程度的一种统计方法。对于其数值可以从小到大排列的数据才能计算其相关系数。简单相关(Bivariate)偏相关(Partial)1、对定距以上两个变量x与y的相关系数采用Pearson相关系数2、SpearmanKendall相关系数是一种非参测度,是根据数据的秩而不是根据实际值计算的。适合定序数据或不满足正态分布假设的定距数据。3、偏相关系数:描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性。如:可以控制年龄和工作经验,估计工资收入与受教育程度之间的相关关系。4、关于相关系数统计意义的检验:由于抽样误差的存在。检验的零假设——总体中两个变量间的关系为0。SPSS只给出给假设成立的概率P值。(1)Analyze——Correlations——Bivariate计算指定的两个变量之间的相关系数,可选择Pearson相关、Spearman和KendallTau-b相关;同时对相关系数进行检验。TestofSignificance是用于变量间相关的显著性检验。系统默认的是双侧检验。Two-tailed:事先不知道相关方向One-tailed:事先知道相关方向例Data09-03使用系统默认值进行相关分析:Correlations1.661**..000474474.661**1.000.474474PearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)NEducationalLevel(years)CurrentSalaryEducationalLevel(years)CurrentSalaryCorrelationissignificantatthe0.01level(2-tailed).**.分析:起始工资、现工资与雇员受教育水平、工作经验、职务等级之间是否存在线性关系。DescriptiveStatistics13.492.8854741.41.773474$34419.57$17075.661474$17016.09$7,870.63847481.1110.06147495.86104.586474EducationalLevel(years)EmploymentCategoryCurrentSalaryBeginningSalaryMonthssinceHirePreviousExperience(months)MeanStd.DeviationNCorrelations1.514**.661**.633**.047-.252**..000.000.000.303.000474474474474474474.514**1.780**.755**.005.063.000..000.000.908.173474474474474474474.661**.780**1.880**.084-.097*.000.000..000.067.034474474474474474474.633**.755**.880**1-.020.045.000.000.000..668.327474474474474474474.047.005.084-.0201.003.303.908.067.668..948474474474474474474-.252**.063-.097*.045.0031.000.173.034.327.948.474474474474474474PearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-taile
本文标题:第一节基本统计分析一`频数分布表
链接地址:https://www.777doc.com/doc-1062719 .html