您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 《SPSS的简单应用》PPT课件
2020/3/10管理统计1SPSS的简单应用工商管理学院王宏新2一、SPSS简介SPSS是StatisticalProgramforSocialSciences的简称,即社会科学统计程序,由美国SPSS公司70年代推出,迄今已有近30年的历史。是国际著名三大社会科学统计软件包之一(SAS、SPSS、Statis)。最初是6.0版,我们现在使用的是SPSSforWindows13.0版。目前最新的版本是16.0版。3二、SPSS的主界面菜单栏的详细解释41.File:有关文件的调入、存储、显示和打印等;2.Edit:编辑菜单,有关文本内容的选择、拷贝、剪贴、寻找和替换等;3.Data:数据管理菜单,有关数据变量定义、数据格式选定、观察对象的选择、排序、加权、数据文件的转换、连接、汇总等;4.Transform:数据转换处理菜单,有关数值的计算、重新赋值、缺失值替代等;5.Statistics:统计菜单,有关统计方法的应用;6.Graphs:作图菜单,有关统计图的制作;7.Utilities:用户选项菜单,有关命令解释、字体选择、文件信息、定义输出标题、窗口设计等;8.Windows:有关窗口的排列、选择、显示等;9.Help:有关帮助文件的调用、查寻、显示等。5Analyze菜单描述性统计分析--DescriptiveStatistics菜单均数间的比较--CompareMeans菜单一般线性模型――GeneralLinearModel菜单相关分析――Correlate菜单多元线性回归与曲线拟合――Regression菜单对数线性模型――Loglinear菜单聚类分析与判别分析――Classify菜单因子分析与对应分析――DataReduction菜单信度分析与多维尺度分析――Scale菜单非参数检验――NonparametricTests菜单Survival菜单6描述性统计分析——DescriptiveStatistics菜单SPSS的许多模块均可完成描述性分析,但是专门为该目的而设计的几个模块则集中在DescriptiveStatistics菜单中,最常用的是最前面的四个过程:(1)Frequencies过程的特色是产生频数表;(2)Descriptives过程进行一般性的统计描述(3)Explore过程用于对数据概况不清时的探索性分析;(4)Crosstabs过程则完成计数资料和等级资料的统计描述和一般的统计检验,常用的检验也在其中完成。27该菜单具体有均值的几个过程:(1)Means过程:对准备比较的各组计算描述指标,进行预分析,也可直接比较。(2)One-SamplesTTest过程:单样本T检验。(3)Independent-SamplesTTest过程:两样本均数差别的比较,即两组资料的T检验。(4)Paired-SamplesTTest过程:配对资料的显著性检验,即配对T检验。(5)One-WayANOVA过程:两组及多组样本均数的比较,即成组设计的方差分析,还可进行随后的两两比较。均值的比较——CompareMeans菜单8其下属四个子菜单各自的功能是:(1)Univariate子菜单:四个菜单中的大哥大,绝大部分的方法分析都在这里面进行。(2)Multivariate子菜单:当结果变量(因变量)不止一个时,可用他来分析。(3)RepetedMeasures子菜单:重复测量的数据就要用他来分析;用前两个菜单似乎都可以分析出来结果,但在许多情况下该结果是不正确的。(4)VarianceComponents子菜单:用于作方差成份模型的。一般线性模型—GeneralLinearModel菜单9(1)Bivariate过程:用于进行两个或多个变量间的参数或非参数相关分析,如果是多个变量,则给出两两相关的分析结果。(2)Partial过程:进行偏相关分析。如果进行相关分析的两个变量其取值均受到其他变量的影响,就可以利用此分析对其他变量进行控制,输出控制其他变量影响后的相关系数。(3)Distances过程:同一变量内部各观察单位间的数值或各个不同变量间进行距离相关分析。相关分析——Correlate菜单SPSS的相关分析功能被集中在Analyze菜单的Correlate子菜单中,一般包括以下三个过程:10多元线性回归与曲线拟合—Regression菜单SPSS的回归分析功能被集中在Analyze菜单的Regression子菜单中,一般包括以下三个过程:(1)Linear过程:可完成二元或多元的线性回归分析。在多元线性回归分析中,还可根据需要,选用不同筛选自变量的方法(如逐步法、向前法、向后法等)。(2)CurveEstimation过程:可以用于拟合各种曲线,原则上只要两个变量间存在某种可以被它所描述的数量关系,就可以用该过程来分析。(3)BinaryLogistic过程:作一个两分类的因变量回归方程,但将概率做了一个Logit变换,从而该方法被叫做Logistic回归。11对数线性模型——Loglinear菜单(1)General过程:用于进行一般对数线性模型分析,主要用于证实性研究。(2)Logit过程:当研究人员已经有了一些线索,知道因变量自变量时,如果因变量为两分类,就可以用这个过程来分析。(3)ModelSelection过程:分层对数线性模型。一般线性对数模型可以对每个系数及总模型给出非常丰富和详细的信息,但是它要求研究人员心中已经有了一定的思路或线索,或只对某些特定效应项感兴趣,即已经有关于简约模型的假设。12Classify菜单提供如下三个过程:(1)K-meansCluster过程:对记录进行快速聚类,当明确所需要分出的类别数时,采用快速聚类可以节省运算时间。(2)HierarchicalCluster过程:提供了全面而强大的聚类分析能力,可对记录或变量进行聚类。更为重要的是,参与系统聚类分析的变量不再像快速聚类一样限于连续性变量,它们可以是两分类或多分类变量。(3)Discriminant过程:提供了全面的类别分析功能,所用变量可一次进入,也可以使用逐步法筛选出最优类别方程。聚类分析与判别分析——Classify菜单13因子分析与对应分析——DataReduction菜单(1)Factor过程:提供因子分析/主成分分析方法,它们是最为常用的数据简化方法,用于考察多个定量变量间的内在结构,或者提取数据的主要信息。(2)CorrespondenceAnalysis过程:进行简单对应分析,该方法同样以数据简化的原则力图直观的给出各两个分类变量各个类别之间的联系,当各个变量的类别越多时,该法的优势就越明显。(3)OptimalScaling过程:进行最优尺度分析,其核心目的也是力图在低维度空间表述两个或多个变量之间的内在联系。14(1)信度分析(ReliabilityAnalysis):评价问卷这种测量工具的稳定性或可靠性,即用问卷对同一事物进行重复测量时,所得结果的一致性程度。该过程可以评价问卷中各个问题是否测量的是同一个概念。(2)多维尺度分析:用于反映多个研究事物间的相似(不相似)程度,通过适当的降维方法,将这种相似(不相似)程度在低维空间中用点与点之间的距离表示出来,并有可能帮助识别那些影响事物间相似性的潜在因素。信度分析与多维尺度分析——Scale菜单15非参数检验——NonparametricTests菜单(1)Chi-squaretest:检验变量个数取值所占百分比。(2)BinomialTest:检测变量是否符合二项分布(3)RunsTest:检验变量取值是否随机地上下波动。(4)One-SampleKolmogorov-SmirnovTest。(5)Two-Independent-SamplesTests。(6)TestsforSeveralIndependentSamples:成组设计的多个样本均数比较的非参数检验。(7)Two-Related-SamplesTests:配对设计两样本均数的非参数检验。(8)TestsforSeveralRelatedSamples。16SPSS提供了四个过程:①Lifetables过程:分析分组生存资料,求出不同组段时的生存率。②Kaplan-Meier过程:用于样本含量较小时,不能给出特定时间点的生存率。③CoxRegression过程:用于拟合Cox比例风险模型,这是生存分析中最重要的一个分析方法。④Coxw/Time-DepCox过程:是Cox比例风险模型的进一步发展。当所研究的危险因素其取值随时间而不断变化,或其作用强度随时间而不断变化时,就必须用到这个过程了。生存分析——Survival菜单17二、SPSS的主界面18二、SPSS的主界面191.定义变量名Name(2)变量最后一个字符不能是句号。(1)变量名必须以字母、汉字或字符@开头,其他字符可以是任何字母、数字或_、@、#、$等符号。(3)变量名总长度不能超过8个字符(即4个汉字)。(4)不能使用空白字符或其他特殊字符(如!、?等)(5)变量命名必须唯一,不能有两个相同的变量名。(6)在SPSS中不区分大小写,如HXH与hxh、Hxh均为同一变量名。(7)SPSS的保留字不能作为变量的名称,如ALL、AND、WITH、OR等。SPSS主界面的解释202.定义变量类型TypeType数值型(Numeric)日期型(Date)字符串型(String)NumericCommaDotDollarScientificNotationCustomCurrency2122(1)Numeric:数值型。定义变量的宽度(Width),即整数部分+小数点+小数部分的位数,默认为8位;定义小数位数(DecimalPlaces),默认为2位。(2)Comma:带逗号的数值型。即整数部分每3位数加一逗号,其余定义方式同数值型,也需要定义数值的宽度和小数位数。(3)Dot:圆点数值型。整数部分从右向左每三位一个圆点(不是小数点),对小数位的分割用逗号。(4)Scientificnotation:科学记数型。同时定义数值宽度和小数位数,在数据编辑窗口中以指数形式显示。如定义数值宽度为9,小数位数2,则345.678显示为3.46E+02或3.46E02、3.46D+02、3.46D02等。23(5)Dollar:货币型。用户可以选择自己需要的多种货币显示形式,并定义数值宽度和小数位数,显示形式为数值前加$符号。(6)Customcurrency:用户自定义型。如果没有定义,则默认显示为整数部分每3位加一逗号,用户定义数值宽度和小数位数。(7)Date:日期型。用户可以选择自己需要的多种日期显示形式。如mm/dd/yy或dd-mm-yy等。(8)String:字符型。用户可以定义字符的长度(Characters)以便输入字符。243.变量长度Width4.变量小数点位数Decimal5.变量名标签Label6.变量值标签Values设置变量的长度,当变量为日期型时无效。设置变量的小数点位数,当变量为日期型时无效。变量只能由不超过8个字符组成,有时不足以变量的含义,变量标签可长达120个字符。当变量是定性或定序变量时,非常有用,如1代表male,2代表female等。25缺失值分系统缺失值和用户缺失值两类。由于特殊原因造成的信息缺失值为用户缺失值。如统计中可能需要区别一些被调查者不愿意回答的题目,将他们标为用户缺失值,带有缺失值的观测被特别处理。7.缺失值的定义方式Missing8.变量的显示宽度Columns9.变量显示的对齐方式Align缺失值定义分离散定义和区间定义两种。屏幕上变量的显示宽度,默认8位,用户可改变该宽度,范围是1~255。不是前面定义的内在宽度。分Left、Right和Center三种,默认是右对齐。26③Nominal(名义级):是一种测量精确度最低最粗略的基于“质”因素的变量,不能比大小,也不能进行四则运算。10.变量的测度尺度Measure①Scale(刻度级):最高等级,
本文标题:《SPSS的简单应用》PPT课件
链接地址:https://www.777doc.com/doc-4273618 .html