您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 统计分析与SPSS的应用
RevisedbyNO.717studio发布地址:kj717studio@163.com密码:717kejian-1-《统计分析与SPSS的应用》第一章SPSS统计分析软件概述SPSS简史:统计学为数据分析过程提供一套完整的科学的方法论。统计软件为数据分析提供了现实手段软件名称:StatisticalPackageforSocialScienceStatisticalProductandServiceSolutions软件发展:60年代:美国斯坦福大学三位研究生研制70年代:SPSS总部成立于芝加哥,推出SPSS中小型版——SPSSX80年代:微机版(V1~4)SPSS/PC+90年代:Windows版(V6~10)本世纪:11~15版,中文版1.1SPSS使用基础1.1.1SPSS软件的安装和启用1.1.2SPSS的基本窗口一、数据编辑窗口-SPSSDataEditor扩展名为.sav功能:定义SPSS数据结构,录入、编辑和管理待分析的数据特点:①File-Open(New)-Data或SPSS启动后自动打开;②只能打开一个(SPSS15及以上版本除外)结构:窗口主菜单、工具栏、数据编辑区、系统状态显示区二、SPSS结果输出窗口—SPSSViewerSPSS的另一个主要窗口,扩展名为.spo功能:显示管理SPSS统计分析结果、报表及图形特点:①第一次进行统计分析时自动打开或File-Open(New)-Output;②允许创建或打开多个输出窗口结构:窗口主菜单、工具栏、分析结果显示区、状态显示区【注】SPSS中数据的输入和结果的输出在不同窗口进行!三、程序窗口—SyntaxEditorRevisedbyNO.717studio发布地址:kj717studio@163.com密码:717kejian-2-扩展名为.sps编写SPSS程序时使用特点:①File-New/Open-Syntax或修改参数自动创建;②允许同时创建或打开多个语句窗口构成:窗口主菜单、工具栏、SPSS程序编辑区、状态栏功能集中在菜单“RUN”中四、结果草稿窗口——DraftViewer扩展名为.rtfFile-New/Open-Draft可被Word等文本软件读取1.1.3SPSS软件的退出File-Exit或直接关闭1.2SPSS的基本运行方式:完全窗口菜单方式、程序运行方式和混合运行方式1.2.1完全窗口菜单方式在使用SPSS过程中,所有的分析操作都通过菜单、按钮、输入对话框等方式来完成。1.2.2程序运行方式在使用SPSS过程中,统计分析人员根据自己的分析需要,将数据分析的步骤手工编写成SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。1.2.3混合运行方式在使用菜单的同时编辑SPSS程序,是完全菜单方式和程序运行方式的综合。不马上按OK键,而是按Paste按钮1.3利用SPSS进行数据分析的基本步骤1.3.1数据分析的一般步骤:明确数据分析目标→正确收集数据→加工整理数据→选择恰当的统计分析方法进行探索分析→读懂统计分析结果1.3.2利用SPSS进行数据分析的一般步骤①SPSS数据的准备;②SPSS数据的加工整理阶段;③SPSS数据的分析阶段;④SPSS分析结果的阅读和解释1.4利用统计教练快速入门SPSSSPSS的帮助系统:强大的帮助功能是SPSS的另一特色联机帮助——菜单Help中的Topics图解帮助——菜单Help中的Tutorial统计教练—Help中的StatisticsCoach在线帮助—对话框中的Help及右键第二章SPSS数据文件的建立和管理RevisedbyNO.717studio发布地址:kj717studio@163.com密码:717kejian-3-2.1SPSS数据文件2.1.1SPSS数据文件的特点:扩展名为.sav由数据的结构和内容两部分组成只能在spss软件中打开2.1.2SPSS数据的基本组织方式一、原始数据的组织方式“行”为个案(case),“列”为变量(variable)例:P17案例2-1二、计数数据的组织方式“行”为分组,“列”为变量(variable)例:P18案例2-22.2SPSS数据的结构和定义方法SPSS数据的结构是对SPSS每列变量及其相关属性的描述,其定义通过变量视图完成。包括:变量名、类型、列宽、小数位宽、变量名标签、变量值标签、缺失值、列显示宽度、对齐方式、计量尺度。2.2.1变量名字符个数不多于8个,汉字不超过4个(SPSS13.0以前版本)。首字符以英文开头(不能以数字开头),不能包含+,-,×,/,?,=等运算符和逻辑符号(如:ALL,BY,AND,NOT,OR等)。变量名不区分大小写字母SPSS有默认的变量名,它以字母“VAR”开头,后补足5位数字,如VAR00001等【注】为方便记忆,变量名最好与其代表的数据含义相对应。2.2.2数据类型、列宽、小数列宽数据类型是指每个变量取值的类型,分别有数值型、字符型和日期型。相应的类型会有默认的列宽和小数位宽。数值型,通常有阿拉伯数字和其他特殊符号(如美元符号、逗号、圆点)等组成。默认列宽为8个字符,小数位宽默认为2位。包括标准型(默认)、科学记数法型、逗号型、圆点型和美元符号型。应用最为广泛字符型,由一串字符串组成,默认列宽为8个字符,区分大小写,输入时无需双引号。由于分析、整理都较困难,建议尽量少用,改为编码录入日期型,用来表示日期或是时间数据。格式很多,如dd-mmm-yyyy,mm/dd/yyyy等。实际上是特殊的数值型变量,尽量少用2.2.3变量名标签RevisedbyNO.717studio发布地址:kj717studio@163.com密码:717kejian-4-对变量名含义的进一步说明,它可增强变量名的可视性和统计分析结果的可读性。可用中文,总长度达120个字符。可省略,但建议给出。2.2.4变量值标签是对变量取值含义的解释说明信息,对定类型和定序型数据尤为重要。2.2.5缺失数据数据中明显错误或明显不合理的数据以及漏填的数据都可看作缺失数据。用户指定缺失值:字符型或数字型变量,可指定1~3个缺失值数字型变量,缺失值可在一个连续的闭区间内并同时附加一个区间外的离散值系统默认缺失值用.表示(注.≠0)SPSS提供了专门分析缺失值的模块2.2.6计量尺度Scale(刻度型或定距型):数据的最高级别,可进行四则运算和基于此的延伸运算;可分为两个子级别:间距级(Interval):可做加减,不可做乘除。比如在采用摄氏度时,不能说10摄氏度是5摄氏度的2倍比率级(Ratio):既可做加减,又可做乘除。比如长度的0定序型数据(Ordinal):具有固定的大小顺序,却不等距如:优、中、差定类型数据(Nominal):没有有固定的大小顺序如:男、女2.2.7SPSS结构定义操作中应注意的问题(略)2.3SPSS数据的录入与编辑2.3.1SPSS数据的录入—调查问卷的录入开放题:原则上按照字符变量自由录入,注意适情况适当放大变量宽度(Width)单选题:按照选项设定标签,采用数字代码录入多选题P103:多重二分法(简称:二分法),多重分类法(简称:多分法)半开放题:使用两个变量对其进行定义,在第一个变量中,“其他,请指出”作为选项中的一个进行录入;第二个变量将“其他,请指出”看作一个独立的开放题进行数据录入将没有选择该选项的被访者作为缺失值处理多选题:多重二分法所谓多重二分法,是指将多选题问题中的每个答案设为一个SPSS变量,每个变RevisedbyNO.717studio发布地址:kj717studio@163.com密码:717kejian-5-量只有0或1两个取值,分别表示选择该答案和不选择该答案。多选题:多重二分法【例】请问您用下列哪几种方式保持身体健康?□科学安排饮食□运动□保持情绪乐观积极□其他措施每一个题项设立一个二分类变量,用Y/N或0/1表示该选项是否被选择,当选项过多时不宜使用这种方法多选题:多重分类法多选题答案定义的另一种方法,首先估计多选项问题的最多可能出现的答案个数;然后,为每个答案设置一个SPSS变量,变量取值为多选项问题中的可选答案。变量必须为数值型变量,适用于问题的选项较多的情况多选题:多重分类法【例】请在下面列出的20个品牌中选出您认为最信得过几个(最多列五个),并将代码填入下面空格1、2、3、4、5、。候选品牌列表:1、长虹2、海尔……2.2.3SPSS数据的编辑一、数据的定位人工定位,人工浏览数据。适用于数据较少的情况系统定位,系统按照用户指定的条件自动寻找数据单元。适用于数据量较大的情况按个案号码定位,Data-Gotocase按变量值定位,Edit-Find二、插入或删除一个个案或变量菜单操作:Data-InsertCase/InsertVariable鼠标右键:InsertCase/Variables,Cut三、数据的移动、复制和删除步骤:定义源数据块;单击鼠标右键Clear/Copy/Cut;指定目标单元块Paste2.4SPSS数据的保存RevisedbyNO.717studio发布地址:kj717studio@163.com密码:717kejian-6-2.4.1SPSS支持的数据格式SPSS文件格式(.sav),完整但通用性差;Excel格式(.xls),dbf文件格式(.dbf),文本文件格式(.dat),变量格式信息丢失但可被相应软件直接读取2.4.2保存SPSS的操作File-Save/Saveas文件名、文件类型及选择保存变量2.5读取其他格式的数据文件2.5.1直接读入其他格式的数据文件SPSS格式文件、Excel格式文件、dBase系列数据文件、SAS格式文件等步骤:File-Open-Date;选择文件类型并输入文件名2.5.2使用文本导向读入文本文件File-ReadTextData2.5.3使用数据库导向读入文件(略)2.6SPSS数据文件的合并将一个(或多个)以存储在磁盘上的SPSS数据文件分别依次与SPSS数据编辑窗口中的数据合并,即合并个案。2.6.1纵向合并数据将数据编辑窗口中的数据与另一个SPSS数据文件中的数据进行首尾对接。操作:Data-MergeFile-AddCases例:职工数据.sav和追加职工.sav【注】①合并后的数据有意义②含义相同的变量最好同名2.6.2横向合并数据文件将数据编辑窗口中的数据与另一个SPSS数据文件中的数据进行左右对接,即合并变量。操作:Data-MergeFile-AddVariables例:职工数据.sav和职工奖金.sav【注】①各数据文件中至少有一个名称相同的变量②事先将关键变量进行升序排序③不同含义的变量不应同名第三章SPSS数据的预处理3.1数据的排序(Data-SortCases)将记录按ID变量排序,有利于查找、修改;RevisedbyNO.717studio发布地址:kj717studio@163.com密码:717kejian-7-将某个变量按升序或降序排列,可以非常容易的发现输入错误,因为他们往往就是最大/最小值;缺失值在排序中会排在最小值的前面,可以通过排序的方法很快发现那些记录为缺失值;包括单值排序和多重排序;例1:将“职工数据.sav”文件,按职称降序和工资收入升序重新排列。例2:“住房状况调查.sav”,通过排序分析本市户口和外市户口的住房面积情况3.2变量的计算(Transform-Compute)在原有数据的基础上,根据用户给出的SPSS算术表达式以及函数,对所有个案或满足条件的部分个案,计算产生一系列新变量用于计算新变量,或者给老变量赋值有大量的SPSS函数可供使用学会如何写相应的语句可能更方便实例依据“职工数据.sav”按职称级别计算实发工资,计算规则:实发工资等于基本工资减去失业保险,之后,依据职称1~4等级分别将以上计算结果上浮5%,3%,2%,1%。SPSS算术表达式由常量、变量、算术运算符、圆括号、函数等组成的式子字符型常量用引号引起来算术运算符
本文标题:统计分析与SPSS的应用
链接地址:https://www.777doc.com/doc-4529378 .html