您好,欢迎访问三七文档
当前位置:首页 > 法律文献 > 理论/案例 > 公务员考试法律常识试题训练
实验五SPSS数据文件管理一、实验目的①了解SPSS界面主要菜单的功能;②掌握变量的定义、数据的输入、编辑保存以及文件的合并;③掌握SPSS中变量的计算、数据筛选以及数据分组。二、实验工具SPSS三、SPSS介绍SPSS是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生于20世纪60年代末研制。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS也有专门的绘图系统,可以根据数据绘制各种图形。SPSS主要有四种运行方式:1.批处理方式将已编写好的程序存为一个文件,提交给[开始]菜单上[SpssforWindows]=[ProductionFacility]程序运行;2.窗口菜单运行方式这种方式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程,简单易用;3.程序运行方式这种方式是在语句(Syntax)窗口中直接运行编写好的程序或者在脚本(Script)窗口中运行脚本程序的一种运行方式。这种方式要求掌握SPSS的语句或脚本语言;4.混合运行方式混合运行方式指以上各种方法的结合方式。运行方式SPSS主菜单包括十个菜单项:1.File:“文件”菜单用于新建SPSS各种类型文件,打开一个已存在的文件,从文本文件或其它数据源读入数据;2.Edit:“编辑”菜单用于撤消操作、剪切、复制、粘贴、查找、改变SPSS默认设置等;3.View:运用“视图”菜单显示或隐藏状态行、工具栏、网络线、值标签和改变字体;4.Data:运用“数据”菜单对SPSS数据文件进行全局变化,例如定义变量,合并文件,转置变量和记录,或产生分析的观测值子集等;5.Transform:“转换”菜单在数据文件中对所选择的变量进行变换,并在已有变量值的基础上计算新的变量;6.Analyze:“分析”菜单在以前版本中为“统计(Statistics)”,可进行各种统计分析,包括各种统计过程(Procedure),如回归分析、相关分析、因子分析等;主菜单7.Utilities:“工具”菜单可以显示数据文件和变量的信息,定义子集,运行脚本程序,自定义SPSS菜单等;8.Window:“窗口”菜单用于选择不同窗口和最小化所有窗口;9.Help:“帮助”菜单包含SPSS帮助主题、SPSS教程、SPSS公司主页、统计教练等菜单项。内容SPSS变量的定义SPSS文件合并功能SPSS变量计算功能SPSS数据选取功能SPSS数据分组功能SPSS在输入数据前首先要定义变量;定义变量即要定义变量名、变量类型、变量长度(小数位数)、变量标签(或值标签)和变量的格式。步骤为:单击数据编辑窗口中的[VariableView]标签或双击列的题头(Var),在变量视图中定义变量。变量定义[名称]:定义变量名。变量名必须以字母或字符@开头,其他字符可以是任何字母、数字或_、@、#、$等符号。变量名总长度不能超过8个字符(即4个汉字);[类型]:定义变量类型。SPSS的主要变量类型有:标准数值型、带逗号的数值型、小数点的数值型、科学记数法、日期型、美元、定制货币、字符串。变量类型[宽度]:设置数值值变量的长度,当变量为日期型时无效;[小数]:设置数值值变量的小数点位数,当变量为日期型时无效;[标签]:变量标签是对变量名的进一步描述,变量只能由不超过8个字符组成,8个字符经常不足以表示变量的含义。而变量标签可长达120个字符,变量标签对大小写敏感,显示时与输入值完全一样,需要时可用变量标签对变量名的含义加以解释。;[值]:是对变量每一可能取值的进一步描述,当变量是定类或定序变量时,这是非常有用的。单击,在对话框中进行设置;变量类型[缺失]:SPSS有两类缺失值(系统缺失值和用户缺失值)。在数据长方形中任何空的数字单元都被认为系统缺失值,用点号(·)表示。SPSS可以指定那些由于特殊原因造成的信息缺失值,然后将它们标为用户缺失值,统计过程识别这种标识,带有缺失值的观测被特别处理。默认值为[没有缺失值]。单击相应单元中的按钮,可改变缺失值定义方式;变量类型[列]:定义变量的显示宽度输入变量的显示宽度,默认为8;[对齐]:定义变量显示的对齐方式选择变量值显示时的对齐方式:[左对齐]、[右对齐]、[居中对齐];[测量]:定义变量的测量尺度。变量按测量精度可以分为定类变量、定序变量、定距变量和定比变量,定距变量和定比变量经常不加以区别。如果变量为定距变量或定比变量,下拉列表中选择[尺度];如果变量为定序变量,则选择[有序];如果变量为定类变量,则选择[名义]。变量类型定类变量,根据定性的原则区分总体各个案类别的变量。定类变量的值只能把研究对象分类,也即只能决定研究对象是同类抑或不同类,具有=与≠的数学性质。例如性别区分为男性和女性两类;出生地区分为农村、城市、城镇三类;民族背景区分为汉、蒙、回、苗、壮、藏、维吾尔等;婚姻状况区分为未婚、已婚、分居、离婚、丧偶等类。这些变量的值,只能区别异同,属于定类层次。定序变量是区别同一类别个案中等级次序的变量。定序变量能决定次序,也即变量的值能把研究对象排列高低或大小,具有>与<的数学特质。它是比定类变量层次更高的变量,因此也具有定类变量的特质,即区分类别(=,≠)。例如文化程度可以分为大学、高中、初中、小学、文盲;工厂规模可以分为大、中、小;年龄可以分为老、中、青。这些变量的值,既可以区分异同,也可以区别研究对象的高低或大小。但是,各个定序变量的值之间没有确切的间隔距离。比如大学究竟比高中高出多少,大学与高中之间的距离和初中与小学之间的距离是否相等,通常是没有确切的尺度来测量的。定序变量在各个案上所取的变量值只具有大于或小于的性质,只能排列出它们的顺序,而不能反映出大于或小于的数量或距离。距变量是区别同一类别个案中等级次序及其距离的变量。它除了包括定序变量的特性外,还能确切测量同一类别各个案高低、大小次序之间的距离,因而具有加与减的数学特质。但是,定距变量没有一个真正的零点。例如,摄氏温度这一定距变量说明,摄氏40度比30度高10度,摄氏30度比20度又高10度,它们之间高出的距离相等,而摄氏零度并不是没有温度。定距变量各类别之间的距离,只能用加减而不能用乘除或倍数的形式来说明它们之间的关系。测量变量类型变量定义的复制如果有许多个变量的类型相同,可以先定义一个变量,然后把该变量的定义信息复制给新变量。具体操作为:先定义一个变量,在该变量的行号上单击右钮,选择[复制];然后用鼠标右钮选择多行,选择[粘贴];再把自动产生的新变量名称(如Var0001、Var0002、Var0003、⋯⋯)改为所要的变量名称。数据的输入与编辑定义了变量后就可以输入数据了,数据窗口如下图所示SPSS文件合并功能文件合并在实际工作中,由于数据量较大,常常会把一份大的数据分成几个部分,由不同的录入人员分别录入,以加快数据录入速度,减少个人压力,提高效率。但是这样会存在一个问题:一份完整的数据被分别存在不同的SPSS数据文件中。因此,要分析这份数据就必须将这些文件合并成一个文件。SPSS提供了两种合并数据文件的方式:⑴纵向合并纵向合并数据文件是将数据编辑窗口中的数据与另一个SPSS数据文件中的数据进行首尾对接,也就是将另外一个SPSS数据文件的内容追加到数据编辑窗口中当前数据的后面。⑵横向合并横向合并数据文件是将数据编辑窗口中的数据与另一个SPSS数据文件中的数据进行左右对接,即将一个SPSS数据文件的内容拼接到数据编辑窗口中当前数据的右边,依据两个数据文件的个案进行数据对接。纵向合并举例现有两份关于职工基本情况的SPSS数据文件,分别为“职工数据.sav”和“追加职工.sav”。两份文件中的数据项不完全相同,且同一数据项的变量名也不完全一致,现需要将这两份数据合并到一起。步骤如下:1、在数据编辑窗口中打开“职工数据.sav”文件;2、选择菜单【数据】→【合并文件】→【添加个案】,然后选择需要进行合并的文件,如“追加职工.sav”;3、“在新工作文件中的变量”中显示的是两文件中具有相同变量名的数据项,SPSS默认它们具有相同的数据含义,并自动将他们作为合并后新文件的变量。“非对称变量”中显示的是两文件中不同变量名的数据项,【*】表示该变量是当前数据窗口中的变量。【+】表示该变量是第二个合并文件的变量。SPSS默认这些变量含义不同,不放入合并后的新文件。如果某些变量含义相同,只是变量名有差异,可以选中这些变量,然后按【重命名】改名,也可以指定配对后,添加到新的合并后的文件中。横向合并举例有两份关于职工基本情况的SPSS数据文件,分别为“职工数据.sav”和“职工奖金.sav”。两份文件中职工号的变量名是相同的,第二份数据中只有部分职工的奖金数据现需要将这两份数据合并到一起。步骤如下:1、在数据编辑窗口中打开“职工数据.sav”文件;2、选择菜单【数据】→【合并文件】→【添加变量】,选择要进行合并的文件“职工奖金.sav”;3、“新工作数据文件”中显示的是两文件中所有出现的变量。“已排除的称变量”中显示的是第二个文件中与第一个文件相同的变量,【+】表示该变量是第二个合并文件的变量。选择数据合并方式,并指定【关键变量】。(关键变量为两个文件合并的依据)横向合并数据方式SPSS有三种横向合并数据的方式:1、两个文件都提供个案SPSS的默认方式,指合并后的数据包括原来两个文件的数据。2、外部文件是关键表这种合并方式,在当前数据编辑窗口中的数据基础上,仅合并第二个文件的变量,而不合并数据,合并后文件中的数据为第一个文件的数据。3、工作数据文件是关键表这种合并方式,是在第二个文件的基础上,将目前数据编辑窗口中的其它变量合并进来,合并后文件中的数据为第二个文件的数据。SPSS变量计算变量计算1、根据已存在的变量建立新变量选择[转换]→[计算],在对话框中的[目标变量]框中输入符合变量命名规则的变量名,目标变量可以是现存变量或新变量。[数值表达式]下的文本框用于输入计算目标变量值的表达式。表达式能够使用左下框列出的现存变量名、计算器板列出的算术运算符和常数和[函数]列表框显示的各种函数,也可以在文本框中直接输入和编辑表达式,还可以使用变量列表、计算器板和函数列表将元素粘贴到文本框中。变量计算2、条件控制有时候会在进行新变量计算时,要用到条件控制。例如:新建”个人所得税”变量,仅对男性员工征收个人所的税,则点击[如果]按钮,选中“如果个案满足条件则包括”,并在条件对话框中的输入判断条件(性别=“男”)。变量计算应用举例某单位职工基本情况见数据文件“职工数据.sav”,现要对该单位职工的基本工资实行按级别上浮,上浮原则为:依据职称1-4级分别将基本工资上浮5%,3%,2%,1%。请计算上浮后的实发工资。基本操作步骤为:⑴选择菜单【转换】→【计算】⑵在目标变量中输入新建变量名称“sfgz”,在数字表达式中输入“sr×1.05”,并设定if条件“zc=1”;⑶在数字表达式中输入“sr×1.03”,并设定if条件“zc=2”;⑷在数字表达式中输入“sr×1.02”,并设定if条件“zc=3”;⑸在数字表达式中输入“sr×1.01”,并设定if条件“zc=1”说明:1、如果指定存放计算结果的变量为新变量,SPSS会自动创建;如果指定产生的变量已经存在,SPSS会提问用户是否以计算出的新值覆盖原有旧值。2、对不满足指定条件的个案,SPSS不进行变量计算。数据选取功能数据选取数据选取是根据分析的需要,从已收集到的大批量数据(总体)中按照一定的规则抽取部分数据(样本)参与分析,也叫样本抽样。数据选取在数据分析
本文标题:公务员考试法律常识试题训练
链接地址:https://www.777doc.com/doc-3229411 .html