您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 第三章-SPSS数据的预处理
第三章SPSS数据的预处理本章主要内容1.数据文件的合并2.数据的排序3.数据的排秩4.变量计算5.数据选取6.变量重编码7.加权8.数据拆分一、数据文件合并合并数据文件是指将外部数据中的个案或变量合并到当前的数据文件中去。合并数据文件包括两种方式:从外部数据文件增加个案到当前数据文件中。——纵向合并或称追加个案。从外部数据文件增加变量到当前数据文件中。——横向合并。纵向合并首先打开一个数据文件。按数据合并文件添加个案顺序逐一单击鼠标,打开:将个案添加到文件对话框,依据需要选择文件,然后进入添加个案对话框,选择相应的选项或做适当的修改即可。纵向合并纵向合并纵向合并纵向合并纵向合并需注意的问题两个待合并数据文件的内容合并起来是要有实际意义的。为方便spss数据文件的纵向合并,在不同数据文件中数据含义相同的数据项最好取相同的变量名,其数据类型也最好相同。横向合并横向合并有两种方式:从一个指定的外部数据文件中取得一个或几个变量的数据(包括变量名称)增加到当前工作数据文件中,实际上相当于两个数据文件的横向合并。按关键变量合并,即要求两个数据文件必须有一个共同的关键变量,而且这两个文件中的关键变量还存在一定数量的相同值的个案。横向合并的具体操作首先打开一个数据文件。按数据合并文件增加变量顺序逐一单击鼠标,打开各对话框,依据需要选择相应的选项或做适当的修改即可。横向合并需注意的问题两个数据文件至少有一个名称相同的变量,该变量是两个数据文件横向合并的依据,称为关键变量。例如:职工号、姓名等。为方便spss数据文件的横向合并,不同数据文件中数据含义不同的数据项,变量名应该不同。二、数据的排序首先在数据窗中建立或读入一个数据文件。按数据排序个案顺序逐一单击鼠标键,打开个案排序对话框。依据需要进行选择,然后单击OK按纽即可。数据的排序在左边的源变量框中选择排序变量进入Sortby框。如果选择2个以上的变量,个案的排序结果与排序变量在Sortby框中的顺序有关。列于首位的为第一排序变量。在SortOrder栏内选择排序方式——升序与降序三、数据的排秩运用转换(Transform)命令实现。求得的秩在数据窗中建立一个新变量来保存。具体操作方法:按转换(Transform)个案排秩(RankCases)顺序逐一单击鼠标键,打开个案排秩对话框。依据需要进行选择,然后单击确定按纽即可。新生成的秩变量的名称以原变量名称前加字母“R”的形式出现在数据文件中。变量值排秩变量值排秩的选项说明在Assignrank1to栏中可选择秩的排列方式。如选择一个或多个分组变量进入By栏,系统将按By变量分组排秩。当所选择的变量具有相同值时称为Tie(结),其秩次的决定原则可以在RankCases:Ties对话框中指定。在RankType中可以选择获得秩次的其他方法。DisplaysummaryTables复选项为默认选择,表示要在输出结果窗中显示新变量的名称、标签、秩类型等总结性信息。四、变量计算利用菜单“Transform”下的“Compute”命令实现数据的变换和计算利用菜单“Transform”下的“Compute”命令,可以完成以下工作:1.计算数值或字符型变量的值2.创建新的变量或取代已存在的变量,对于新的变量,依然可以定义3.可以利用已建立的函数进行变量的计算和转换变量计算的作用在原有数据的基础上,计算产生一些更丰富信息的新数据。例如:根据职工的基本工资、失业保险、奖金等数据项,计算实际月收入。创建新的变量对话框创建新的变量五、数据选取目的:选择需要进行分析的个案方法:1.按指定条件选取(Ifconditionissatisfied)2.随机选取(Randomsampleofcases)3.选取某一区域内的个案(Basedontimeorcaserange)4.通过过滤变量选取(Usefiltervariable)六、变量重编码重编码的步骤及两种方式:(1)IntoSameVariables;(2)IntoDifferentVariables.重编码的应用定距层次的变量,希望输出频次分布表时,常常需要进行分组,这时可以利用重编码。当采用量表来进行测量,而量表中变量取值有正反两种方向的设置,需要转化为同一方向时,常常需要重编码。第一种方式重编码IfCase对话框用于设置变量重编码的条件OldandNewValues对话框设置旧变量转变为新变量的对应方式第二种方式重编码第二种重编码方式需要在OutputValues中定义新变量的变量名与变量标签。第二种重编码方式中If和OldandNewValues按钮展开的对话框形式与结构、内容是一样的。七、对变量加权处理在计算的过程中需要利用变量对数据进行加权处理时采用。加权处理的具体方法:按DataWeightCases,打开WeightCases对话框,依据需要进行适当的选择即可。对变量进行加权处理对个案加权处理在选择加权变量时应注意:加权变量中含有零、负数或缺省值的个案将被排除在分析之外。分数值有效。一旦对数据进行了加权处理,那么在以后的分析中加权处理一直有效,直到关闭加权处理过程或选择其他的加权变量进行加权处理。八、数据拆分在进行数据处理时经常要对数据文件中的变量进行分组分析,如分性别的平均分数。进行分析之前必须对数据文件进行拆分。拆分分件并不是将一个数据文件分为两个或几个独立的数据文件,而是在同一个数据文件中按某个条件分组。这种拆分在以后的运算中一直有效直到取消或更改拆分变量。拆分数据文件的具体操作读取一个数据文件。按DataSplitFiles顺序逐一单击鼠标,打开SplitFiles对话框。根据对数据的具体需要选择相应的选项。按Ok完成。拆分数据文件上机作业3要求能对数据进行各种处理:1.掌握数据的排序与排秩;2.掌握数据文件的拆分与合并;3.掌握数据的重编码与计算变换;4.掌握数据的选取与加权。
本文标题:第三章-SPSS数据的预处理
链接地址:https://www.777doc.com/doc-7129718 .html