您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业文化 > SPSS数据文件的建立和预处理.
2020/1/101zf1.SPSS软件简介SPSS软件是由多个窗口组成。其中最基本的两个窗口是:数据编辑窗口和结果输出窗口2020/1/102zf1.1数据窗口(dataeditor)1)功能:对数据文件进行定义、录入、修改、管理等基本操作。2)窗口组成:标题栏、菜单栏、工具栏、二维表格、状态栏3)spss各统计分析功能是针对当前数据窗口中文件进行的,数据文件的扩展名是:.sav2020/1/103zf窗口主菜单工具栏数据编辑区系统状态栏2020/1/104zf窗口主菜单1:File文件操作菜单对SPSS相关文件进行基本管理,如:新建、打开、保存、打印等2020/1/105zf窗口主菜单2:Edit数据编辑操作菜单•对数据编辑窗口中的数据进行基本编辑,如:撤销/恢复、剪切、复制、粘贴等,并实现数据查找、软件参数设置等功能2020/1/106zf窗口主菜单3:View窗口外观状态操作菜单•对SPSS窗口外观等进行设置,如:状态栏、表格线、变量值标签等是否显示、字体设置等。2020/1/107zf窗口主菜单4:Data数据的操作和管理操作菜单•对数据编辑窗口中的数据进行加工整理,如:数据的排序、转置、选取、分类汇总、加权等2020/1/108zf窗口主菜单5:Transform数据基本处理操作菜单•对数据编辑窗口中的数据进行基本处理,如:生成新变量、计数、分组等。2020/1/109zf窗口主菜单6:Analyze数据分析操作菜单•Analyze统计分析对数据编辑窗口中的数据进行统计分析和建模,如:基本统计分析、均值比较、相关分析、回归分析、非参数检验等。2020/1/1010zf窗口主菜单7:Graphs制作统计图形操作菜单•对数据编辑窗口的数据生成各种统计图形,如:条形图、直方图、饼图、线图、散点图等。2020/1/1011zf窗口主菜单8:Utilities实用程序操作菜单•SPSS其他辅助管理,如:显示变量信息、定义变量集、菜单编辑器等2020/1/1012zf窗口主菜单9:Window窗口管理操作菜单•对SPSS中的多个窗口进行管理,如:窗口切换、最小化窗口等2020/1/1013zf窗口主菜单10:Help帮助操作菜单•实现SPSS的联机帮助,如语句检索、统计教练等2020/1/1014zf1.2结果输出窗口(output)标题栏分析结果文本栏工具栏输出导航栏菜单栏2020/1/1015zf1.3SPSS数据分析的一般步骤建立SPSS数据文件加工整理SPSS数据定义SPSS数据的结构录入和修改SPSS数据统计分析SPSS数据解释SPSS分析结果2020/1/1016zf2.SPSS数据文件的建立建立方式之一:直接录入。即利用SPSS数据编辑窗口定义SPSS数据的结构并输入数据。建立方式之二:其他数据格式导入方式。即直接读取其他格式的数据文件并将其转为SPSS格式数据2020/1/1017zf熟悉数据窗口中的两个重要按钮:数据视图和变量视图。对变量进行名称、类型、长度、标签小数点位等进行设置录入数据,在值与标签之间进行转换保存数据到指定文件夹2.1SPSS数据的直接录入2020/1/1018zf(1)熟悉数据视图和变量视图按钮数据录入窗口变量设置窗口2020/1/1019zf(2)变量设置•变量的默认设置:变量为数值型(numeric);小数点2位(decimals);变量名宽度8字符(width);数字右对齐(right);变量为连续型(scale);其余自定义变量名数据类型数据宽度小数位数变量名标签变量值标签缺失值定义列显示宽度度量尺度定义显示位置定义2020/1/1020zfA、变量名(name):变量名的字符个数不多于8个;首字符应以英文字母开头,后面可以跟除了!?*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符变量名不区分大小写字母SPSS有默认的变量名,以‘VAR’开题,后面补足5位数字。如:VAR00001等。2020/1/1021zfB、变量类型(type)•定义每个变量取值的类型。•数值型(numeric):默认宽度为8,小数位为2;•逗号型(comma):整数部分从各位开始每3位以一个逗号分隔,如:1,234.56•科学计数型(scientificnotation):120用科学计数法表示为1.2E+02•日期型、美元符号型、字符型等。2020/1/1022zfC、变量宽度(width):变量可显示的最大字符位数D、小数位数(decimals)E、变量名标签(label):对变量名含义的进一步解释说明,可增强变量名的可视性和统计结果的可读性。2020/1/1023zfF、变量值标签(value)•SPSS变量的数据类型大多应定义为数值型,这样有利于以后的数据分析;•变量值标签对于品质型数据尤为重要,可实现该类型变量的数值化,同时也对变量取值含义进行解释说明。•例如:性别变量,可用1表示男性,2表示女性。2020/1/1024zfG、缺失值(missing)A无缺失值(系统默认)B离散缺失值(最多定义3个)C连续缺失值或多于3个的离散缺失值(输入上下限定义,但不能包含合法值)•系统默认的缺失值用圆点表示。2020/1/1025zfH、列宽度(columns):数据编辑窗口中每列数据显示的字符位数I、对齐(Align):数据显示位置的定义,靠左/靠右/居中J、度量标准(Measure):将数据划分为定距型数据(scale)、定序型数据(ordinal)、定类型数据(Nominal)等。2020/1/1026zf定距型数据(scale):通常是指如身高、体重、收入等的连续型数据,也包括诸如人数、商品件数等离散型数据。(即可加减乘除的数据)定序型数据(ordinal):具有固有大小或高低顺序的数据,一般可以用数值或字符表示。如:职称、满意度定类型数据(Nominal):没有内在固有大小或高低顺序,一般以数值或字符表示的分类数据。2020/1/1027zfa.文件(File)--保存(Save)或另存为(Saveas)b.选择存放数据文件的目录路径和文件名,并根据需要选择数据文件的格式。(3)数据的录入(4)数据的保存将数据保存为Excel文件格式时,‘将变量名写入表格’呈可用状态,可指定是否将变量名写入Excel的第一行上。2020/1/1028zf1)选择菜单‘文件(File)’—打开(open)--数据(data)2)选择数据文件的类型,并输入数据文件名2.2读取其他格式的数据文件2020/1/1029zf若打开的是文本数据(.txt)会打开文本数据导入向导:•第一步:观察该窗口,确认SPSS是否已经正确地识别和分隔了数据;2020/1/1030zf选择‘固定宽度’和‘否’•第二步:若第一步未能正确识别,进入该步回答‘数据项间如何分隔’‘数据文件的第一行上是否有变量名;2020/1/1031zf•第三步:选择‘数据从文本文档的第几行开始’导入,‘多少行表示一个个案’‘数据是全部导入还是部分导入’;•第四步:‘数据项间分隔符’的选择,‘字符型数据分隔符’的选择;2020/1/1032zf•第五步:对数据预览中的变量进行规范(通常忽略进入下一步);•第六步:点击‘完成’即可;2020/1/1033zf数据预处理的意义:(1)对数据进行补充、修正、删除等工作,以保证数据的准确、完整。(2)对数据进行排序、加权、选择、合并等工作以满足分析要求(3)对数据进行转换或再计算,产生含有更丰富信息的新数据,以保证分析条件及目的的实现。3.SPSS数据的预处理主要内容:(1)数据的编辑(插入变量、个案,查找,替换等等)。(2)数据的处理(合并、拆分、选择、加权等等)2020/1/1034zf插入变量(insertvariable)插入个案(insertcase)查找替换(fide&replace)转至个案(gotocase)转向变量(gotovariable)变量的删除、复制和移动(cut、copy等)3.1SPSS数据的编辑(Edit)2020/1/1035zf数据操作管理主要完成有关数据的排序、转置、合并、拆分、加权、选择、分类汇总等。3.2SPSS数据操作管理(data)2020/1/1036zf3.2.1数据的排序--(数据--排序个案)排序的作用:(1)数据排序便于数据的浏览,有助于了解数据的取值状况、缺失值数量的多少;(2)通过排序能够快捷找到数据的最大值和最小值,初步把握和比较数据的离散度;(3)通过数据排序能够快捷地发现数据异常值和输入错误等;(4)排序为进一步统计分析提供基础。单值排序(排序变量只有一个)多重排序(排序变量有多个,可依次指定各变量的排序规则)2020/1/1037zfSPSS的数据转置:就是实现数据文件的行列互换。即变量转化为个案,而个案转化为变量。操作步骤:(1)选择菜单:‘数据(data)’---‘转置(transpose)’(2)指定数据转置后应保留哪些变量,将其选入‘变量(name)’框中(3)指定转置后数据文件中各变量如何取名。应取一个取值唯一的变量作为标记变量放到‘名称变量(namevariable)’3.2.2数据的转置--(数据--转置)案例:数据加工(职工数据).sav2020/1/1038zf2020/1/1039zf纵向合并数据文件:即是增加个案,就是将数据编辑窗口中的数据与另一个SPSS数据文件的数据进行首尾对接。操作步骤:‘数据’(data)--‘合并文件’(mergefiles)--‘添加个案’(addcases)注意事项:(1)为方便数据文件的纵向合并,一般情况下,两个文件应具有相同的变量;(2)若变量不同可以人为强迫不同变量配对,但要求有相同的数据类型;(3)可强行加入,不过会出现很多缺失值。3.2.3数据合并(mergefiles)主要有:纵向合并、横向合并2020/1/1040zf•合并后新数据文件中的变量:是两个数据文件的同名有相同含义的变量•不放入合并后的新数据文件中的变量:是两个数据文件不同名不同含义的变量。(*表示当前文件中变量;+为指定文件中变量)•如果名称不同但含义相同需进入合并文件中,咋办?•一是可以选择其中的两个变量名并点击‘对(pair)’指定配对后进入;二是可以对某变量单击‘重命名(rename)’后再指定配对;三是单击‘→’不经匹配强行进入。2020/1/1041zf在数据加工(职工数据.sav)的基础上纵向合并数据加工(纵向合并职工数据.sav)案例说明2020/1/1042zf横向合并数据文件,即:增加变量,就是价格数据编辑窗口中的数据与另一SPSS数据文件的数据左右对接。操作步骤:‘数据’(data)--‘合并文件’(mergefiles)--‘添加变量’(addvariables)注意事项:(1)两个数据文件必须至少有一个名称相同的变量,该变量是两个数据文件拼接的依据,称为关键变量。(2)两个数据文件都必须实现按关键变量进行升序排序;(若未排序则需选‘关键变量’以其id号为依据进行合并)(3)为方便数据文件的横向合并,不同数据文件中数据含义不相同的数据项,变量名不应相同。2020/1/1043zf由两个数据文件的个案共同组成合并后的数据文件在第二个数据文件基础上合并,合并后文件中的个案仅是第二数据文件中的个案•在当前数据文件基础上将第二文件的变量合并过来,即合并后文件中的个案仅是当前数据文件的个案2020/1/1044zf案例说明在数据加工(职工数据.sav)的基础上纵向合并数据加工(横向合并职工数据.sav)2020/1/1045zf数据拆分:与数据排序很相似,不同的是,数据拆分不仅是按指定变量进行简单排序,更重要的是根据变量对数据进行分组(即按指定变量把文件劈成几部分),为以后进行的分组统计分析提供便利。操作步骤:•(1)选择菜单‘数据’(data)--‘拆分文件’(splitfiles)
本文标题:SPSS数据文件的建立和预处理.
链接地址:https://www.777doc.com/doc-2860006 .html