您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据库 > spss课件第02章
数据分析技术&SPSS16.01第二章数据的组织数据分析技术&SPSS16.02主要内容2.1SPSS数据文件概述2.2SPSS数据文件的建立2.3从其他数据文件导入数据2.4SPSS数据文件的合并2.5SPSS数据的预处理数据分析技术&SPSS16.032.1SPSS数据文件概述2.1.1几个基本概念表2-1人员编号性别部门体检日期体重健康状况1女通信学院08/10/200455好2女计算机学院08/10/200446好3女外语学院08/10/200450一般4男通信学院08/10/200456差5男管理学院08/11/200451差6男光电学院08/11/200453好7女光电学院08/11/200450一般8男通信学院08/12/200450好9女计算机学院08/12/200445一般10男管理学院08/13/200456好变量个案样本变量值数据分析技术&SPSS16.042.1SPSS数据文件概述2.1.2统计数据的度量尺度观测数据:–是在自然的未被控制的条件下观测到的数据。–如社会商品零售额、消费价格指数、汽车销售额、降雨量等。实验数据:–是通过抽样调查,从研究对象全体中选取一部分个体组成样本,对样本的观测所得到的数据。数量的度量:–度量尺度(由低级向高级划分):–名义尺度–定序尺度–间隔尺度数据分析技术&SPSS16.052.1SPSS数据文件概述2.1.2统计数据的度量尺度1、名义尺度(Norminal)–即定类尺度,它仅仅是一种标志,用于区分变量的不同值,类别数据之间没有次序关系。–如:人口的性别、商品的名称、身份证、商店类型等。–特点:•仅测度了事物之间的类别差•所有类的地位相等,可以随意排序•计量结果可以且只能计算每一类各元素出现的频率•符合穷尽和互斥原则•变量取值可以是数值型,也可以是字符型数据分析技术&SPSS16.062.1SPSS数据文件概述2.1.2统计数据的度量尺度2、定序尺度(Ordinal)–是对事物之间等级或顺序差别的一种测度。–如:考试成绩(优、良、中、差)、人的身高等级(高、中、矮)、学历等级(博士、硕士、学士)等。–特点:•可以测度类别差,还可以测度次序差•但无法测出数据之间的准确差值•计量结果只能排序,不能进行算术四则运算•变量取值可以是数值型、也可以是字符型数据分析技术&SPSS16.072.1SPSS数据文件概述2.1.2统计数据的度量尺度3、间隔尺度(Scale)–间隔尺度是指变量的取值是连续的区间。分为两类。–1)定距尺度(Interval),是对事物类别或次序之间间距的测度。•如:100分制考试的成绩、重量、温度等。•特点:可区分不同类型并排序,且可准确指出类别之间的差距,并可以进行加减运算。数据分析技术&SPSS16.082.1SPSS数据文件概述2.1.2统计数据的度量尺度3、间隔尺度(Scale)–间隔尺度是指变量的取值是连续的区间。分为两类。–2)定比尺度(Ratio),是指能够测度值之间比值的一种计量尺度。•如:员工的月收入、企业产值等。•特点:–其区间属于同一阶层;–计量结果也表现为数值;–具有其它三类测量尺度的所有优秀,同时要计算两个测量值之间比值的特点。–可以进行+、-、*、/等延伸运算。数据分析技术&SPSS16.092.1SPSS数据文件概述2.1.2统计数据的度量尺度说明:不同的度量尺度的统计数据在SPSS的数据文件中,对应不同的变量数据类型。名义尺度----数值型、字符型定序尺度----数值型、字符型间隔尺度----数值型数据分析技术&SPSS16.010主要内容2.1SPSS数据文件概述2.2SPSS数据文件的建立2.3从其他数据文件导入数据2.4SPSS数据文件的合并2.5SPSS数据的预处理数据分析技术&SPSS16.0112.2SPSS数据文件的建立SPSS数据文件的建立包括两个方面,首先进行数据的结构定义,其次录入数据。2.2.1)数据的结构定义结构定义包括:变量名(Name)、变量类型(Type)、变量宽度(Width)、小数位数(Decimals)、变量名标签(Label)、变量值标签(Values)、缺失值(Missing)、列宽(Columns)、对齐方式(Align)、变量的度量尺度(Measure)图2.1数据分析技术&SPSS16.0122.2SPSS数据文件的建立2.2.1数据的结构定义变量名(Name)命名规则:–变量名长度可多达64位–建议控制在8位之内且尽量避免中文–中文说明可以放在Label栏中加以说明–首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或数字–下划线、圆点不能为变量名的最后一个字符–变量名必须唯一且不区分大小写字母–允许汉字作为变量名,汉字总数一般不超过4个–变量名不能与SPSS的保留字相同:all、by、eq、ge、gt、leIt、ne、not、or、to、with–系统不区分变量名的大小写数据分析技术&SPSS16.0132.2SPSS数据文件的建立2.2.1数据的结构定义变量类型(Type)表2-2英文名中文名说明Numeric标准数值型变量默认总长度8位,小数位2位。Comma带逗号的数值型变量默认总长度8位,小数位2位,其值在显示时整数部分从右至左每三位用一个逗号做分隔符。Dot带圆点的数值型变量默认总长度8位,小数位2位,其值在显示时整数部分从右至左每三位用一个圆点做分隔符。Scientificnotation科学记数法数值型变量默认总长度8位,小数位2位,变量值可以有指数部分也可以没有。指数部分用E或D表示且可带正负号。Date日期型变量既可表示日期又可表示时间,用户可根据实际情况自行选择。Dollar美元符号型数值变量主要用来表示货币数据,在数据前附加美元符号$。Customcurrency自定义数值型变量用户可以自定义变量类型,但是此项一般不用。String字符型变量默认总长度为8位。数据分析技术&SPSS16.0142.2SPSS数据文件的建立2.2.1数据的结构定义变量宽度(Width)–设置变量宽度。一般无需调整,直接采取默认值。它的大小可通过Width栏后边的微调按钮调整小数位数(Decimals)–若变量类型为数值型,则可设置变量的小数位数,其他类型的变量则不能设置。小数位数默认为两位变量名标签(Label)–考虑到与老版本的兼容问题,变量名最好限制为8位以内,并且尽量避免中文,这就有可能不能完全描述清楚变量的信息,此时就可在标签中对变量名做进一步的说明。–利用Label栏,不仅可以对变量详细说明,而且还可以采用中文,大大方便了用户对变量的理解。数据分析技术&SPSS16.0152.2SPSS数据文件的建立2.2.1数据的结构定义变量值标签(Values)–变量值标签是对变量的可能取值附加的进一步说明,标签内容最多可以有120个字符,通常仅对类型或分类变量的取值指定值标签例如,将变量Departmt定义为数值型变量时,可以按照表2-3中所规定它的值和值标签,具体定义方法见图2.2。变量值变量值标签1通信学院2计算机学院3管理学院4光电学院5外语学院表2-3图2.2数据分析技术&SPSS16.0162.2SPSS数据文件的建立2.2.1数据的结构定义缺失值(Missing)–SPSS统计软件的另一特点就是可以通过制定缺失值的方式来定义缺失数据,这样就可以更好地利用其他的有效数据。–例:•调查表中某栏没填写数据(缺失)•学生年龄为60岁(数据不完整)数据分析技术&SPSS16.0172.2SPSS数据文件的建立2.2.1数据的结构定义缺失值(Missing)–处理方法(3种):•NoMissingValues:不指定缺失值•Discretemissingvalues:离散型缺失值,对数值型或字符型变量,用指定1-3个特定的离散值•Rangeplusoneoptionaldiscretemissingvalue,对数值型变量,缺失值定义为一个连续的闭区间以内,外加一个离散值。数据分析技术&SPSS16.0182.2SPSS数据文件的建立2.2.1数据的结构定义列宽(Columns)–定义变量在数据窗口中显示的宽度。对齐方式(Align)–定义变量值显示的对齐方式,默认为左对齐。变量的度量尺度(Measure)(见2.1.2)–根据统计数据的类型定义度量尺度,度量尺度在数据分析中的作用不是很明显,但是如果用户要进行交互式绘图就必须定义好度量尺度。数据分析技术&SPSS16.0192.2SPSS数据文件的建立2.2.2数据的录入录入数据的一般方法–逐行录入(TAB键)–逐列录入(回车键)–从Word或Excel中直接复制粘贴到数据文件中–连续粘贴相同值数据分析技术&SPSS16.0202.2SPSS数据文件的建立2.2.2数据的录入–录入带有变量值标签的数据–输入定义了变量值标签的数据时,可以直接输入变量值,也可以通过下拉列框的形式输入,如图2.3所示。图2.3数据分析技术&SPSS16.0212.2SPSS数据文件的建立2.2.2数据的录入–实例P26-27数据分析技术&SPSS16.0222.2SPSS数据文件的建立2.2.3数据的编辑–数据定位–按编号行或变量列定位–按变量值查找定位–变量、观测量的插入与删除–插入、删除一行(个案)–插入、删除一个列(变量)–数据的剪切、复制和删除数据分析技术&SPSS16.0232.2SPSS数据文件的建立2.2.4数据的保存SPSS支持的数据格式保存操作数据分析技术&SPSS16.024主要内容2.1SPSS数据文件概述2.2SPSS数据文件的建立2.3从其他数据文件导入数据2.4SPSS数据文件的合并2.5SPSS数据的预处理数据分析技术&SPSS16.0252.3从其他数据文件导入数据(1)直接打开SPSS可直接打开很多类型的数据文件,选择菜单File→Open→Data,弹出OpenFile对话框,左键单击“文件类型”,即可看到SPSS所能打开的数据文件类型,如表2-4所示。表2-4文件扩展名具体描述SPSS(*.sav)当前版本SPSS16.0数据文件SPSS/PC+(*.sys)老版本SPSS数据文件Systat(*.syd*.sys)Systat格式数据文件SPSSPortable(*.por)SPSS的ASCII数据文件Excel(*.xls,*.xlsx,*.xlsm)各种版本的Excel数据文件,此种数据格式常用。Lotus(*.w*)Lotus数据文件Sylk(*.slk)Sylk数据文件dBase(*.dbf)dBase数据文件,Foxpro下的dbf文件需转换为dBase文件才能打开SAS(*.sas7bat,*.sd7,*sd2,*.ssd01,*.xpt)各种版本和类型的SAS数据文件,一种统计学软件的数据文件格式Stata(*.dta)Stata数据文件,一种统计软件的数据文件格式Text(*.txt,*.dat)文本数据文件数据分析技术&SPSS16.0262.3从其他数据文件导入数据(1)直接打开说明:其中用的最多的是直接打开Excel的数据文件。在打开Excel格式的文件时,SPSS默认将Excel工作表中的全部数据读到SPSS数据编辑窗口中,但也可指定仅读取工作表某个区域内的数据。如果Excel工作表文件第一行或指定读取区域内的第一行上存储了变量名信息,则应选择打开对话框上的复选框“Readvariablenamesformthefirstrowofdata”,即以工作表第一行或指定读取区域内的第一行上的文字信息作为SPSS的变量名;如果不选此项,SPSS的变量名将自动取名为V1、V2等。数据分析技术&SPSS16.0272.3从其他数据文件导入数据(2)数据库查询方式如果数据为数据库格式的文件,可以同用数据库查询的方式导入数据到SPSS中。其操作步骤如下:第1步选择菜单File→OpenDatabase→NewQuery,弹出D
本文标题:spss课件第02章
链接地址:https://www.777doc.com/doc-2860070 .html