您好,欢迎访问三七文档
1第1章SPSS简介SPSS简介。SPSS是StatisticlPackageforSocialScience的英文缩写,即:社会科学统计分析软件包,它是当今世界上公认和流行的综合统计分析软件包。SPSS的应用面广阔,它在经济学、生物学、心理学、医疗卫生、体育、农业、林业、商业、金融等各领域均有广泛的应用。SPSS提供了一种很友好的用户界面,需什么统计功能,直接单击菜单即可。通过简单的菜单式操作,就可以方便地规范和融合搜集到的原始数据,并能实施从简单的描述性统计分析到复杂的时序分析等多种方法,对数据进行建模,返回有意义的分析结果,比如客户特征的分类、发展趋势和预测等。把这些结果对应于实际,可以帮助使用者在发掘潜在客户、制定长远规划等工作上作出更加准确的判断。SPSS的基本统计分析功能有:频数分析、描述统计量分析、相关分析、回归分析、因子分析、聚类分析、判别分析、各种统计图形等等。数据文件的操作与建立一、SPSS数据文件的特点SPSS数据文件是一种有结构的数据文件,它包括文件结构和数据两部分。SPSS数据文件中的一列数据称为一个变量,每个变量都有名称,SPSS数据文件的结构是对每个变量及相关属性的描述。SPSS数据文件的建立步骤:第一步:定义SPSS数据文件的结构;第二步:输入数据。二、数据文件的结构SPSS数据文件的结构是对每列变量及其相关属性的描述,它包括:变量名、变量类型、变量宽度、变量名标签、变量值标签、变量列格式、变量缺失值、变量度量方法等信息。(一)如何定义一个变量单击数据编辑窗口下面的VariableView选项,数据窗口便处于定义变量状态,如图1-1所示:2图1-1VariableView界面1、变量名(Name)变量名是变量存取的唯一标志。在定义SPSS数据文件结构时应首先给出每列变量的变量名。SPSS默认的变量名以VAR三个字母开头,后面跟补足5位的数字。如VAR00001、VAR00015等。变量名的取名规则是:(1)从SPSS12.0版本开始,变量名最多可写64个字符长度;(2)首字符不能是数字,必须是24个英文字母或以下符号之一:@、#或$,其后可以是除了“?”、“!”、“*”之外的字母、数字、小数点或其他任意非标点符号的字符。下划线、圆点不能为变量名的最后一个字符。★以“#”为首写的变量名特指草稿型变量。此种类型的变量只能在命令窗口使用,在其他地方不可用。★以“$”为首写的变量名特指SPSS的系统变量。系统变量不可修改,而且在程序中不可用,用户定义的变量不能以“$”为首写。(3)变量名不能与SPSS内部特有的具有特定含义的保留字符相同,如ALL、AND、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH,等;(4)系统不区分变量名中的大小写字母,允许汉字作为变量名,汉字总数不能超过4个;3(5)变量名中不能包含空格。2、变量的类型(Type)和宽度(Width)SPSS中有三种基本的变量类型,即:数值型、字符型和日期型。每种变量类型的数据在数据编辑窗口中都有其默认的宽度和样式。(1)数值型数值型是SPSS常用的变量类型。数值型的数据由0-9的阿拉伯数字和其他特殊符号,如美元符号、逗号、圆点组成的。如工资、年龄、成绩等变量都可定义为数值型数据。数值型有以下六种不同的表示方法:A、标准数值型(Numeric)标准数值型是系统默认的数据类型。标准数值型默认的最大显示宽度是8位(含小数点及负号),小数是2位。例如:12345678、-1234567、12345.67、-1234.56B、逗号数值型(Comma)逗号数值型其整数部分从个位开始每隔3位以一个逗号分隔,用圆点作小数点。它的默认最大显示宽度是8位(含逗号所占的位数),小数是2位。C、圆点数值型(Dot)圆点数值型数据其整数部分从个位开始每3位以一个圆点分隔,用逗号作小数点。如:1.234,56D、科学记数法型(ScientificNotation)科学记数法也是数值型数据表示方式的一种。如:270用科学记数法表示为2.7E+02,其中的E表示以10为底,+02表示10的2次方;0.00036用科学记数法记为3.6E-04,E表示以10为底,-04表示负的4次方。科学记数法默认的显示总宽度为8。E、美元数值型(Dollar)美元数值型主要用来表示货币数据,在数据前附加美元符号$。默认宽度是8位,小数是2位。F、用户自定义型(CustomCurrency)用户自定义型是用户利用菜单的Options功能来定义的。(2)字符型(String)4由一个字符串组成。如职工号码、姓名、地点等变量都可定义为字符型数据。字符型数据的默认显示宽度为8个字符位,它不能进行算术运算,并区分大小写字母。字符串中的大写字母与小写字母,是截然不同的两个字符,这一点在使用时要特别注意。(3)日期型(Data)日期型数据用来表示日期或者时间。如生日、成立日期等可定义为日期型数据。日期型数据的显示格式很多,例如:dd-mmm-yy(例子15-OCT-99)、dd-mmm-yyyy(例子15-OCT-1999)、mm/dd/yy(例子10/15/90)、hh:mm:ss.s(例子01:02:34.75)等等。下面给出关于日期型变量格式的几点说明:★“dd”是用两位数来表示日期数;★“ddd”是用三位数来表示从元月一日算起的日数;★“mm”是用数字表示的月份数;★“mmm”是用英文月份单词的前3个字母表示的月份;★“yy”是用两位数来表示的年份;★“yyyy”是用四位数来表示的年份;★“hh”表示小时;“mm”表示分钟;“ss”表示秒;★“m”用于年与日(字母y与d)之间时表示月份;用于时与秒(字母h与s)之间时表示分钟。指定了日期型变量的格式后,输入时不一定按指定的格式输入,可以用“/”或“_”作为具体日期的分隔符,回车后系统回自动转换成指定的格式。SPSS以菜单的方式将所有的日期显示格式列出来供用户选择。3、定义变量名标签(VariableLabel)变量标签是对变量名的进一步说明,当变量名较短时,自身字符不足以表明其具体含义,而当变量比较多时更需要对变量名的含义加以详细解释。在定义变量窗口中Label下的单元格中输入标签。如name栏的“g”代表性别,则Label栏输入“性别”。在统计分析的输出结果中,可以在与变量名相对应的位置显示该变量的标签,或者直接以变量标签替代变量名显示,这有助于理解和分析输出结果。如图1-2所示:5图1-2变量名标签定义对话框4、定义变量值标签(ValueLabel)变量值标签是对变量取值所作的进一步说明。分类变量经常需要定义其取值的标签。例如对于性别数据,假定用1代表男,用0表示女。变量值标签是一个可选择的属性,可以定义,也可以不定义,但像性别之类的变量最好给出变量值标签。如图1-3所示:图1-3变量值标签定义对话框5、变量列格式(ColumnFormar)数据列格式包括变量的列宽度(Columns)和数据的对齐方式(Align)。(1)宽度(Columns)显示数据的长度。例如:可以单击Columns下的单元格,选择列宽数值。在定义变量列格式的宽度时,要综合考虑变量类型所定义的长度和变量名所占的宽度,选择较大的一个作为该变量的列格式宽度,这样才能保证变量名和变量值都可以正常显示。(2)对齐方式(TextAlignment):分左对齐、右对齐、中间对齐。例如:变量名标签变量值标签6可以单击Align下的单元格,选择对齐方式。6、变量缺失值(MissingValues)已经输入的失真数据,没有测到或没有记录的数据,以特殊的数字或符号输入到数据文件中,统称为“缺失值”,分析时不能使用,要单独处理。各分析过程对缺失值的处理都有默认的方法,也可以由用户指定如何处理这些缺失值。7、变量的测度方式(Measure)定比测度(Scale),即按比例测度的变量。如身高、体重。定序测度(Ordinal),如表示职称、职位、对某种事物的赞同程度的变量。定类测度(Nominal)如表示民族、宗教信仰、党派等的变量。可以单击Measure下的单元格,选择测度方式。四、数据的录入与保存1、数据的录入定义好变量后,在图1-4所示的数据编辑窗口(DataView窗口),可以直接录入和编辑数据。每一列代表一个变量,每一行是数据文件的一个记录。如图1-4所示:图1-4数据录入窗口2、数据文件的保存SPSS数据文件保存的操作步骤是:(1)菜单选项:File→Save或者File→Saveas(2)给出存放数据文件的目录路径和数据文件的用户名,并根据实际需要,选择数据文件的格式和相应的文件扩展名。扩展名默认为.sav。7操作练习:已知2007年我国各地区农村居民家庭人均纯收入如下表所示:2007年我国各地区农村居民家庭人均纯收入编号地区人均纯收入(元)编号地区人均纯收入(元)1北京9439.6317湖北3997.482天津7010.0618湖南3904.203河北4293.4319广东5624.044山西3665.6620广西3224.055内蒙古3953.1021海南3791.376辽宁4773.4322重庆3509.297吉林4191.3423四川3546.698黑龙江4132.2924贵州2373.999上海10144.6225云南2634.0910江苏6561.0126西藏2788.2011浙江8265.1527陕西2644.6912安徽3556.2728甘肃2328.9213福建5467.0829青海2683.7814江西4044.7030宁夏3180.8415山东4985.3431新疆3182.9716河南3851.60资料来源:《中国统计年鉴2008》。要求:在SPSS“VariableView”窗口给出变量名;在“DataView”窗口录入数据。操作练习答案:在“VariableView”窗口给出变量名:8在“DataView”窗口录入数据:
本文标题:第1章SPSS简介
链接地址:https://www.777doc.com/doc-2244564 .html