您好,欢迎访问三七文档
SPSS入门讲义统计分析软件是数据分析的主要工具完整的数据分析过程包括:数据的收集数据的整理数据的分析统计学为数据分析过程提供一套完整的科学的方法论。统计软件为数据分析提供了实现手段。关于SPSS软件SPSS是“社会科学统计软件包”(StatisticalPackagefortheSocialScience)的简称,是一种集成化的计算机数据处理应用软件。1968年,美国斯坦福大学H.Nie等三位大学生开发了最早的SPSS统计软件,并于1975年在芝加哥成立了SPSS公司,已有30余年的成长历史,全球约有25万家产品用户,广泛分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研、教育等多个领域和行业。SPSS是世界上公认的三大数据分析软件之一(SAS、SPSS和SYSTAT)目前,世界上最著名的数据分析软件是SAS和SPSS。SAS由于是为专业统计分析人员设计的,具有功能强大,灵活多样的特点,为专业人士所喜爱。而SPSS是为广大的非专业人士设计,它操作简便,好学易懂,简单实用,因而很受非专业人士的青睐。此外,比起SAS软件来,SPSS主要针对着社会科学研究领域开发,因而更适合应用于教育科学研究,是国外教育科研人员必备的科研工具。1988年,中国高教学会首次推广了这种软件,从此成为国内教育科研人员最常用的工具。SPSS软件的特点①集数据录入、资料编辑、数据管理、统计分析、报表制作、图形绘制为一体。从理论上说,只要计算机硬盘和内存足够大,SPSS可以处理任意大小的数据文件,无论文件中包含多少个变量,也不论数据中包含多少个案例②统计功能囊括了《教育统计学》中所有的项目,包括常规的集中量数和差异量数、相关分析、回归分析、方差分析、卡方检验、t检验和非参数检验;也包括近期发展的多元统计技术,如多元回归分析、聚类分析、判别分析、主成分分析和因子分析等方法,并能在屏幕(或打印机)上显示(打印)如正态分布图、直方图、散点图等各种统计图表。从某种意义上讲,SPSS软件还可以帮助数学功底不够的使用者学习运用现代统计技术。使用者仅需要关心某个问题应该采用何种统计方法,并初步掌握对计算结果的解释,而不需要了解其具体运算过程,可能在使用手册的帮助下定量分析数据。③自从1995年SPSS公司与微软公司合作开发SPSS界面后,SPSS界面变得越来越友好,操作也越来越简单。熟悉微软公司产品的用户学起SPSS操作很容易上手。SPSSforWindows界面完全是菜单式,一般稍有统计基础的人经过三天培训即可用SPSS做简单的数据分析,包括绘制图表、简单回归、相关分析等等,关键在于如何进行结果分析及解释,这一方面需要学习一些数理统计的基本知识,另一方面也要多进行实践,在实践中了解各种统计结果的实际意义一、SPSS统计数据的创建与编辑SPSS数据的属性及其定义方法SPSS数据文件的构成应用案例:定义SPSS数据结构SPSS数据的录入SPSS数据的编辑数据文件的操作1.SPSS数据的属性及其定义方法一个完整的SPSS数据结构包括:变量名、变量类型、变量名标签、变量值标签、缺失值的定义、度量的尺度、及数据的显示属性(显示宽度、列宽度、对齐方式)1.1变量名首字符必须是字母或汉字,后面可以是除(!、?*)之外的任意字符。变量名的结尾不能是圆点、句点、下划线变量名的长度不能超过64个字符变量名必须唯一,并且不区分大小写SPSS的保留字不能作为变量名(ALL、NE、EQ、GTAND、NOT、WITH)如不指定变量名,则系统默认变量名以VAR开头后面跟5个数字为了便于记忆和理解,变量名与其所代表的具体含义一致。1.2变量的类型(Type)数值型:根据其功能和形式又可细分为(标准型、逗号型、句点型、科学计数型、美元型和自定义货币型)字符型日期型系统默认为标准数值型1.2.1数值型变量标准型:是SPSS默认的类型,宽度8、小数点2、小数点用圆点。科学计数类型:适合数值很大或很小的变量,变量显示为指数形式。如:-1.28E+002表示-1.28×102逗号型(comma)圆点型(Dot)美元型(Dollar)自定义货币型1.2.2日期型变量(Date)用于表示日期和时间的变量类型SPSS提供了多达29种日期型变量的格式.1.2.3字符型变量(String)是非数值型变量类型,其值是由字符串组成的.对其定义的对话框只有一个输入项1.2.4修改数据变量的默认值对于SPSS变量的参数,系统都会自动给出默认值.也可通过Edit菜单中的Date对话框重新设置点击1.3变量标签(Label)变量名标签(variablelabel)对变量名含义的进一步补充说明。变量值标签(ValueLabel)是对数值型变量各个取值的含义给予进一步的解释和说明1.4变量缺失数据(missingvalue)系统默认无缺失值:如当前变量测试值、记录完全正确、无遗漏,则可用无缺失值。•离散缺失值:如性别0、3、4都是非法的,可分别填入点击定义缺失值范围:这种缺失值针对连续的变量值。当指定某一范围的值出现在当前定义的变量中,则被当作缺失值处理。如在性别变量值中输入了3、4、5、6。可以在LOW后面输入3,HIGHT后面输入6。注意这个定义范围内不能有合法值。”0“就是包括不了的离散值1.5度量尺度定距型变量(scale)可以表示如温度、重量等含义的连续性数值变量,也可以表示年龄、次数等离散型变量.还可以表示时间的日期变量或者货币的货币型变量,但不能是字符型变量.定序型变量(ordinal)其值表示一种顺序的前后,如职称变量可分为高中低三个档次,可用A(1)、B(2)、C(3)表示,定序型变量可以是数值型也可以字符型定类型变量(nominal):该变量不存在变量值之间的大小、顺序的前后等。只表示属于的类别。如性别中“1”表示男,“2”表示女等,可以是数值型也可以字符型数据录入实例2.SPSS数据文件的构成由数据结构和数据内容构成结构规定了数据文件的基本构成属性(变量名、变量类型、变量名标签、变量值标签、缺失值定义、度量尺度及数据显示属性如宽度列宽度和对齐方式等)如一个班考试成绩表包含姓名、考号、各科科目成绩(英语、数学、政治、专业)等六个变量。对每一个变量定义其属性,如“姓名”变量定义为字符型、宽度定义为8个字符,度量尺度为定类型,由于变量含义清楚,无须定义变量标签和变量值标签,缺失值默认为02.1创建SPSS数据文件1.在VariablesView视区定义变量及其变量的属性2.在DateView视区录入数据文件的内容浏览数据文件变量名的三种方法在VariableView视区中浏览在SPSS菜单中选择Utilities→Varibles在SPSS主界面选择File→DisplayDateFileinformationSPSS数据的录入当变量的属性定义完成后就可以开始进行数据的输入切换窗口从VariablesViewDateView出现了二维的空白表格如Excel(见03Date1)Enter输入一列相同参数Tab输入一行同一案例的数据Shift+Tab光标左移SPSS数据的编辑保证录入的数据准确无误,需要对SPSS数据进行修改、删除、插入、复制、定位等操作。创建和读取SPSS数据文件1.直接通过SPSS数据编辑窗口定义变量输入数据(如前所述)2.通过打开不同格式的数据文件,间接创建SPSS数据文件。支持*.doc,*.xls,*.txt等保存SPSS数据经读取、修改后把SPSS窗口的数据以数据文件的形式保存到外部的储介质中。二、SPSS常用统计图条形图线图面积图圆图直方图箱图散点图时间序列图质量控制图正态分布图条形图条形图(BarCharts)用直条的长短来表示非连续性的资料的数量大小。常用的条形图有单式条形图(Simple)、复式条形图(Clustered)堆积式直条图(Stacked)。线图线图(LineCharts)是用线条的上下波动的形式,来反映连续性的相对资料的变化趋势。常用的线图有单线图(Simple)、复线图(Multiple)和垂线图(Drop-line)。面积图面积图(AreaCharts)是用线段下的阴影面积来签掉现象变化的统计图。面积图使用面积来表现连续性的聘书分布资料,面积越大,频数越多,反之亦然。类型:简单面积图(Simple)和堆栈统计图(Stacked)。圆图(饼图)圆图(PieCharts)是用圆的整体面积代表被研究对象的总体,按各组成部分的比重把圆面积分成若干个扇形,用以表示对象的部分对总体的比例关系的统计图。箱图箱图(Boxplots)是一种描述数据分布的统计图,利用它可以从视觉的角度来观察变量值的分布情况。箱图主要表示变量值的中位数、四分之一数、四分之三数等统计量。散点图散点图(Scatterplots)又称散布图或相关图,是以点的分布反映变量之间相关情况的统计图形,根据图中各点分步走向和密集程度,大致可以判断变量之间协变关系的类型。时间序列图时间序列是指按时间顺序排列的随机变量的一组实测值。时间序列图是从运动的角度来认识事物的本质。质量控制图质量控制图(ControlCharts)又称质量管理图,是在分析和判断生产工序是否处于稳定状态时所使用的一种统计图。分类:计量型控制图和计数型控制图。三、SPSS的基本操作3.1数据的输入与整理3.2条形图的生成3.3正态分布图的生成案例:用PPI预测CPI3.1数据的输入变量属性:变量名、变量类型、变量标签、变量长度变量基本类型:数值型、字符型、日期型类型:标准数值型(Numeric)、加显逗号的数值型(Comma)、定义带圆点的数值型(Dot)、科学计数型(Scientificnotation)、日期型(Date)、货币型(Dollar)、自定义型(Customcurrency)、字符型(String)数据的编辑DefineDates:定义InsertVariable:插入一个变量InsertCases:插入一个观测量GotoCase:定位SortCases:按某变量值对观测量进行排序Transpose:转置Restructure:重组MergeFlies:合并数据文件SplitFiles:拆分数据文件SelectCases:选择观测量Aggregate:汇总WeightCases:加权处理Cut:剪切Copy:复制Undo:删除Redo:重复Paste:粘贴PasteVariables:粘贴变量Clear:清除Find:查找数据的整理数据的排序数据的分类汇总数据的计算3.2条形图的生成生产线MONTUEWEDTHUFRISATSUN125624725125424925325023613593653573603593533197205192189180190207第一步:选择图形(Graphs),在下拉菜单中选择Bar项。进入BarCharts对话框。第二步:在对话框选择”复式直条图(Clustered)””Summariesforgroupsofcases”,点击”定义(Define)”按钮,进入对话框。选择”Othersummaryfunction”项,将”产量”,点击对话框中的向右箭头按钮使之进入”Variable”框;选中”生产线”,点击使之进入”CategoryAxis”框;选中”星期”点击进入”DefineClusters”框。点击”titles”按钮,弹出”Titles”对话框。第三步:在Title对话框内输入“某公司三天生产线产量统计图”点击”Continue”按钮返回上一级对话框。第四步:点击”OK”即可。3.3正态分布图的生成编号工资编号工资编号工资164117521872651278228936513772389468147924905681579259167116822691771178427
本文标题:SPSS-入门教程
链接地址:https://www.777doc.com/doc-4514236 .html