您好,欢迎访问三七文档
1PartⅠ:SPSS简介2SPSS软件的发展史1968年:斯坦福大学三位学生创建了SPSS1968年:诞生第一个用于大型机的统计软件1975年:在芝加哥成立SPSS总部1984年:推出用于个人电脑的SPSS/PC+1992年:推出Windows版本,同时全球自SPSS11.0起,2002年,SPSS全称为“StatisticalProductandServiceSolutions”,即“统计产品和服务解决方案”3SPSS软件的发展史2009年:SPSS公司宣布重新包装旗下的SPSS产品线,定位为预测统计分析软件(PredictiveAnalyticsSoftware)PASW,包括四部分:PASWStatistics(formerlySPSSStatistics):统计分析PASWModeler(formerlyClementine):数据挖掘DataCollectionfamily(formerlyDimensions):数据收集PASWCollaborationandDeploymentServices(formerlyPredictiveEnterpriseServices):企业应用服务2010年:随着SPSS公司被IBM公司并购,各子产品家族名称前面不再以PASW为名,修改为统一加上IBMSPSS字样4SPSS软件的特点简便性:菜单操作兼容性:兼容中文数据、汉化、数据接口功能。功能性:具有丰富的统计分析功能,且针对性强。权威性:各领域广泛应用,结果具有权威性。5SPSS软件的运行方式完全窗口菜单运行—简单易用,操作方便!程序运行—灵活丰富,最大程度发挥软件的效能!批处理运行—在ProductionFacility中运行程序。Include命令—可在系统菜单中嵌入用户自定义的命令(高级版本SPSS)。6SPSS软件的模块7SPSS操作界面DataEditor:数据编辑器DataView:数据窗口VariableView:变量窗口OutputViewer:结果窗口8SPSS统计分析结果保存Html网页文件格式:HtmWord格式:Doc文本格式:TxtExcel格式:Xls其它格式9SPSS帮助系统Whatisthis?右击鼠标获取。Topics:点击帮助下拉菜单获取。对话框Help:点击对话框中的Help获取。语法帮助:点击帮助下拉菜单获取。其它帮助10PartⅡ:数据库的建立11数据资料的形式主要有两种形式:原始资料:如调查问卷中的数据.已经录入成其它数据格式的资料:如Excel电子表格数据,需要将其内容读入SPSS中。122.1:原始数据的录入13数据录入步骤数据录入:将每个观察单位的每个观察指标的观察值录入SPSS数据库中。步骤:“三步曲”定义变量名指定变量属性录入数据14数据录入—变量属性变量名变量类型变量宽度小数位变量名标签变量值标签缺失值列宽数据对齐方式测量尺度15数据录入—变量名的要求首字符终须是字母或中文,不能是数字不能含有空格等非法字符不能以句点或“_”结尾不能超过64个字符同一个文件中变量名不能重复不能与SPSS保留字相同。ALL、AND、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH等16数据录入—变量类型、标签SPSS中变量有三种基本类型:数值型、字符型和日期型。数值型:标准数值、逗号数值、圆点数值、科学计数法、美元数值、用户自定义六种Label用于定义变量名标签,可以在输出结果中直接显示。Value用于定义变量值标签,输出结果中也可以显示。17数据录入—测量尺度类型分类尺度:仅对事物进行分类,不具运算意义。等级尺度:也对事物进行分类,但可以排序。定距尺度:用数值描述研究对象,可以进行加减运算,用于衡量不同类别之间的差距,但没能绝对“零点”,不能进行乘除运算。定比尺度:同样用数值描述研究对象,但有一固定的绝对“零点”,可以进行加减乘除运算。18数据类型数据无序分类数据有序分类数据数值变量数据分类变量数据资料也称为定量变量数据资料,可分为离散型和连续型两种类型19SPSS数据窗口中的行与列每一行表示一条记录,记录一个观察单位(case)所有变量的信息。每一列表示一个变量,记录所有观察单位某一个变量(race)的信息20多选题数据的录入多选题(MultipleResponse):指对一个被调查对象,回答某一个问题时可以有多个选项。例如:请问贵校招聘人才的途径有哪些?请问您获取新闻的方式常用的有哪些?等等。多选题的数据录入方式多重二分法(multipledichotomymethod):即将多选题的每一个选项拆解成一个0-1变量,每个变量同等对待。多重分类法(multiplecategorymethod):根据所有调查对象实际具有的最多的选项数确定变量个数,每个变量的取值是多分类且为多选题所有可能的选项,每个变量同等对待。21多选题数据的分析多选题录入后,在对该数据进行分析之前,必须先定义一个多选题集,然后才能把该定义该多选题数据的全部变量作为一个变量来进行分析!菜单操作:Analyze→MultipleResponse→DefineSets222.1:外部数据的导入23导入外部数据的方法对于SPSS格式的外部数据,只要点击File→Open→Data,选择文件路径及文件名即可打开。对于非SPSS格式外部数据,导入的方式主要有三种:直接打开利用文本向导导入利用数据库ODBC接口导入24导入Excel数据首先在Excel中打开数据文件,了解文件的结构:文件中包含几张数据表,想要读入哪一张;需要读入数据表中的哪些数据;第一行是否是变量名然后通过File→Open→Data,选择文件类型”Excel”,直接打开文件。25导入Excel数据26导入文本(Text)数据首先打开数据文件,查看文件结构:变量之间是固定宽度还是用某种分隔符区分;第一行是否是变量名;第一条记录从第几行开始;数据中的字符串变量是否使用了某种限定符进行分隔。SPSS可以通过两种菜单操作方式导入文本数据。1)File→Open→Data,选择文件类型”Text”;2)File→ReadTextData.27导入文本(Text)数据28导入文本数据—Step129导入文本数据—Step2分隔符分隔的文本文件:变量之间用符号(逗号,句号,空格,TAB键等)分隔。固定宽度的文本文件:每个变量在每一行中所占的列位置是固定。30导入文本数据—Step331导入文本数据—Step432导入文本数据—Step533导入文本数据—Step634从数据库中导入数据SPSS可以直接导入很多类型的数据文件,对于不能直接打开的数据格式,SPSS提供了利用通用的数据库接口读取数据的方法。先配置ODBC,通过ODBC接口和数据库(以.MDB为例)进行连接:再在SPSS中打开数据库读取需要的数据:File→OpenDatabase→NewQuery35配置ODBC—EPIInfo格式数据源36利用ODBC从外部读取MDB格式数据Step137Step2-3利用ODBC从外部读取MDB格式数据38利用ODBC从外部读取MDB格式数据Step439利用ODBC从外部读取MDB格式数据Step540利用ODBC从外部读取MDB格式数据Step641获取外部数据的几点注意事项变量名称原始数据文件中是否有变量名同一文件变量名称是否有重复变量名称是否符合SPSS规范变量属性建议导入外部数据后逐一修订变量属性。422.3:数据保存43数据保存File→Save,指定文件名和保存路径将文件保存为SPSS格式。File→SaveAS,在对话框中可选择保存变量,且可以选择数据的保存格式(xls,dbf,dat等非SPSS格式)。建议在录入和修改数据的过程中随时保存数据!44PartⅢ:数据库的整理45数据整理数据整理是进行统计分析之前必不可少的步骤。目的有二:发现数据的错误、识别异常值及探索数据的基本特征;从变量或文件的层次对数据结构进行调整,使数据能直接应用于统计分析。在SPSS软件中,数据文件的管理功能集中于Transform和Data两个主菜单之下,但数据整理过程中通常会涉及对数据进行描述性统计分析,所以整数整理也涉及Analyze菜单中的DescriptiveStatisitcs模块。46数据整理—数据的预处理数据的审核发现数据中的错误查找重复记录识别异常值等数据文件的合并及新变量的产生缺失值替代数据的筛选:找出符合条件的数据数据的排序:发现数据的基本特征47数据审核对于原始数据,主要从完整性和准确性两个方面进行审核。对于二手数据,除了审核其完整性和准确性外,还应着重审核数据的适用性和时效性。48数据审核—探索性分析49探索性分析—实例50探索性分析—主界面51探索性分析—对话框52探索性分析—对话框53探索性分析—结果54探索性分析—结果55文件的合并(Merge)及新变量的产生文件的合并分为纵向合并和横向合并两种情形。纵向合并,即追加记录(AddCases),往往要求文件的数据结构相同。横向合并,即增加变量(AddVariables),往往要求两个文件同时包含一个相同的变量(匹配变量)。利用Transform主菜单中的Compute功能产生新变量。56缺失值替代在数据收集过程中,由于研究者或研究对象的原因,往往无法获得某些观察对象某些变量的取值,造成了变量取值的缺失。为保持数据的完整性,往往要求对研究对象进行重新观察来获取变量的取值并代替缺失值,但实际工作中大多数情况下无法实现这种重新观察。此时,可以借用统计学的方法来估计或替代变量的缺失值,SPSS软件的Transform菜单中提供了替代缺失值的功能模块。Transform→ReplaceMissingValues57数据的筛选对审核过程中发现的错误应尽可能予以纠正,如果错误无法纠正,或有些数据不符合分析要求而又无法弥补,或只有部分数据符合分析要求时,就要对数据进行筛选。Data→SelectCases58数据排序数据排序有利于研究者通过浏览数据发现一些明显的特征或趋势,还有助于对数据检查和纠正错误,同时还为分组等提供方便。在某些场合,排序本身可能就是分析的目的之一。59SPSS中变量层次的数据整理菜单计算新变量:Compute变量转换:Recode、VisualBander、Count、RankCases、AutomaticRecode专用过程CreateTimeSeriesReplaceMissingValuesRandomNumberSeed60SPSS中文件层次的数据整理变量与数据属性简单命令:插入变量、记录;到达某条记录简单过程排序、拆分文件、选择和加权记录数据转置数据重构数据汇总查找重复记录产生无交互作用的正交设计表61文件层次的数据整理—数据汇总分类汇总:按指定的分类变量对观察值进行分组,对每组记录的各变量计算指定的描述性统计量,结果可以存入到新数据文件,也可直接替换当前数据文件。分类汇总的步骤:选择data→Aggregate,指定分类变量和汇总变量选择计算汇总变量的描述性统计量将汇总结果保存到指定的文件中分类汇总产生的数据文件的记录数取决于分类变量的取值个数,分类变量可以指定多个。62文件层次的数据整理—查找重复记录选择Data→IdentifyDuplicateCase,在Definematchingcasesby框内选入希望查找重复取值的变量。Sortwithmatchinggroupsby框内设定重复的记录按照哪个变量的取值进行排序。Indicatorofprimarycases框内设定每一组重复的记录中第一或最后一个为主记录。结果窗口中还会给出对本次操作产生的新变量的汇总
本文标题:SPSS软件的使用
链接地址:https://www.777doc.com/doc-1506850 .html