您好,欢迎访问三七文档
SPSS软件应用Section1概述&文件建立与整理Dept.ofBiostatisticsS.M.UContentsApplicationofSPSSSPSS的历史与发展主要窗口及功能数据文件的建立数据文件的整理应用中的注意事项0102030405Section1概述&文件建立与整理Part1版本演变历史与发展1.历史与发展•SPSS(StatisticalPackageforSocialSciences)–1968年由美国斯坦福三位研究生研发而成–国际上最权威的统计软件之一,被美国FDA等权威机构认可–操作简单,界面友好–输出规范并图形化(可编辑、共享),输出格式多样–SPSS16.0起推出Linux版本;最新版本为IBMSPSS24.0,已支持Windows、MacOS、Linux及UNIX系统1.历史与发展•SPSS其原意为StatisticalPackagefortheSocialSciences,即“社会科学统计软件包”。•SPSS公司已于2000年正式将英文全称更改为StatisticalProductandServiceSolutions,意为“统计产品与服务解决方案”。•2009年7月28日宣布被IBM公司收购,改名IBMSPSS。当前最高版本为IBMSPSS24.01.历史与发展•SPSS版本更新TimeVersionTimeVersionTimeVersion1968SPSS11999SPSS10.02007SPSS16.01984SPSS/PC+2002SPSS11.02009SPSS17.01992SPSS5.02003SPSS12.02010IBMSPSS18.0/19.01996SPSS6.0/7.02004SPSS13.02011IBMSPSS20.01997SPSS8.02005SPSS14.02012IBMSPSS21.01998SPSS9.02006SPSS15.02013IBMSPSS22.01.历史与发展•新增模块–SPSS9.0MultinomialLogistic(多分类logistic回归)–SPSS10.0OrdinalLogistic(等级回归)–SPSS11.0MixedLinearModels(混合线性模型)–SPSS12.0ComplexSamples(复杂抽样)–SPSS13.0Tree(决策树)–SPSS14.0AMOS/AdvancedMOrtarSystem(结构方程模型)–……Part2认识SPSS主要窗口及功能2主要窗口及功能•主要窗口:–数据编辑窗•数据文件的建立,整理–结果输出窗•分析结果的展示–程序编辑窗•一般供专业人员使用•部分高级功能需编程实现2主要窗口及功能•数据编辑窗–文件格式:.sav•功能:建立新的数据文件,编辑和显示已有的数据文件•内容–数据窗口(DataView):显示和编辑数据–变量窗口(VariableView):定义、显示和编辑变量特征2主要窗口及功能•结果输出窗口–格式:.spv•统计分析结果:内容有文本、图形、表格2主要窗口及功能•程序编辑窗–格式:.sps•满足专业人员使用•避免重复劳动•个别分析需编程实现(裂区分析,典则相关等)2主要窗口及功能•菜单栏•数据编辑栏Part3建立、导入、导出数据文件的建立3数据文件的建立•3.1数据文件的建立–SPSS的数据格式•行→一条记录(观测个体)case•列→一个变量(观测指标)variable–不同的数据类型有不同的数据格式,采用不同的统计分析方法3数据文件的建立•3.1数据文件的建立–定义变量•VariableView3数据文件的建立•3.1数据文件的建立–定义变量•变量名:–长度小于64字节(32个汉字)–首字母:字母或者汉字,不区分大小写,不能有空格或特殊符号,如“?”等–不能用SPSS关键字3数据文件的建立•3.1数据文件的建立–数据的输入•不要使用任何输入法•尽量不要使用汉字•输入界面:DataView统计资料的数据类型资料分类定量资料(numerical/quantitativedata)定性资料(categorical/qualitativedata)计数资料计量资料等级资料统计资料的数据类型•计量资料(measurementdata)/定量资料(numerical/quantitativedata)–a.一般有计量单位–b.用平均数指标描述•例如观察指标:身高,体重,血压,脉搏,显微镜下每个视野的凋亡细胞个数,红细胞计数等统计资料的数据类型•计数资料(enumerationdata)/无序分类/名义变量资料(nominalvariabledata)/离散型变量资料(discretevariabledata)–a.无计量单位–b.用相对数指标描述•例如性别,血型,职业,治疗效果(有效或无效),细菌学检查结果(阳性或阴性)等统计资料的数据类型•等级资料(rankeddata)/有序分类变量资料(ordinaldata)/离散型变量资料(discretevariabledata)–a.无计量单位–b.用频数及平均秩次描述–c.与计数资料的区别为分组有量度差异•例如年龄组(18,18-,35-,50-,65-),治疗结局(治愈,好转,无效,恶化,死亡)等144名尿路疼痛患者临床试验记录ID分组agesex心电图尿痛HB治疗前治疗后治疗前治疗后治疗前治疗后001A组(2)27F(2)正常(0)正常(0)中度(2)轻度(1)139140002A组(2)60M(1)异常(1)异常(1)轻度(1)轻度(1)156139003A组(2)64F(2)正常(0)正常(0)中度(2)中度(2)10599004B组(1)33F(2)异常(1)正常(0)中度(2)无痛(0)159123::::::::::144B组(1)48M(1)正常(0)正常(0)重度(3)中度(2)1381363数据文件的建立•3.1数据文件的建立–练习1:•测得某班5名男生和5名女生身高(单位:米)数据如下–男:1.70,1.68,1.72,1.75,1.77–女:1.65,1.60,1.58,1.55,1.62•试建立数据文件•提示:一个分组变量(男/女),一个指标变量(身高)练习2:建立数据文件某药物研究机构研发了针对禽流感H7N9的新药A。为了比较新药A与传统旧药B的疗效,该机构随机抽取了200名H7N9患者,对其中的104名患者使用了新药A,对另外的96名患者使用了旧药B。治疗结果如下表:药物治疗结果合计有效无效A药995104B药752196合计17426200要求:◦建立的数据文件中包含3个变量,变量名分别为Medicine,Effect,Freq,对应的变量标签分别为药物分组,疗效和人数。Medicine变量1表示A药,2表示B药。Effect变量,1表示有效,0表示无效。保存该数据文件,并且命名为“Test”。3数据文件的建立•3.2数据文件的导入:–可导入的文件类型•SPSS数据文件•Excel数据文件•SAS数据文件•STATA数据文件•ASCII数据文件•……3数据文件的建立•3.2数据文件的导入:–操作:•File–Open»Data3数据文件的建立•3.2数据文件的导入:–练习:打开文件“clinicaltrail.sav”和“clinicaltrail.xls”3数据文件的建立•3.2数据文件的保存与导出:–SPSS文件类型:•数据文件*.sav•结果文件*.spo•图形文件*.cht•语句命令文件*.sps3数据文件的建立•3.2数据文件的保存与导出:–读写控制•数据的读写属性设置–File»MarkFileReadOnly/MarkFileReadWritePart4Data/Edit菜单的使用数据文件的整理4数据文件的整理•插入变量(insertvariable)/观测(insertcase)•观测值排序(sort)•数据拆分(splitfiles)•选择数据(selectcases)•加权(weightcases)4数据文件的整理•4.1插入变量(insertvariable)/观测(insertcase)–从菜单•Edit–InsertVariable/InsertCase–鼠标右键4数据文件的整理•4.2观测值排序(sort)–从菜单•Data–SortCases–可对数值型和字符型变量进行排序–可同时按照多个变量进行排序–鼠标右键4数据文件的整理•4.3数据拆分(splitfiles)–Data•SplitFile–对某些分类变量进行分层分析。避免重复分析,通过SplitFile简化操作。–例:对clinicaltrial.sav的性别进行分层,分别求出不同性别的身高的描述性统计量。4数据文件的整理•4.4选择数据(selectcases)–Data•SelectCases–Randomsampleofcases:随机选择一定比例的观察单位–Basedontimeorcaserange:选择某一指定范围的观察单位–Usefiltervariable:选择滤过变量(filter_$)不为0的观察单位4数据文件的整理•4.4选择数据(selectcases)–Ifconditionissatisfied选择满足if条件的观察单位各种运算符数学运算关系运算逻辑运算+加小于&与*乘~=不等于∣或**幂≤小于等于~非4数据文件的整理•4.4选择数据(selectcases)•练习:选择符合下列条件的记录–年龄≥40的女性–收缩压大于15或舒张压大于11–随机选择70%的观察单位–从前30例中随机选择10例–选择第10-40例4数据文件的整理•4.5加权(weightcases)–Data•WeightCases–是指以某一变量为权重对数据加权,常用于计数资料,当数据以频数形式录入时,以频数为权重,如四格表资料。Part5Can&Cannot应用中的注意事项5应用中的注意事项•数据的输入–不要使用输入法!•变量–尽量用英文命名–最好加Label–注意变量类型(numeric/string/date)5应用中的注意事项•分析方法的选择–结合生物统计学课程的知识•数据格式–做什么分析,选择对应的格式5应用中的注意事项•正确的操作软件–操作顺序,选择那些需要的统计量–特别是需要进行拆分,加权等的时候•结果的解释–描述统计量的判读–统计量、P值的判读–统计图的引用5应用中的注意事项•课程难点:–用什么方法?–怎么录数据?–怎么读结果?
本文标题:spss教程
链接地址:https://www.777doc.com/doc-5059506 .html