您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > spss授课_数据管理_新
1李国春流行病学和卫生统计教研室南京中医药大学2主窗口(SPSSDataEditor)数据编辑窗口(*.sav)结果输出窗口(*.spo)DataViewerVariableViewer(outputviewer)3定义变量NameLabelValuesTypeWidthDecimalsMissingMeasure必需填写45数据管理(DataManage)•数据文件的建立与录入–基本统计学原理•统计数据的描述•基本概念–SPSS建立数据库的方式•直接建立spss系统数据文件(.sav)•从外部调用其它数据文件–SPSS操作•定义数据库结构及数据库录入•应用实例•数据文件的整理与转换6统计软件包归根到底是要以数据为对象,对数据进行分析。学会建立一个正确的数据文件及进行数据管理是做好统计分析的第一步,是为分析做好准备工作。一、数据文件的建立与录入(一)、基本统计学原理1、统计数据的描述(数据编码)医学统计数据结构由变量(variable)、变量值(value)、观察单位或记录(recordorcase)(在数理统计中称为一个概率事件)等组成(举例:实际就是建立一类似Foxpro数据库,)。统计数据的描述就是将原始数据经编码以后以某种规范的格式输入电脑。数据管理(datamanage)7患者编号年龄(岁)性别治疗分组收缩压(kPa)舒张压(kPa)心电图疗效判定137男A药18.6711.47正常显效245女对照20.0012.53正常有效343男B药13.4410.98异常显效459男对照15.4414.56正常无效……………………10054男A药16.9011.78异常有效数据的结构与特点(举例)表100名高血压病人治疗后的临床记录8统计数据实际是科研数据,让我们先研究一下科研数据结构(以实验研究为例)。实验研究的三要素为:实验因素(factor)与处理(treatment)实验效应(effect)实验对象(unitorcase)注:实验因素:即为各种影响因素(independentvariableorfactor),在临床研究中可能是各种预后因素。在spss的数据结构中称这些影响因素或预后因素为自变量(independent)或因素(factor)或分组变量。实验效应:是指受试对象接受实验处理后所出现的实验结果,通常由人或动物相应的各项指标来反映。在数据结构中这些指标也称作各种因变量(dependentvariable)或反应变量(responsevariable)实验对象:就是一个个记录(recordorcase)SPSS中在Variable视窗中建立数据结构(类似:建立库结构)。变量(Variable)9医数结学据构变量variable变量值value记录或病例recordorcase10变量值11表二:(P.102)10名3岁儿童的身高、体重、体表面积资料编号体表面积/m3身高/cm体重/Kg15.38288.011.025.29987.611.835.35888.512.045.29289.012.355.60287.713.166.01489.513.775.83088.814.486.10290.414.996.07590.615.2106.41191.216.0应变量自变量12表三:感染性休克两种疗法比较组别疗效(group)显效低效参麦组379肾上腺素组2720表四:组别(group)疗效(effect)人数(权重)参麦组(1)显效(1)37参麦组(1)低效(0)9肾上腺素组(2)显效(1)27肾上腺素组(2)低效(0)20另外还有一种表示方法,请同学们想一想。13编号性别年龄/岁身高/cm体重/Kg1男13156.047.52男13155.037.83男13144.638.64男13161.541.65男13161.343.36女13158.047.37女13161.047.18女13162.047.09女13164.333.810女13144.033.811男14157.949.212男14176.154.513男14168.050.014男14164.544.015男14153.058.016女14164.744.117女14160.553.018女14147.036.419女14153.230.120女14157.940.421男15166.057.022男15169.058.523男15170.051.024男15165.158.025男15172.055.026女15159.444.727女15161.345.428女15158.044.329女15158.642.830女15169.051.1原始数据1415变量(指标)与变量值(VariableorValue):描述研究单位的各种特征。连续型的变量离散型的变量[两分类与多分类(有序与无序)]医学统计学中资料类型总结如下:(不同的数据资料类型一般要选择不同的统计方法)数值变量(计量资料)如身高、体重等医学统计(measurement)有序分类(等级资料)如疗效资料分类变量(ordinal)二项分类如性别(category)无序分类(binomialD)(nominal)多项分类如血型(计数资料)(nultinomialD)我们一般根据不同的变量资料类型选择不同的统计方法。2、基本概念解释16统计软件中数据录入格式(举例说明)统计表格格式统计分析格式17自变量(Independentvariable)、协变量(covariate)、因变量(dependentvariable)、哑变量(dummyvariable)。注:哑变量或伪变量——定性变量或等级变量转换成定量变量比较难办,叫做指标的数量化。定性指标的数量化是引入指示变量、即取值(0、1)的两分变量X变量就称为哑变量。如性别:0为男性,1为女性。协变量——混杂因素中的定量变量我们可以作为协变量来处理。观察单位(ObservationorCase):医学研究中依据研究目的而确定的最小研究单元(unit),有狭义的个体和广义的个体。如:一个人、一个动物、一个家庭。18数据编辑窗DataEditor的DataView界面的二维表格DataEditorSPSS术语中文解释统计学概念二维表datafile数据文件总体或样本一行case样品、病例一个概率事件行号casenumber样品编号观测量序号一列variable变量对象的特征列号variablename变量名特征名称单元格中的数值value变量值对象的某特征值19(二)、SPSS建立数据库的方式SPSS所处理的数据文件有两种来源:1、是在SPSS环境下新建数据文件直接用DataEditor(数据编辑器)建立(也称为系统数据库):数据文件的格式一般为每行一个记录(case),每列一个变量(variable)。往往不同的统计分析方法需要不同的数据文件的格式。注:数据文件的后缀为.sav2、是从外部调用已建立的数据文件能与其它软件共享数据,与其它软件数据有转换接口。①读取纯文本文件(ReadTextData—ASCII)②读取Excel文件③读取其它数据库(FOXPRO)文件注:通过其它数据库转换而来的数据文件在数据结构上可能有些不同。2021(三)SPSS操作1、定义数据库结构及数据录入①定义数据库结构定义数据结构(库结构)—定义变量(definevariable内容包括:变量名、类型、变量标签、变量值标签、定义缺失值、数据列对齐方式、变量的度量尺度(scale定量变量、ordinal等级变量、nominal定性变量)注:系统默认变量名称:var00001var00002…②数据录入SPSS在数据编辑器中定义变量,输入、修改数据,形成一个可供SPSS分析的数据文件,可使用“Edit”菜单项中的各种功能可以对数据文件进行编辑处理。编辑完注意要存盘,默认扩展名为.sav,也可用Saveas存盘并可保存为其它类型的数据文件。22定义变量结构:变量变量名类型宽度小数点变量标签变量值标签VariableTypeWidthDecimalslabelvalue编号numbernumeric20编号——性别sexnumeric10性别1:男2:女年龄agenumeric20年龄——身高heightnumeric51身高——体重weightnumeric41体重——增加原始资料的可读性23SPSS数据文件结构(红色表示可以省略)变量名变量类型标签变量名标签变量值标签变量缺失值变量列格式变量度量方法24空白工作区25Heightnumeric51身高262、是从外部调用已建立的数据文件①读取文本文件(ReadTextData—*.dat,*.txt)例:某地120名7岁男童身高(cm)资料如下,描述其特征。123.60121.03115.42113.40124.02123.41122.81125.83112.33122.91124.79110.12117.91126.32116.55113.31114.38127.22112.80120.13120.62124.84117.17109.85118.96116.66117.44121.68118.82117.63120.05119.90115.24121.42125.64124.24118.17120.07115.12118.76116.74128.35124.43115.36113.59125.36120.62120.10122.46120.51113.26118.44122.30117.36116.46121.33120.88111.86117.99112.65117.44124.44118.69121.40118.61130.75118.31121.44117.16129.65111.36115.26120.78123.84123.16121.23126.14118.65119.19116.02115.78119.01116.63120.63114.30119.96116.63128.41117.42123.32114.09118.58116.73117.11117.97108.13126.42119.66119.69118.38115.16115.01119.48127.58122.14122.63115.57123.70123.39119.59123.40119.72120.60115.50123.78118.41118.82114.56119.45118.11(《医学统计学》陈启光等主编)(文本转换)27②读取Excel文件(*.xls)28③读取其它数据库(FOXPRO—*.dbf)文件29二、数据文件的整理与转换(可以认为是分析前处理)(一)、基本统计学问题在多数情况下,原始数据难以满足数据分析的要求,医学研究人员在进行统计分析之前,为了获得符合统计分析的数据或变量,有时要对原始数据文件的变量进行加工、修改、变换或建立新变量,这就是软件要对数据进行整理转换的统计学基础(70个函数介绍)。有时我们可能要在数据分析前使用其中的一些方法,也有可能是在数据分析的过程中,也有可能是对数据的后处理(前一次统计分析是后一次分析的基础)。有些课本中称该过程为分析前处理,但不是很全面。301、数据的整理数据的整理是对原始数据中的变量或个体进行增加、删除、排序、倒置、合并和加权等的处理过程。2、数据的转换在整理数据时,常需要把某些变量的数据进行变换,这些数据的变换是通过一个有效的数值表达式或使用SPSS的内部函数(常用的有对数、平方根、倒数、百分位数的平方根反正弦等)来实现。另外连续变量还可以变换为分类变量。31①变量变换:方差齐性化、正态化、曲线直线化②在原变量的基础上转化为新变量(在Transform菜单中实现转换过程)①参数检验:t检验、方差分析等②非参数检验:秩和检验等32变量变换对数变换倒数变换平方根变换平方根反正弦变换33(二)、SPSS操作1、对话框介绍对话框总体介绍:大多数的菜单命令能打开一个对话
本文标题:spss授课_数据管理_新
链接地址:https://www.777doc.com/doc-3853869 .html