您好,欢迎访问三七文档
用EpiData快速建立数据管理程序南京军区南京总医院信息科刘玉秀liu_yuxiu@163.com2003-11-16用EpiData快速建立数据管理程序主要内容EpiData基本情况数据管理过程----原理上EpiData使用流程----建立调查表及数据文件生成----添加字段控制----输入数据和产生数据文件资料----数据文件修改和数据转出----选项设置和程序参数2003-11-16用EpiData快速建立数据管理程序EpiData基本情况选择合适的数据管理软件是保证数据质量的重要方面参照EpiInfo6.0免费软件,丹麦学者LauritsenJM等人1999年发起,BruusM编写程序而完成,目前为3.0版,免费使用可在Windows95/98/NT/2000/XP环境下使用2003-11-16用EpiData快速建立数据管理程序EpiData基本情况能快速建立数据录入程序,可满足数据的校验录入、双份比较建立的数据库可转变成dBase、Excel文件以及SAS、SPSS和Stata统计分析软件的数据格式为数据管理软件,暂不具有统计分析功能,适于单表,也适于含子表的情形2003-11-16用EpiData快速建立数据管理程序EpiData基本情况EpiData秉承EpiInfoDOS版本的简便性,EpiInfo在世界上已拥有众多用户简便性体现:以文本形式编写文件,通过程序将此文本文件转换成数据输入表格安装时不受计算机设置的影响。无需安装或替换任何的DLL文件或系统文件2003-11-16用EpiData快速建立数据管理程序EpiData基本情况局限性1:是单用户程序,无网络版局限性2:记录数限制20万条左右局限性3:字段数限制999行内写完…………2003-11-16用EpiData快速建立数据管理程序EpiData基本情况—总结EpiData是用于数据输入和数据存档的一套程序EpiData不是用来进行分析的,进行统计分析有其他专用的软件可以利用基本设计思想是帮助用户生成较好的原始数据供以后分析使用有一定的局限性2003-11-16用EpiData快速建立数据管理程序EpiData程序可用于定义数据结构;简化数据输入;应用校验原理进行数据录入;编辑/纠正已经录入的数据;确认变量间的一致性、逻辑性;显示或打印数据核查错误结果留存;双份录入数据的比较;导出数据供统计分析使用。2003-11-16用EpiData快速建立数据管理程序EpiData的三种文件类型QES文件(调查表文件):定义调查表(问卷)的结构;REC文件(数据文件):存放数据以及已经定义好的编码;CHK文件(核查文件):定义了数据输入时字段的有效性规则。2003-11-16用EpiData快速建立数据管理程序确立研究的目的描述假定,研究例数,时间安排,…资助的保障,……2003-11-16用EpiData快速建立数据管理程序数据质量的技术保证应用合法值、限定范围等方法对所有或者部分数据进行两次输入以发现键盘打字错误发现错误并纠正错误应建立错误列表及错误纠正的文件记录2003-11-16用EpiData快速建立数据管理程序数据一致性、逻辑性是否符合常理。例如外祖母不到35岁缺失数据数量。有时不得已,注意影响决定有效例数以文件形式记录有关决定2003-11-16用EpiData快速建立数据管理程序准备分析数据集数据清理新变量的生成和转换有关决定应留有文件记录2003-11-16用EpiData快速建立数据管理程序数据备份,档案保存数据复制备份,建立档案,安全保存----所有项目计划、表格、调查表、错误清单以及其它文件都应有复制件,原始的调查表和作为证明等用的其它材料均应留档保存一定时间目的是能从最后的数据库中追查到原始观察对象每一变量的每一个数值2003-11-16用EpiData快速建立数据管理程序数据分析原则上所有的分析均应能重复出来与分析有关的所有资料也应作为研究文件保留某临床研究单位的数据管理数据库设计病例记录表电子记录表(数据输入程序)数据收集指南数据输入(两次输入:输入与核对)编码(医药名词)数据清理数据库说明建立范围检查和逻辑检查生成问题表和医生的答复数据最终清理和数据锁定统计分析统计报告FDA对用于临床试验计算机数据管理的要求系统设计应符合研究设计的要求(如单位、加盲),排除数据创建、修改、维持、存档、恢复或传送中的错误;确定并记录采用什么软件和硬件来实现上述目的;保留原始文件,以备必要时重建系统;符合临床试验中保存和保留记录的适用管理要求,与文字记录同样可信。对记录的改动应保持原先的信息清晰可见。记录应清楚显示所作的改变,并提供一种可定位和阅读先前资料的方法。改变数据应保留稽查轨迹:该文件能提供是谁,在什么时候,为什么作了这一改变。以保护真实性、完整性和机密性。从数据中应当可以获取研究中每一例对象的全部资料。能防止未经授权者访问数据和计算机系统。2003-11-16用EpiData快速建立数据管理程序EpiData使用流程图进入2003-11-16用EpiData快速建立数据管理程序建立调查表建立数据定义是一基础性工作,也是关键性的工作在EpiData表现为建成QES文件2003-11-16用EpiData快速建立数据管理程序QES文件字段定义•字符型:用下划线•数字型:用#号,每位一#,##.#•逻辑型:用Y或N,Y、N•日期型:mm/dd/yyyydd/mm/yyyy•字段名框在{}之中id(automaticidnumber)idnumV1Sex#V2Heighy(meter)#.##V3Weight(kilo)###.#bmiBodyMassIndex##.##V4Dateofbirthdd/mm/yyyyV5Agetoday##V6CountryofResidnece____________QES文件字段定义—举例生成字段名设置选项2003-11-16用EpiData快速建立数据管理程序生成字段名----几条规则文本中优先选择用花括号括进的文本通用常见单词不作为字段名组成部分字段前为空,字段名就取前一个字段名再加上一个数字。如果不存在前一个字段名则使用隐含字段名FIELD1首字符为数字,则在首字符前插N大小写取决于“文件”菜单中“选项”----------------------------------------------------------------------问题产生的字段名使用规则----------------------------------------------------------------------Stateyour{nation}alityNATIONRule1Al{l}youl{i}keisi{ce}creamLICERule1WhatisyournameISYOURNARule23.question:N3QUESTIRule4----------------------------------------------------------------------经验:实际工作中,对以中文为语言的调查表,最好用花括号直接指定英文字段名。2003-11-16用EpiData快速建立数据管理程序变量标记又称变量标签(variablelabel)是对字段内容的一种描述或说明,自动生成设置“以调查表第一个词命名”:例如v1Ageofpatient###,“v1”为字段名,“Ageofpatient”为变量标记设置“自动添加字段名”:v1ageofp为字段名,变量标记v1Ageofpatient2003-11-16用EpiData快速建立数据管理程序变量标记随数据一并导出到文件中。对SAS,则生成源代码。因系自动生成,导出的变量标记常常不另人满意,这时需要费点功夫到SAS数据集处理的源程序代码中修改。2003-11-16用EpiData快速建立数据管理程序数据文件生成在EpiData表现为生成REC文件本文件基于QES文件而生成产生REC文件前可提问输入文件标记警惕:覆盖文件操作一定要慎重2003-11-16用EpiData快速建立数据管理程序添加字段控制本步骤可以使数据输入过程按给定的一些规则和算法完成,这是EpiData功能的最强大体现添加输入控制的指令以文件形式单独保存,该文件后缀为CHK程序运行时,自动寻找与扩展名REC相同文件的CHK文件2003-11-16用EpiData快速建立数据管理程序添加字段控制限制特定数值的输入给出输入的数值编码的文字描述指定数据输入的顺序数据输入时自动计算可在输入数据时添加显示帮助信息和其他有关的提示等2003-11-16用EpiData快速建立数据管理程序添加字段控制—5项基本功标签:给出各数字对应的描述性文本限定特定值(数值范围,合法值)指定输入的顺序(跳转)某些字段不得缺项,必须输入重复上一条记录的某字段值2003-11-16用EpiData快速建立数据管理程序添加字段控制—1项高级功相当于在CHK文件中进行编程需掌握各种checkcommands:----if…then…endif、mustenter、relate…需熟悉各种operators和functions:----arithmetic、string、date、time…2003-11-16用EpiData快速建立数据管理程序输入数据选中“输入数据”,给定数据文件,即显示数据录入界面注意事项无键入内容,仅按回车,以缺失值论字段填满,光标自动跳到下一个字段任何时候要退出录入,按F10键即可2003-11-16用EpiData快速建立数据管理程序双份录入和对比核查两位录入员将同样的调查表输入到两份数据文件中“对两个数据文件进行有效性检查”原理--------两个录入员在同样的字段犯同样输入错误的概率很小,一旦发现输入不一致,则必然有一位出错2003-11-16用EpiData快速建立数据管理程序产生数据文件资料基本信息:数据文件信息包括数据文件名、文件大小、最后一次更新日期、字段数、记录数、是否使用核查功能。对于文件中的每个输入字段,给出的信息包括输入字段名、字段的变量标记、字段类型、字段的宽度、所使用的核查项清单、数值标签2003-11-16用EpiData快速建立数据管理程序产生数据文件资料编码册(codebook):给出数据文件中的关键字段及对数据的基本描述,包括记录数,作了删除记录的记录数。对数据文件的每一个变量显示变量标记、字段类型、核查条件及缺失值记录数,对于数字字段将显示数值范围、均值、标准差或频数表,这取决于字段类型2003-11-16用EpiData快速建立数据管理程序产生数据文件资料显示数据:可以有选择打印出所有记录的全部或部分内容。----按“全选”则选择所有字段,按“不选”则全部字段均不选----控制列清单的尺寸:可以改变列清单的宽度以保证有较清晰的输出。可以改变行宽或列数。注意,如数据实际宽度比数据列宽,数据将被截取(出现--)。2003-11-16用EpiData快速建立数据管理程序数据文件修改对一个已经包含数据的数据文件可以进行修改。可以增加字段,改变字段的定义或删除字段注意:如果删除字段或改变字段名,数据会丢失!2003-11-16用EpiData快速建立数据管理程序数据导出EpiData软件产生的数据文件以“REC”作为扩展名,一般不能被其它软件程序所调用数据备份转出为文本文件数据转成dBaseIII格式数据转成Excel格式转出成Stata、SPSS、SAS所用的数据2003-11-16用EpiData快速建立数据管理程序选项设置通过选择“文件”的“选项”进行设定。注意在选项中的改变只有在关闭EpiData才被存入硬盘
本文标题:Epidata讲座
链接地址:https://www.777doc.com/doc-2872027 .html