您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 一个简单实用的数据管理软件-EIPData
一个简单实用的数据管理软件广东省健康教育研究所EPIDataAllright©2007GDHE提要EPIData概述1生成数据文件2编写核对程序3数据录入4数据双录入核对5数据转出6EPIData概述•免费的数据管理软件•开发者:丹麦欧登塞(Odense,Denmark)的一个非盈利组织,即TheEpiDataAssociation()•程序设计者:JensM.Lauritsen,MichaelBruus和MarkMyatt•当前最高版本:3.1(英文、中文):1,Freetodownload;2,Easytouse;3,Popularinhealthrelatedfield.Ithastwomodules,onenamedEpiDataEntry,andtheothernamedEpiDataAnalysis.EPIData在数据管理方面的最大优点•规则简单•数据文件生成与录入界面设计方便•具备双份比较功能•具有多种常用数据库的输出接口•Free医学统计工作的基本步骤研究设计收集资料整理资料分析资料数据录入数据核查数据管理EPIData统计描述统计推断SAS\SPSSStata等统计分析EPIData的三种基本的文件类型①.QES文件:数据库结构文件,决定数据库结构。②.REC文件:数据文件,主要用于存放数据。③.CHK文件:核对文件,存放控制数据录入的核对规则,起质量控制作用。EPIData数据库创建过程1.数据库建立——根据调查表制作数据库结构文件(.qes)2.生成数据文件——根据数据库结构文件生成数据文件(.rec)3.编写核对程序——即生成数据核对文件(.chk)(可跳过)4.数据录入菜单1.数据库建立(建立调查表)•在下图所示的“1.数据库建立”按钮上点击,并选择“新建.QES文件”,或者直接点击,则可以开始创建数据库结构,其界面如下图输入调查表内容在EpiData中,不同的数据类型应该选择相应的字段类型:•调查表中的日期在数据库中应该使用日期型字段;•姓名、地址、主诉等需要输入文字的问题则需要设置为文本型字段;•身高、体重、血压这样需要输入数字的问题要设置为数值型字段,同时这也是为了满足数据分析阶段的需要,比如对数值型字段我们往往需要进行计算均数、标准差等等运算,所以必须将这类问题设置为数值型字段。EpiData中常用的字段类型(1)•数值型字段######.##数值型变量中只能用来接受从0到9的数字,数值可以是整数也可以是小数。一个#号代表一位数,用户可以根据需要定义所需的数值位数,但包括小数点在内最大为14位。在数据录入过程中和.QES文件中小数点“.”和逗号“,”都可以作为分隔符。但是在一个字段中只能有一个分隔符,也就是说逗号不能作为分位数。•字符型字段_________下画线定义字符型变量的位数。字符型变量内可以输入任何字符。该类型变量的最大长度为80个字符。一个中文占两个字符。EpiData中常用的字段类型(2)•是否型字段Y是否变量内只可以存放Y,N,1,0和空格。是否型变量的长度仅为1位。当输入1时计算机自动将其转换为Y。同样,当录入0时则自动转换成N。•日期型字段dd/mm/yyyymm/dd/yyyyyyyy/mm/dd在数据录入过程中,能录入的字符为数字和斜线(/)。如果所有日月年数值都录入的话则不必录入斜线。比如2007年10月23日可以在数据录入时直接键入23102007。在光标移入下一个字段后,字段内的值自动变为标准的04/05/1999。•如果录入的两位数的年份在50到99之间的话,则被默认为20世纪,前面加“19”。如果年份值在00和49之间的话则被默认为21世纪,前面加“20”。如果只录入0405的话,则计算机系统年份自动加入到字段中。•在录入完成后计算机会对录入的日期进行核对,以保证录入的日期值是合法的日期值。在EpiData中只认四位数年份。字段输入①直接输入:注意须在英文状态下输入,如右图直接输入:②菜单栏输入:按右方按钮。根据需要在该窗口中选择相应的字段类型,比如数值型,并根据实际情况设置小数点位数,设置完成后点击按钮。补充1:字体设置•使用中文EpiData时,建议用户对使用的字体进行设置。在主界面上点击“文件”按钮后选“选项”。如下图•择“选项”面板上,分别选择“编辑窗口”、“显示数据表”和“有关资料”三个选项卡,再将字体设置为中文字体,这时建议用户将这三个窗口中的字体设置为一致。补充2:定义变量名格式:变量标{变量名}变量编码方法:①直接输入:如右图②菜单栏更改变量名:“工具”—“更改变量名”—选择所要更改变量名的.rec文件。•变量名第一个字符一定为字母(A-Z),之后可含字母(A-Z)和数字(0-9)•变量名最多10个字符•变量名不能是中文补充3:预览数据库2.生成数据文件创建数据文件(.REC)的方式有:1.选择“数据输入/输出”选项下的“根据QES文件创建数据文件”2.在工作程序工具条上选择“2.生成数据文件”。如下图3.编写核对程序(质量控制)目的:方便录入,质量控制•在数据录入过程中都需要进行质量控制。比如,对一些变量设置合法值、在一定条件下跳转等等。在EpiData中这些功能的实现是通过一个专门的文件完成的。也就是包含了核对程序的核对文件(.chk)。•核对文件总是针对一个具体的数据文件(.rec),并在数据录入过程中起作用。因此,一般都是先有数据文件,然后才针对数据文件生成核对文件。核查文件的文件名(.chk)必须与数据库的文件名(.rec)一致,唯一不同的就是扩展名。创建核查文件方法1、通过菜单创建①选择“数据核对”选项下的“增加/更改核对文件”②在工作流程栏上直接点击“3.添加核对程序”③选择要进行核查的rec文件2、使用编辑器手动编写或修改所有CHECK命令。注意:CHECK的文件名必须与数据库(rec文件)的文件名相同,唯一不同的就是扩展名。一般情况下,这两种方法我们都会用到。用第一种方法可以进行最基本的CHECK设置,然后用编辑器添加更复杂的CHECK命令或文件水平(而不是变量水平)上的CHECK命令。常用的几个组合键•Alt+S:相当于按CHECK设置窗口中的“存盘”按钮,保存所有的CHECK设置。同时,程序不会退出Add/Revisechecks;•Alt+D或者F9:相当于按CHECK设置窗口中的“编辑”按钮,弹出CHECK命令的编辑窗口。•Alt+C:相当于按CHECK设置窗口中的“关闭”,即退出。建立核查文件(1)•Range(定义允许录入的范围)•Legal(设置允许录入数值)•Jumps(跳转)•MustEnter(必须录入)•Repeat(重复)•ValueLabels(数值标签)Range(允许范围)•在“Range,Legal”的定义框中键入允许录入的最小值和最大值,并用连字符“-”连接。例如,键入“1-4”,表示当前变量只允许录入1、2、3、4四个数值。•如果只对最大值有限制,则用“-INF”(负无穷大)表示最小值。如果只对最小值有限制,则可以用“INF”(无穷大)表示最大值。例如,键入“-INF-10”表示当前变量录入的数值必须≤10。键入“0-INF”表示录入的数值必须≥0。Legal(允许值)•允许值(legal)是在Range,Legal的定义框中键入所有允许输入的数值,数值之间以逗号或空格间隔。如果使用空格作间隔,程序也会自动将其转换为逗号间隔。例如,键入“4,6,8,10”表示当前变量只允许录入4、6、8、10四个数值。•如果你的设置中既有允许的范围,又有允许值,那么范围值必须放在前面,允许值放在后面。例如,键入“2-6,8”表示允许录入的数值包括2、3、4、5、6和8。键入“8,2-6”,程序会提示错误。Jump(跳转)•JUMPS必须以END结束。需要指定:1.当前变量某个可能录入的数值2.与指定数值对应的、跳转的目标变量名。格式:跳转值、大于号()、跳转的目标变量名•跳转语句间用逗号分隔。例如,1V23,2V40表示输入1时,跳转到变量V23;输入2时,跳转到变量V40。如果定义中包含空格或逗号,请用双引号把整个定义括起来。例如,”2.5V30”,”3,5V35”•END表示“跳转到数据录入表格的最后一个变量”,WRITE表示“将当前记录存盘”。例如,设置跳转为“1V30,2END,3WRITE”MustEnter(必须录入)和Repeat(重复)•必须录入(MustEnter)这个命令要求必须给当前变量输入数值,否则无法进入下一个变量。•重复(Repeat)如果选择“Yes”(是),则前一条记录在当前变量上录入的数据将在接下来的新记录上重复显示。在数据录入过程中,重复显示的数据可以修改。如果某些录入内容在不同记录间改动很少(例如,调查员姓名、调查者所属地区等),这项重复功能可以省去很多重复键入的工作。ValueLabels(数值标签)•数值标签是一组数值加上对应的文字注释,可以解释每个数值代表的涵义。例如,创建一个性别变量,用1表示男性,2表示女性。如果设置了这个数值标签,在数据录入过程中,当你按F9,或数字键盘上的+时,程序会自动弹出一张表,告诉你1和2各自对应的涵义。ValueLabels(数值标签)1、定义新标签点击CHECK设置窗口中“Valuelabel”旁边的“+”钮,会弹出一个“Editvaluelabels”的窗口。键入数值标签编辑完毕后,可以按菜单上的“接受并关闭”按钮或者Alt+A键关闭编辑窗口。注意:如果标签的注释性文字中带有空格,请用引号括起来。如:1”Malegender”ValueLabels(数值标签)2、编辑已有的标签在Valuelabel的下拉列表中选择你要编辑的数值标签的名字,然后点击右侧的钮,编辑窗口弹出。修改后按菜单上的“接受并关闭”按钮或者Alt+A键,保存并关闭编辑窗口。3、给变量指定已有的标签在对应的变量上,从Valuelabel旁的下拉列表中选择相关的标签。不同的变量可以共用相同的数值标签,你只需要定义一次。4、清除变量的数值标签在对应的变量上,从Valuelabel的下拉列表中选择[none],即可清除在该变量上设置的数值标签。4.数据录入按“4.数据录入”、“打开”的图标或“数据输入/输出”—“数据输入/修改”,如下图打开.rec文件。录入时字符达到设置时位数时自动跳转,或按空格键跳至下一空格4.1在变量间转换•在数据录入过程中,如果你使用鼠标实现在变量间的跳转,则CHECK文件中设置的录入规则通常无效。激活下一个变量,你可以使用Enter、Tab、↓键、或用鼠标直接点击目标变量。•如果变量允许录入的字符数全部录满,则光标会自动移到下一个变量,除非你在CHECK文件中设置了CONFIRM命令。•如果想回到上一个变量,可以按Shift+Tab键,或↑键。按Ctrl+Home键•可以直接回到数据录入表格的第一个变量。选择Ctrl+End则可以直接跳转到最后一个变量。4.2在记录间转换•数据录入表格的窗口左下部有一个导航条。•上图显示当前数据库有118条记录,现在位于第115条记录。红色DEL显示为激活,表示当前记录已经被标记删除。•移到第一条记录•移到前一条记录(或Ctrl+PgUp,或F7)•移到下一条记录(或Ctrl+PgDn,或F8)•移到最后一条记录•开始录入新记录(或Ctrl+N)•删除记录或恢复一条删除的记录(或Shift+Delete),这里需要说明的是,记录只是被标记为删除,实际上,这条记录仍然存在于数据库中,是可恢复的。在菜单“工具”中选择“数据清理”,可以永远的删除所有标记为删除的记录。4.3转至记录、查找记录快速找到已录入的记录•知道序列号——转至记录•不知道序列号——查找记录:设置查找条件方法:“跳转”—“转至记录”或“查找记录”5.数据双录入核对目的:双人或两次录入,双份数据比较
本文标题:一个简单实用的数据管理软件-EIPData
链接地址:https://www.777doc.com/doc-5261 .html