您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 4 国家卫生数据字典与元数据管理系统(深圳)
国家卫生数据字典与元数据管理系统第四军医大学刘丹红2010.1.18深圳首期健康档案和区域卫生信息平台建设标准与技术规范高级研修班一、数据元、元数据及数据字典数据元:数据的基本单元,数据元的确切含义需要通过一系列属性来说明,包括数据的定义、标识、表示方法和管理等。例如:患者的姓名;患者的疾病诊断名称数据元与数据元的取值:例如患者的姓名张三患者的疾病诊断名称急性单纯性阑尾炎元数据:定义和描述其它数据的数据,如用来说明每个数据元确切含义的一系列属性。提供的是准确理解和解释数据所需要的信息。例如:患者的姓名姓氏、名字?合法的真实姓名、笔名、昵称?如何验证?汉字、拼音、英文字母?多少字符(长度)?数据元:数据的基本单元元数据:定义和描述其它数据的数据人的性别代码专业定义是什么?生物学性别,社会学性别?如何采集这些数据?性别如何分类和表示?数字,字母?元数据数据元对每一个数据元的相关属性进行规范化说明,称为建立元数据标准元数据标准。一系列数据元属性的标准化描述,即元数据的集合,构成数据元字典数据元字典。元数据不仅仅针对数据元,还可以针对其他类型的数据单元,如数据集(数据元的集合)、值域(数据元的允许取值),形成多种元数据类型。说明任何数据对象相关属性的元数据的集合说明任何数据对象相关属性的元数据的集合————数据字典数据字典国家卫生数据字典国家卫生数据字典NationalHealthDataDictionary,NHDD国家卫生数据字典是装载国家卫生数据字典是装载数据数据定义和表示定义和表示的元数据资源库的元数据资源库(MetaDataRepository),(MetaDataRepository),目的目的是让使用者能够方便地获得描述数据对象的元是让使用者能够方便地获得描述数据对象的元数据。数据。二、元数据标准依据:ISO/IEC11179ISO/IEC11179老版本:数据元规范与标准化Informationtechnology—Specificationandstandardizationofdataelements(1998)(国标:GB/T18391-2002)新版本:元数据注册Informationtechnology—Metadataregistries(MDR)(2003-2005)66个部分个部分框架Framework分类Classification元模型与基本属性Metamodelandbasicattributes定义Formulationofdatadefinitions命名与标识Namingandidentificationprinciples注册Registration元数据结构的高层元模型(说明模型的模型,metamodel)数据元概念数据元概念概念域概念域值值域域数据元数据元0..*具有1..1指定0..*表达1..1表达为表达0..*表达为1..1表达1..1表达为0..*数据元概念与概念域的联系数据元表达概念域表达数据元概念表达数据记录的基本单元DE=数据元概念(DEC)+值域(VD)可以用元数据作概括性说明系统可以实现(数据库的字段)1.数据元,DE2.数据元概念,DEC数据元概念DataElementConcept能以数据元形式表示,且与任何特定的表示无关对象类ObjectClass–收集和记录数据对象的集合,举例:本单位在编人员、家庭、伤员、居民特性Property–描述对象相互区别的特征举例:职业、收入、平均收入、性别、年龄数据元概念:DEC=对象类+特性数据元概念与值域是两个不同的分类实体3.值域,VD值域:所有可能的允许值允许值:取值=中文含义例如:性别:1=男,2=女;是否同意手术:Y=是,N=否表示:语义的表达方式如字符、代码、文字、符号值域ValueDomains数据元概念DataElementConceptsDECDECDECDECVDDE+=患者职业国标职业分类代码患者职业国标分类代码VDVDVDVDVD对象类ObjectClass数据元的结构化促进复用(reuse)同一个数据元概念对应不同的数据元同一个值域应用于不同的数据元实例:数据元名称:对象词+特性词+表示词对象词表示数据元所属的事物或概念,是数据元名称中占支配地位的部分;特性词表示数据元对象类显著的、有鉴别意义的特征;表示词是数据元名称中描述数据元表示的成分,描述了数据元有效值集合的格式。一个数据元概念与多个表示方法的匹配一个数据元概念与多个表示方法的匹配举例不同的数据元共享同一个值域性别代码(值域)旅客性别患者性别新生儿性别伤员性别职工性别医生性别包含多种元数据类型的目的:便于卫生领域各个专业正确理解数据元标准,在不同背景上重用标准化的数据元减少元数据描述的重复和冗余,将数据字典中数据元的数目控制在有限的范围内4.元数据框架及类型术语Terminology特性Property对象类ObjectClass分类模式Classificationschema值域ValueDomain数据元概念DataElementConcept数据元DataElement元数据类型5.元数据描述的基本属性标识与定义标识与定义(Identifyinganddefinition)(Identifyinganddefinition)数据采集及使用指南数据采集及使用指南((CollectionandusageguideCollectionandusageguide))来源及参考文本(来源及参考文本(SourceandreferenceSourceandreference))关系(关系(RelationRelation))管理(管理(AdministrationAdministration))ISO/IEC11179ISO/IEC11179第二版:第二版:1010大类大类4545个属性个属性数据元属性列表-M数据元的值域1315C数据元值的表示格式1220M数据元值的表示形式11-C数据元值的计量单位106M数据元值的最大长度96M数据元值的最小长度820M数据元值的数据类型表示类7-M数据元的定义定义类680C语义环境540O数据元的同义名称440M数据元名称3-O内部标识符27M统一标识符标识类1属性值最大长度选用要求属性名称属性类别序号数据元属性列表(续)“M”表示“必选”:必须要选用的属性;“C”表示“条件选”:在某一特定条件下必须选用的属性;“O”表示“可选”:可以选用,但不是必要的属性。“属性值最大长度”栏中的数据为建议数据,单位为字节数(byte)。“—”表示不限长度。-O数据元附加说明2210C版本标识符2110M注册状态208M批准日期197M注册机构188O提交日期177O提交机构管理类16-C关系类型15-O关键字关系类14必选属性:11项人的性别代码数据元标识与定义标识与定义性别代码N值域名称人的性别数据元概念性别特性人对象类人口统计,以及其他领域和专业的统计都需要标识人的性别。如在国家卫生统计报告中,出生、死亡、患病等都要分性别统计。语境男性与女性之间的生物学区分,用代码表示。定义草案注册状态HR02.02.001元数据识别号数据元元数据类型男女性同义名称性别简称Person-sex,code英文名称人的性别代码中文名称中文名称人的性别英文名称同义名称元数据类型数据元概念元数据识别号PAT020101_500001_008注册状态草案定义男性与女性之间的生物学区分语境各领域和专业的登记、统计都需要标识人的性别,如出生、死亡登记、疾病诊断对象类人特性性别数据元概念人的性别标识与定义标识与定义0未知的性别,1男性,2女性,9未说明的性别代码含义允许值1最大长度N格式数字数据类型代码表示形式表示男性、女性及两性的生物学区分的代码集。定义国家质量技术监督局,标准,GB/T2261.1-2003中国卫生信息学会,标准,2006.12.31注册状态PAT0101_300011B元数据识别号值域元数据类型性别同义名称Sexcode英文名称性别代码中文名称值域性别代码标识类versionZerooronepermetadataitem.0..1版本号9itemidentifier–itemregistrationauthorityidentifierZerooroneperitemidentifier.0..1条目标识-条目注册机构标识符8itemidentifier–dataidentifierOneperitemidentifier.(Themandatoryportionofanitemidentifier.)0..1条目标识-数据标识符7context.0..1语境6itemidentifierZerooronepermetadataitem.Requiredifnameisnotuniquewithinagiven0..1条目标识符5contextdescriptionOnepercontextname.0..*语境描述4contextidentifierZerooronepermetadataitem.Requiredifcontextnameisnotuniquewithinitsusagecontext(e.g.astandard).0..*语境标识符3contextnameZeroormorepermetadataitem.Requiredifmorethanonenameattributeexists.0..*语境名称2nameOneormorepermetadataitem.1..*元数据条目名称1definitionsourcereferenceZerooroneperdefinition.NOTEWheremultipledefinitionsareassignedtothesamemetadataitem,thesemanticsofthedefinitionshouldbethesameacrossallcontexts.(Ifthesemanticsaredifferent,separatemetadataitemsshouldbespecified.)However,theterminologyusedtoexpressthesemanticsmayneedtobedifferentindifferentcontexts,andthusseparatedefinitionsarepermittedforeachcontext.0..*定义来源12definitionlanguageidentifierZerooroneperdefinition.0..*语言标识符11definitionOneforeachcontextinwhichthemetadataitemisused(seenote1).1..1定义10定义类submittingorganizationnameZerooronepermetadataitem.0..*提交机构名称16responsibleorganizationnameZerooronepermetadataitem.0..*注册机构名称15registrationstatusZerooronepermetadataitem.0..*注册状态14commentsZerooronepermetadataitem.0..*备注13管理类commenttorecordarelatedmetadatareference.0..1关系说明24typeofrelationshipOneperrelatedmetadatareference.0..1关系类型23relatedmetadatareferenceZeroormorepermetadataitem.0..*相关元数据参照22classificationschemeitemvalueOneforeachclassificationschem
本文标题:4 国家卫生数据字典与元数据管理系统(深圳)
链接地址:https://www.777doc.com/doc-5588661 .html