您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 国内外标准规范 > TCHIA 17.2-2020 健康医疗大数据资源目录体系 第2部分:技术要求
ICS35.240.80C07团体标准T/CHIA17.2-2020健康医疗大数据资源目录体系第2部分:技术要求HealthbigdatainformationresourcecatalogsystemPart2:Technicalrequirement2020-11-16发布2020-12-1实施中国卫生信息与健康医疗大数据学会发布T/CHIA17.2-2020目次前言......................................................................................................................................................I1范围.................................................................................................................................................12规范性引用文件.............................................................................................................................13术语和定义.....................................................................................................................................14技术要求.......................................................................................................................................15关键技术方法...............................................................................................................................46健康医疗大数据资源目录服务接口..........................................................................................5T/CHIA17.2-2020I前言T/CHIA17-2020《健康医疗大数据资源目录体系》分为以下五个部分:――第1部分:总体框架;――第2部分:技术要求;――第3部分:基本元数据;――第4部分:资源分类;――第5部分:资源标识符编码规则。本部分为T/CHIA17-2020的第2部分。本部分按照GB/T1.1-2020给出的规则起草。本部分由华中科技大学提出并归口。本部分主要起草单位:华中科技大学、国家卫生健康委统计信息中心、空军军医大学。本部分主要起草人:马敬东、李岳峰、胡建平、董方杰、沈丽宁。T/CHIA17.2-20201健康医疗大数据资源目录体系第2部分:技术要求1范围本部分规定了健康医疗大数据资源目录体系的基本技术要求。本部分适用于健康医疗大数据资源目录管理系统的建设。2规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准。但是,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。T/CHIA17.1-2020健康医疗大数据资源目录体系第1部分:总体框架T/CHIA17.3-2020健康医疗大数据资源目录体系第3部分:基本元数据T/CHIA17.4-2020健康医疗大数据资源目录体系第4部分:信息资源分类T/CHIA17.5-2020健康医疗大数据资源目录体系第5部分:资源标识符编码规则3术语和定义T/CHIA17.1-2020中规定的与以下术语和定义适用于本部分。3.1目录服务器catalogserver按照目录服务器接口的要求,提供健康医疗大数据资源发现和目录管理的计算机服务程序。3.2元数据库metadatadatabase存储元数据的逻辑数据库。3.3结果集resultset根据目录检索请求在服务器端间的查询结果集合。4技术要求4.1概述健康医疗大数据资源目录的整体功能实现依靠各个计算机系统来实现。根据每个系统T/CHIA17.2-20202所实现的功能不同可细分为编目管理系统、目录内容管理系统、目录内容服务系统、元数据管理系统和目录功能系统。4.2编目管理系统编目管理系统根据各个健康医疗大数据资源的内容,提取其基本特征,按照相关标注实现元数据赋值,形成目录内容。编目管理系统应遵循以下技术要求:a)编目对象是具体的健康医疗大数据资源,其内容包括各个行业、部门日常长期以来形成的海量数据。具体形式可以是数据库、图片、文档等各自类型的数据。b)编目管理系统应该支持自动、机辅方式完成元数据元素的赋值。c)唯一标识符管理功能:支持唯一标识符的分配和赋值,包括支持后段码的自动生成和管理。d)标准符合性检查功能:支持政务信息资源元数据和标准一致性检查,元数据完整性检查的主要目的是保证所有必选的元素据实体和元数据元素已经赋值,标准一致性检查的主要目标是保证已填写好的元数据实体和元素据元素的取值符合编目管理系统的相关规定。e)信息资源分类:按照大数据信息资源分类标准,实现对共享大数据信息资源的分类。4.3目录内容管理系统健康医疗大数据资源目录管理系统包含外部管理系统和内部管理系统。外部管理系统就是要建立外部网站门户,对外实现健康医疗大数据资源注册、发布、查询、调阅、推送等功能;内部管理系统就是要对内实现健康医疗大数据资源编目、目录维护、主题统计、共享监测等功能。4.4目录内容服务系统健康医疗大数据资源目录服务系统是健康医疗大数据资源目录管理系统的子系统。可细分为三个服务系统:资源共享服务系统、公共信息服务系统、辅助决策服务系统。4.4.1资源共享服务系统资源共享服务系统是指通过资源注册和查询,实现单一信息源对其他机构、部门的信息资源共享,从而解决信息的完整性和一致性问题。资源共享服务系统应具备的基本功能包括:a)共享资源注册:各类健康医疗数据能够通过资源共享服务系统实现注册,从而达到以规范的方式对各级各类医疗卫生机构产生的各种信息资源进行标准化编目,对注册的资源目录元数据进行集中管理,促进跨机构、跨地域健康医疗大数据资源的共享、开放与应用。b)共享资源查询:能够通过资源共享服务系统查询健康医疗大数据资源目录中所包含的数据,从而实现资源的共享与利用。T/CHIA17.2-202034.4.2公共信息服务系统公共信息服务系统是指通过资源查询与推送,实现对授权人提供完整个人健康医疗大数据信息或对社会公众提供公共健康医疗信息,从而解决信息的可及性和公开性问题。资源共享服务系统主要实现的功能是信息推送,即向授权人提供完整个人健康医疗大数据信息或对社会公众提供公共健康医疗信息。4.4.3辅助决策服务系统辅助决策服务系统是指通过资源查询与调阅,实现多渠道健康医疗信息的采集、汇总、分析与综合应用,为行政管理部门提供多样、科学的决策信息。辅助决策服务系统应具备的基本功能包括:a)信息资源的查询与调阅;b)信息资源的汇总与分析;c)信息资源的综合应用。4.5元数据管理系统元数据管理系统的目的是实现对元数据的管理,应提供元数据元素管理、元数据实体管理、元数据集管理、元数据版本管理等功能。其具体功能包括:a)添加、修改元数据库;b)添加、修改元数据库信息;c)添加、修改元数据表;d)添加、修改元数据表信息。4.6目录功能系统目录功能系统是实现健康医疗大数据资源目录功能的主要系统。其应具备的基本功能包括:a)健康医疗大数据资源注册:注册的资源应该符合健康医疗大数据资源目录的要求,并且给每个注册的资源赋予唯一标识符;b)健康医疗大数据资源发布:将注册的信息资源加入到资源目录体系中,并且在门户网站上发布;c)健康医疗大数据资源查询:根据查询请求对目录内容信息进行查询,并返回查询结果;d)健康医疗大数据资源调阅:实现健康医疗大数据调阅功能,方便查询者浏览信息资源;e)健康医疗大数据资源目录维护;f)健康医疗大数据资源主体统计;g)健康医疗大数据资源共享监测。T/CHIA17.2-202045关键技术方法5.1数据库技术构建健康医疗大数据资源目录体系的关键在于通过构建元数据库来实现元数据管理。元数据是关于数据的数据,又称中介数据、中继数据,主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。元数据库是按照数据结构来组织、存储和管理数据的数据仓库。使用元数据目的在于:识别资源;评价资源;追踪资源在使用过程中的变化;实现简单高效地管理大量网络化数据;实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。元数据库的基本结构可以分为三层:a)物理数据层:数据库的最内层,是物理存贮设备上实际存储的数据的集合。这些数据是原始数据,是用户加工的对象,由内部模式描述的指令操作处理的位串、字符和字组成。b)概念数据层:数据库的中间一层,是数据库的整体逻辑表示。指出了每个数据的逻辑定义及数据间的逻辑联系,是存贮记录的集合。它所涉及的是数据库所有对象的逻辑关系,而不是它们的物理情况,是数据库管理员概念下的数据库。c)用户数据层:用户所看到和使用的数据库,表示了一个或一些特定用户使用的数据集合,即逻辑记录的集合。数据库不同层次之间的联系是通过映射进行转换的。根据我国健康医疗大数据信息资源管理、应用需求,综合国外大数据资源目录体系构建元素,参考国内其他行业大数据资源归类方法,从资源内容、资源表示、资源管理、资源责任和资源获取等5个维度构建我国健康医疗大数据信息资源目录元数据库。5.2资源目录分类模型构建健康医疗大数据资源目录体系的第二个关键问题在于如何实现资源的分类。因此需要构建分类模型来实现健康医疗大数据资源的分类。依据相关学者的研究,健康医疗大数据资源分类由类目、亚目和细目等3个层次组成。类目共划分为8个大类:依据国家全民健康信息化框架中对6大业务应用和3大数据库的总结,分为公共卫生、计划生育、医疗服务、医疗保障、药品管理和综合管理等6个基本业务类,将全员人口信息数据库、电子病历数据库和健康档案数据库归为基础信息类,考虑到移动通讯、云计算、物联网和人工智能等新兴技术在健康医疗领域的广泛应用,增加新兴业态类。亚目是根据各类目领域的特点,按照业务内容的组成部分或业务流程的先后顺序进行分类,并对每个类目都增加“其他”项作为兜底项。5.3分类编码编码是标识信息资源的关键方法,依据我国《卫生信息标识体系对象标识符编号规则》和《卫生信息标识体系对象标识符管理注册管理规程》,我国健康医疗大数据资源根目录为2.16.156.10011.2.100,并分别对类目(2位码)、亚目(2位码)、细目(4位码)和信息资源(10位码)分别进行编码,从而实现对健康医疗大数据资源的标识。T/CHIA17.2-202055.4元数据采集与存储技术元数据采集技术包括元数据的自动采集技术和手工采集技术。自动采集技术一般和业务系统或者健康医疗大数据资源生产系统结合比较紧密。无论是元数据的自动采集还是手工采集,其基本核心包括两方面的内容:一是对元数据内容标准的支持。不同的健康医疗大数据资源类型、不同的应用需求所需要的元数据内容是不同的。而且越是复杂的元数据内容标准,其内部的结构和相互关系就越复杂。因此,元数据采集应当支持对不同元数据内容标准的元数据进行采集,同时能
本文标题:TCHIA 17.2-2020 健康医疗大数据资源目录体系 第2部分:技术要求
链接地址:https://www.777doc.com/doc-10878998 .html