您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 试论基础数据库群在结构分析中医药数据库中
基础数据库群生存现状与发展设想刘静自从1987年开始建立中医药期刊文献分析检索系统以来,我们陆续建立了各种文献事实型数据库,尤其在从2000年成立的中研信公司以来,可以说是各种文献事实型数据库的一个大的飞跃,在中医药文献期刊数据库、新闻数据库等基础上,先后建立了疾病诊疗数据库、中国中药数据库、新药品种数据库、中国医院数据库、药品企业数据库、科研机构数据库、中药方剂数据库等等近三十个数据库。这些数据库大大丰富了我们中医药在线网站的网上检索信息,为临床、科研、教学及管理提供了大量的服务,在一定程度上促进了中医药事业的发展。1.现有数据库的简介:1.1临床医学研究数据库:1.1.1疾病诊疗数据库:共有记录3776条,可以从疾病名称、发病机理、诊断标准、中西医治疗等多个字段检索。1.1.2中医药期刊文献数据库(中英文版):现中文版已收录了从1984年至2003年的记录50余万条,共有文摘20万条,可从文题、文摘、主题词、关键词、出处、作者等多角度检索查询。1.2中药与藏药数据库:1.2.1中国中药数据库(中英文版):现在记录11000余条,可从药名、别名、基原、形态、资源分布、栽培、药理、化学成分等多方面检索。1.2.2中国藏药数据库:现有记录500余条,检索方式同《中国中药数据库》。1.2.3中国中药药对数据库:现在记录约1000条,可从药对名称、归经、功效、主治、配伍机制、药对来源等多方面检索。1.2.4中国中药化学成分数据库:现有记录4000余条,可从药名、化学名、分子量、理化性质、毒性等多方面检索。1.3中西药品数据库1.3.1中药非处方药数据库:共有记录2700余条,为第一批至第四批药监局公布的中药非处方药,可从药名、用药分类、作用类别、功效、主治、用法用量等多方面检索。1.3.2中国医药产品数据库:共有记录8000余条,可从药名、生产厂家、规格、剂型等多方面检索。1.3.3中药新药品种数据库:共有记录1900余条,为1987至2002年药监局公布的中药新药品种,可从药名、药物组成、研究单位、申请日期、新药证书编号等多方面检索。1.3.4中国国家基本药物数据库:共有记录2262条,为2002年版药监局公布的国家基本药物,包括了中药及西药,可从药名、中西药分类、作用分类、药物组成、功效、主治、用途、药理作用等多方面检索。1.4国家标准数据库:1.4.1中国中药成方制剂标准数据库:共有记录4000余条,可从方名、标准号、药物组成、性状、功效、主治、用法用量、药理作用等多方面检索。1.4.2中国藏药药品标准数据库:共有记录366条,可从方名、药名、标准号、药物组成、性状、功效、主治、用法用量、药理作用等多文献检索。1.4.3中医临床诊疗术语国家标准数据库:共有记录近3000条,包括了国标中医临床诊疗术语治法、疾病、证候部分,可从名称、分类、同义词、注释等方面检索。1.5方剂数据库:1.5.1中国方剂数据库:现有记录80000余条,出自700余种历代文献,可从方名、处方来源、药物组成、主治、功效等多方面检索。1.5.2方剂现代应用数据库:共有记录9000余条,80年代以来的现代方剂临床应用的文献,检索途径同《中国方剂数据库》。1.6企业数据库:1.6.1中国医药企业数据库:现有记录4000余条,可从企业名称、企业分类、企业规模、地址、电话、邮编等进行检索。1.6.2中国GMP认证企业数据库:共有记录2600余条,收录了自1999年10月第1号公告,至2003年的最新公告,并时时更新,可从企业名称、认证范围、证书编号、公告日期等检索。1.6.3中国医院数据库:共有记录12000余条,可从医院名称、地址、邮编等检索。1.7年报数据库:1.7.1中国药品企业年度报表数据库(1999年):共有记录3587条。1.7.2中国药品企业年度报表数据库(2000年):共有记录3819条。1.7.3中药药品企业年度报表数据库(2001年):共有记录552条。1.7.4中药药品企业年度报表数据库(2002年):共有记录545条。以上四个年报数据库可以从企业名称、企业规模、地址、邮编、产值、资产、销售、利税、在全国的排位等方面进行检索,并且每年增加一个新的年报数据库。1.7.5中国中成药主要产品产量数据库1999-2002年:共有记录4000余年,收录了从1999年至2002年全国中成药主要产品产量,可从药名、企业名称、剂型、规格、当年产量、全国总产量、销售收入等方面进行检索。2.网上检索:2.1单表检索:分别进入各个单表进行检索。2.2多库融合检索:进入多库融合检索平台,可以选择性的在相关数据库中联合检索。2.3关联导航信息检索:通过关联导航信息检索平台,从一个切入点进入,由计算机数据库操作系统引导,进行相关信息及关联数据库的检索。3.基础数据库群现状与存在问题:以上所介绍的基础数据库群均为事实型的单表文献数据库,存储了大量的文献和数据,发挥了巨大的作用,已经为中医药科研、医疗、教学等做出了巨大的贡献,而且还将在很长的一段时间内发挥其应有的作用。但从整体数据库群来讲还存在着许多尚未解决的问题,是我们信息工作人员有待努力改进和解决的。3.1虽然经过了艰苦的努力和工作,现有的数据库仍不能够回答科研、医疗、决策人员迫切需要我们信息工作者回答的问题:以上的将近三十个数据库已经做了大量的工作,而且中医药期刊文献库已收录加工了50余万条文献,2002年全年中医药期刊文献数据库共收录了44300余篇文献,共标引了11万多个主题词,3万余篇文摘。但是如此艰辛的劳动,仍不能回答以下的问题,如:中医药治疗疾病的疾病谱是什么?近十年来中医药治疗疾病的疾病谱有无明显的变化?中医药疗法最有效的前100名疾病名称是什么?到底是哪些中药对这些疾病确有疗效?中药对人体的哪些指标的变化研究最多?单味药与单味药之间到底有否药对配伍关系,文献的支持率是怎样的?等等问题,作为我们长期从事信息工作的人员仍然回答不了,借助于现有的数据库也很难回答以上的问题。3.2数据库检索专业性,限制了数据库的利用:这个问题主要是表现在中医药文献数据库,文献数据库自从建立以来,已经将近二十年,它的建库技术是非常专业非常成熟的,已经积累了50万余条数据,通过标引人员及文摘员的加工,本数据库可以从主题词、特征词等方面进行非常精确的检索。但是随着计算机技术的飞速发展,中医药文献数据库没有全文、检索技术太专业化等特点也充分暴露,既使一个专业的标引员没有经过严格的训练和一定量的实践也难以完成一个项目的精确检索。要想熟练的使用中医药文献数据库,必须进行专业培训,要付出大量的人力和精力。一般使用人员登录到检索界面后,首先感到无从下手,例如要检索人参的药理学,如果只是在文题中检索人参药理学,可能就一篇也没有或者很少量的文献,如果用主题词人参和主题词药理学来检索,又会检出大量的非人参药理学的文献,也就是说文献数据库检索人性化还有待于提高。3.3数据库的维护更新非常困难:例如中国中药数据库,目前是全国唯一的一个中药单味药数据大全型数据库,收录的中药条目已达11000余条,它是将中药单味药研究几十年甚至几百年的数据全部收录了,那么它目前所面临的主要问题就是更新维护困难,一个单味药的药理研究进展、化学研究进展、毒性研究进展、资源调查研究等等跟踪困难,对收集到的资料认证更不是我们数据库制作人员力所能及的。等待这方面的新专业书籍出版,再采集资料更新维护,是解决问题的一个方面,但将长期使中国中药数据库处在一个停滞发展的阶段,即使有新书也不能确定内容是新的,依然存在对资料的认证难度,所以更新维护这种类型的数据库遇到了相当的困难,可以说比重新制作一个新数据库还困难。3.4数据库放置分散,相关数据库没有形成组群,不利于相关资料的查找:这个问题主要表现在中药企业与药品数据库,这是一个相关数据库最多的群体,现有数据库为中国中药新药品种数据库、中国中药非处方药数据库、中国医药企业数据库、医药产品数据库、中药成方制剂标准数据库,以及相关的企业报表数据库等。目前均是单表排列,如果一个检索人员不熟悉以上相关的数据库,检索起来难度很大,极有可能只检索了某个数据库,而对相关的数据库没有进行利用。如果将这些数据合并成一个数据库,又会发生许多人为的错误,因为许多基础数据是从方方面面收集来的,不是第一手材料,本身就带有许多加工中的错误与不准确的信息,而且一旦合成,字段即可达几十甚至上百,实际上更将造成检索的不方便。目前我们有两个方剂数据库,分别为中药方剂数据库、现代方剂临床应用数据库,也是单表排列,如果不熟悉的检索人员可能会漏检,或产生困惑。而对方剂目前科研人员比较关注的内容,如方剂的配伍规律、方剂的药理、方剂的药化等研究,仍然没有很好的文献服务方式。3.5小型数据库表的利用:现阶段我们小型数据库表基本上没有涉及,例如:第一批中止药品生产批准文号的品种名单、市售中药制剂及不良反应、卫生部认定的健康相关产品检验机构等等,这些数据对于现有的数据库没有合适的位置和群组,也就不能及时的上网和利用。4.基础数据库的发展设想4.1开发研制中医药文献结构型数据库,试图回答中医药研究迫切需要信息工作人员回答的问题:我曾经借助Access数据库强大的分析功能,对2002年中医期刊文献数据库的主题词进行了疾病的词频分析,发现在2002年中医药期刊文献所报道相关疾病前十余名分别为各类肝炎(病毒、药物等)、糖尿病(各型)、椎间盘移位、冠状动脉疾病、颈椎病、高血压、脑梗塞、中风、哮喘、咳嗽、肾功能衰竭等,但这个结果并不是直观的,首先是我比较熟悉中医药期刊文献数据库,并能比较熟练使用Access数据库,进行了部分加工,对于一般数据库使用人员就难于做到这一点。再想进一步深入下去,看一看用于治疗这些疾病哪些药物的使用频次最高,就会发现以上所有的数据库均无法解决这个问题。这就说明了以上这种文献事实的数据库具有局限性,不能够提供对数据数值的深层次分析,加工的方法方式已经远远落后于计算机技术的发展,这就要求我们必须开发一种利用现代计算机技术的新型数据库——中医药文献多表结构关联型数据库,来解决文献事实型数据库不能解决的中医药治疗疾病的疾病谱、相关疾病的高频药物、相关人体指标的高频药物、单味药与单味药之间配伍规则、验证药对理论等等,用以指导和服务于临床医疗工作者及中药研究工作者。凡文献事实型数据库可解决的问题应不作为结构数据库的重点。4.2建立并完善关联导航信息检索平台,尽快将一体化语言支撑系统用于关联导航信息平台的检索应用:为了解决数据库放置分散,相关数据库没有形成组群,不利于相关资料的查找的问题,从2003年初我们开始设计并建立了关联导航信息检索平台,在这个检索平台上,可通过医疗、中药、产品、方剂、机构、文献等六个方面切入,通过计算机数据库操作系统引导,进行相关信息及关联数据库的检索,解决了由于检索人员不熟悉以上相关的数据库,检索起来难度大,疏忽相关数据库利用的问题。在使用关联导航信息检索平台中我们也发现,由于缺乏一个强有力的语言支持系统,在一定程度上限制的关联导航信息检索平台的使用,这就要求我们,必须加强一体化语言系统的实用性研究,尽可能在最快最短的时间内将一体化语言系统用于检索使用,以提高关联导航检索平台的扩展性与关联性,更方便的为用户服务。4.3加强基础数据的收集整理,仍是今后工作中的重点:虽然经过不断的努力,我们建立了许多数据库,但是这些数据库对于浩如烟海的中医药文献来讲,是远远不够的,关联导航信息检索平台越完善,就会越觉得我们的基础数据库缺失严重,所以基础数据的收集与整理加工,仍然是我们今后工作的重点。应逐步建立诊断标准数据库、疗效标准数据库、临床医师用药指南数据库等等多方面、多角度的基础数据库群。4.4继续加强中医药期刊文献数据库的二次开发和利用,辅助解决部分数据库维护更新问题:中医药期刊文献数据库现有的建库技术非常成熟和专业化,也有了悠久的历史,全文数据库也不是本数据库的发展方向,我们不能够在资金及人力均处于弱势的情况下强行竞争。检索专业化是本数据库的一个特点,在现阶段也
本文标题:试论基础数据库群在结构分析中医药数据库中
链接地址:https://www.777doc.com/doc-376954 .html