您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 中医药古文献知识挖掘与利用研究
中医药古文献知识挖掘与利用研究中国中医科学院中医药信息研究所李兵2015.08.02目录Contents一、背景二、现状与趋势三、中医古文献知识的挖掘与利用四、温病古籍的知识挖掘与利用六、问题与展望五、基于知识组织的本草知识检索平台中医药古文献知识是现代中医药学知识的源泉。古文献的特殊性使其知识的挖掘与利用较一般文献更加困难。信息化,大数据,移动医疗的发展时代,挖掘和利用中医药古文献知识。背景•中医药古文献数字化及数据库建设发展迅速。•中医药古代文献知识的深度开发与利用不足。•从数字化、数据库建设到知识库构建和知识服务的方向发展古箱图片中医古籍编辑平台发布阅览系统服务器数据库电子古籍发布系统生成导入二次校对解析发布用户管理扫描选择保存图形处理古籍古籍电子书压缩上传古籍图像浏览电子古籍阅览系统Web界面检索现状与趋势中医药古文献的知识挖掘与利用利用现代信息技术和数据挖掘等手段对中医药古文献知识进行解析、归类、重组和关联,使其成为结构化的知识库,从而实现中医药古文献的知识发现与知识服务。本草知识检索平台温病和本草古籍为例语义本体方法数据挖掘方法知识组织方法10种温病辨治规律的知识挖掘温病知识检索系统研究方法与技术路线古籍温病辨治特点的知识挖掘研究方法与技术路线古籍温病辨治特点的知识挖掘运用数理统计法对四时温病的病因、病位、症状、治法等信息进行频次、频率、累积频率统计分析;对四时温病病因进行聚类分析;采用因子分析与聚类相结合探索四时温病证候;基于关联规则挖掘药物配伍以及症状-中药间关系。采用相应的数据挖掘方法,分析古籍中10种温病的辨治规律和特点。即古籍中记载10种温病的病因、病位、治法、药物配伍规律及常用方等。研究方法与技术路线古籍温病辨治特点的知识挖掘以风温病为例风温病因、症状、病位、治法、方剂的频次分析研究方法与技术路线古籍温病辨治特点的知识挖掘基于K-mean聚类的风温病病因分析一种聚簇算法,也是一种最简单的无监督学习算法之一,也称之为动态聚类或逐步聚类方法,是目前最著名和最常用的基于划分的数据挖掘算法。本研究基于聚类对四时温病病因研究。K-means聚类对风温病因进行K-means聚类,经过5次迭代,将其分为4类时较为合适:第一类包含案例数109个----误治第二类包含案例6个----毒邪第三类案例49个----温邪和伏邪第四类包含案例40个----热邪和风邪NumberofCasesineachClusterCluster1109.00026.000349.000440.000Valid204.000Missing.000研究方法与技术路线古籍温病辨治特点的知识挖掘因子分析与聚类相结合的风温证候挖掘成份12345678910身重.857多眠.842语言謇涩.841鼾.840汗.736脉浮.577失溲.931直视.912小便不利.891咳嗽.736恶风.689烦.665渴.600脉弦.822脉数.820发黄.953瘛疭.950谵语.778利.773神昏.471喘.800痰.724躁.616头痛.802热.722身热-.672疹.553咽痛.726舌白.408.498Factor1:身重、多眠、语言謇涩、鼾、汗、脉浮Factor2:失溲、直视、小便不利Factor3:咳嗽、恶风、烦、渴Factor4:脉弦、脉数Factor5:发黄、瘛疭Factor6:谵语、利、神昏Factor7:喘、痰、躁Factor8:头痛Factor9:热、身热、疹Factor10:咽痛、舌白六种证候:邪郁卫表;邪热蕴内;风热蕴肺;邪入心包;热入营分;少阴证候。研究方法与技术路线古籍温病辨治特点的知识挖掘基于关联规则风温病用药、症状-中药分析频繁单项集----高频单味药频繁2项集----找寻药对频繁3项集频繁4项集----药物组合频繁多项集研究方法与技术路线古籍温病辨治特点的知识挖掘风温病辨治规律及特点总结风温病因以风邪、温热、伏邪、误治四类为主,“误治”有待关注;风温病位多在肺;风温证候包括肺卫证候、气分证候、营血分证等;风温治法以清热解表宣肺为主,清法兼有滋阴;风温用药常以川芎-羌活、石膏-葛根、薄荷-连翘、杏仁-石膏配伍;风温治疗常用方包括葳蕤汤加减等。研究方法与技术路线基于语义关联的温病古籍知识检索系统温病古籍采集相关文献信息专家指导标准规范基于原文的知识提取(中医大辞典、中医药学术语集成)知识和术语的分类、规范(温病大词典)温病古籍知识分类与概念关系定义(语义本体方法)(中医药学语言系统)对知识、术语、文献信息进行概念关系关联,形成温病古籍知识体温病古籍知识检索系统研究方法与技术路线基于语义关联的温病古籍知识检索系统疾病证候治法方剂中药病因症状医籍医家包含…论述影响由..治疗由..导致包含…记载由..治疗语义关联示例(疾病类)46种温病古籍文本及医籍、医家、现代研究信息的采集、规范。病、证、治、方、药、医籍、医家,7类概念术语的语义关联。25种语义关系的定义,各类温病古籍知识的关联依据。研究方法与技术路线基于语义关联的温病古籍知识检索系统温病古籍知识的语义关联检索,根据语义检索相关知识点。温病古籍和相关文献信息的整合,具有一定的研究支持功能。温病古籍知识及其概念属性关系的多维度、可视化展示。温病古籍全文检索及原文浏览功能温病古籍知识检索系统研究方法与技术路线基于语义关联的温病古籍知识检索系统检索结果界面研究方法与技术路线基于语义关联的温病古籍知识检索系统检索结果的可视化展示(三仁汤)研究方法与技术路线基于语义关联的温病古籍知识检索系统全文检索及浏览界面研究方法与技术路线基于知识组织的本草知识检索系统组织方法检索系统知识关联知识提取文献调研书目选取•根据概念类型提取归类本草知识•根据概念关系实现本草知识关联•数据整理和规范。•设计构建本草古籍知识检索系统•中医古籍资源的深度检索•梳理本草古籍中的概念类型•定义本草知识的概念关系。•10种本草古籍;•基于原文进行文献分析。概念关系概念类型研究方法与技术路线基于知识组织的本草知识检索系统10种本草古籍概念类型词条分布63种概念类型定义,如名称、分类、来源、性能、配伍、功用、组方、炮制等,是本草古籍中的主体知识组织结构。定义各概念类型间的概念关系27种,是本草知识关联的依据。基于原文的解析、概念类型的知识分类、概念关系关联的本草古籍知识组织方法6755条本草数据99352条知识术语基于知识组织的本草知识检索系统功能特色:1、基于知识关联词表检索相关本草知识,检索结果不局限于本草本身,同时能够检索到与其相关的其他概念类型,即本草的“知识体”。2、其他各类概念类型知识与本草药物的“交互检索”,能够通过其他概念类型的知识检索到相关本草药物。3、根据检索结果进行本草古籍的全文检索与阅读。4、本草知识和关系的动态、可视化展示,本草知识展示的控制与交互。研究方法与技术路线基于知识组织的本草知识检索系统检索结果-(古籍中黄芩的相关知识及可视化)研究方法与技术路线基于知识组织的本草知识检索系统交互检索-(古籍中治疗黄疸的药物)研究方法与技术路线基于知识组织的本草知识检索系统检索结果全文浏览养生理论导引按摩四时起居针灸刮痧拔罐...七情、疾病、调节...经穴、手法、疾病、图示、...节气、睡眠、服食、疾病、调养...阴阳、五行、气血、经络...经络、穴位、手法、疾病....情志养生饮食养生中医养生其他类中医药古文献的应用食用本草、药性、功用、疾病、用法...节气、睡眠、服食、疾病、调养...阴阳、五行、气血、经络...经络、穴位、手法、疾病....存在问题及展望中医古籍数字化及文本化是知识挖掘和深度利用的基础,目前,中医古籍数字化的基础总体上依然薄弱。古籍中概念知识的标准化、规范化研究有待进一步研究应用知识挖掘、知识组织和语义网相关研究方法,能够对中医古籍知识进行深度的解析、揭示及利用,为中医古籍知识的深度挖掘与利用提供了新的途径。谢谢!请各位专家指正!
本文标题:中医药古文献知识挖掘与利用研究
链接地址:https://www.777doc.com/doc-3438045 .html