您好,欢迎访问三七文档
39JChinMed15(1):39-46,2004建立「疫疾」中醫藥典籍文獻擷取索引典陳逸光慈濟大學醫學資訊系花蓮(2003年11月21日受理,2004年2月10日接受刊載)今年(2003),在亞洲及加拿大所爆發之流行病──嚴重急性呼吸道症候群(SARS),醫療、衛生及生物科技界精英皆投入抗SARS最前線,人人談SARS色變。中國古代當大疫流行,統治者承受相當大的壓力,所以史籍上很少詳細記錄嚴重大規模的疫情,經常以寥寥數語便略過,因為封建社會認為“疫”是天災不詳之兆。中國歷代醫家,對抗疫的貢獻相當大,如東漢末年張仲景之所以著《傷寒論》就是因為大疫流行之故。倉促中及電子典籍來源所限,本研究在短短三個月內整理出22本電子中醫藥典籍,約一千萬字文獻資料,並建立「疫」索引典內含37個關鍵詞,共篩選出二萬一千餘個與索引典相關之條文,並且以動態資料庫形式,放置在TCMET網際網路上供學者專家們參考、下載及研究。關鍵詞:中醫藥典籍,疫,資訊擷取,索引典,網際網路。前言公元2003年全球醫療衛生界最大事件;莫過於在本年初發生的嚴重急性呼吸道症候群SARS(SevereAcuteRespiratorySyndrome),醫界發現SARS是由一種冠狀病毒所引起,這是一種過去只有在動物身上才能找到的病毒,如今卻找上人類作為宿主,由於人類的免疫系統缺乏對抗冠狀病毒(CoronaVirus)的抗體1,所以造成一場廣泛性的大流行。在這次事件中最不幸的是這種病毒一旦侵犯人體,有些患者會造成肺部嚴重浸潤(Infiltration)甚至發生纖維化(Fibrosis),最後導致呼吸衰竭(RespiratoryFailure)而死亡。中國歷代史書上有關傳染病記載和歷代醫家創立的醫學理論及治療方法,是研究中國古代對抗傳染病的一個重要議題,也是本文一個主要研究動機;藉由電子計算機的幫忙擷取及整理中醫古籍文獻,已經是時代的趨勢,在電子文獻擷取議題中將資訊組織起來構成人類的知識,是資訊擷取科技的一項重要任務,由文獻資料演變成知識此一過程中,資訊「集結」(cluster)是一項讓電腦認知人類知識的重要依據,「集結」需要有聯絡人:陳逸光,花蓮市中央路三段701號,慈濟大學醫學資訊系,電話:03-8565301轉7404。建立「疫疾」中醫藥典籍文獻擷取索引典40索引典(Thesaurus)足夠代表一個專題或一概念而具邏輯意義」2(LogicalMeaning)。過去筆者曾經發表過「黃帝內經」詞典庫3及「河間六書方劑擷取」4之資訊擷取(InformationRetrieval)有很高的準確率(PrecisionRate)和回收率(RecallRate)。本研究以「傳染病」為題,尤其是以「疫」症為資訊擷取對象,針對特定知識(「疫」),一方面可以深入探討「集結」之資訊認知,另方面對中國歷代傳染病的醫學文獻資訊作整理,藉由網際網路之便利,希望對SARS研究工作者提供一些有關「傳染病」的電子中醫古籍文獻資訊,對人類醫療衛生作點微薄貢獻,更重要的是身為中醫人理應各展所長多方面發揚中醫。準確率和回收率是兩個有關文獻擷取效率最常用的指標3,有關「疫」疾的中醫古籍文獻篩選過程中,本研究盡可能從歷史學者著作或自臨症經驗中挑選較有代表性的「字彙」,如「疫癘」這個字彙對本文主題「高危險流行性傳染疾病」有較高的準確率,用單一個「疫」字來搜尋則準確率下降而回收率相對會提高,針對上述之議題本研究從傳染疾病的觀點整理出「疫」相關的索引典(Thesaurus)。「傳染病」代表醫學上的一種概念,而利用上述具代表性之詞典擷取技術,將為學者專家們提供許多有關「疫」症之重要中國醫學典籍文獻信息。當研究主題確定後,首要工作是要篩選能代表有關「傳染病」知識的中醫索引典,索引典的建造對資訊擷取的效率有決定性的影響。本研究中所收集的中醫古籍文獻共有22種,約一千萬字,文獻選擇類別包括:理論性典籍(黃帝內經)、臨床醫籍(傷寒、溫病)、方劑學(千金方、外臺秘要)、藥物學(經史證類備急本草、本草綱目)等,運用電腦文獻資料處理技術,能將所有電子中醫古籍轉換成資料庫,再經過條件邏輯運算篩選出相關知識條文,本研究已成功建置「傳染病」相關的索引典及一千萬字的中醫古籍文獻資料庫。最後運用文獻擷取技術,整理出與「疫」索引典相關條文共二萬一千餘條,並已在線上加入至TCMET網頁上以動態資料庫形式5供全球網友使用。材料與方法一、材料(一)收集中醫古籍文獻庫本研究共收集電子文獻22種(見附件一):B1(黃帝內經)B2(《金元四大家著作》:劉河間、張子和、李東垣、朱丹溪)B3(明˙張介賓˙《景岳全書》)B4(明˙王肯堂˙《女科證治準繩》)B5(宋˙陳自明˙《婦人良方》)B6(明˙武之望˙《濟陰綱目》)B7(唐˙王燾˙《重訂外台秘要》)B8(宋˙御纂˙太平惠民和劑局方)B9(清˙汪昂˙《醫方集解》)B10(唐˙孫思邈˙《備急千金要方》)B11(清˙柯琴˙《傷寒來蘇集》)B12(清˙雷豐˙《時病論》)B13(清˙葉天士˙《溫病條辨》)B14(清˙戴天章˙《廣瘟疫論》)B15(清˙柳寶詒˙《溫熱逢源》)B16(清˙吳有性˙《瘟疫論》)B17(清˙葉天士˙《臨證指南醫案》)B18(清˙薛生白˙《溫熱病篇》)B19(宋˙唐慎微˙《經史證類備急本草》)B20(清˙張璐˙《張氏醫通》)B21(清˙沈金鰲˙《雜病源流犀燭》)B22(明˙李時珍˙《本草綱目》);上列之電子書籍可參考“電子中醫藥古籍文獻”網站上之資料。陳逸光41(二)文獻資訊處理資料庫使用微軟之SQL2000伺服器,在網際網路上以動態伺服頁(ActiveServerPage)5形式供網友瀏覽「疫」疾資料庫,內容包括關鍵詞之書目、出處及上下文資料等資訊都有線上即時提供閱覽之功能。(三)網際網路架構網際網路架構基本與2002年TCMET相同(參考筆者論文3-5材料與方法項)。二、方法(一)建立「疫」疾相關中醫索引典本研究試從歷史學家的文獻資料中,尋找中國歷代有關「疫」疾的醫學文獻資料,以篩選出在“傳染病”此一專題上有比較高精確率(Precision)及回收率(Recall)的關鍵詞。從歷史文獻中,有相當多的證據可以用來說明某些詞彙是具“流行”與“傳染”特性之記錄6。文獻記載如:(春秋之時)溫氣疫癘,千戶滅門;─《論衡》建安二十二年(217AD),癘氣流行。家家有僵尸之痛,室室有號泣之哀。或闔門而殪,戶覆族而喪。─曹植〈說疫氣〉寶應元年(762AD),江東大疫,死者過半。─《新唐書》從古代中國有關大規模流行之疫疾紀錄中,可篩選出“疫疾”、“疫癘”、“瘟疫”、“疫”...等詞彙(見附件)。從筆者臨床經驗中,外感六淫相關的文字如:“風寒”、“感冒”、“溫病”等關鍵詞,可以預期與「疫」相關之“精確率”雖然會較低,但仍然會有不錯的“回收率”。“精確率”低表示從文獻所收集的信息中有很多雜訊,“回收率”高代表被篩選出來之文獻與「疫」疾正向4,5。由於電腦科技給文獻擷取帶來之便利3,本研究盡量提供不同程度“精確率”及“回收率”的關鍵詞,以建立“疫”索引典,使文獻資訊「集結」(cluster)有更高之知識代表能力。(二)文獻資料庫建置上述之22種電子中醫古籍文獻資料皆以文本(Text)形式記載,為方便在網際網路上讀取資料,本研究所有電子文獻檔皆以資料庫形式存取。文本轉換成資料庫之方法,可參考筆者曾以“網際網路中醫藥典籍文獻動態資料庫研究”5為題發表之論文。(三)“疫”文獻篩選及分類在建立“疫”疾中醫索引典後,本研究以微軟之VisualBasic6.0為工具,將文獻資料讀出並與索引典中之關鍵詞遂項比對,符合篩選條件的資料將轉成資料庫格式儲存。文字比對之方法可以參考筆者曾發表之“黃帝內經貫珠詞典庫之研發與應用”中有關n-gram文字擷取論著3。(四)網頁與資料庫整合網頁可以藉著動態伺服器頁(ActiveServerPage)形式供網友瀏覽「疫」疾資料庫中所有經整合後之建立「疫疾」中醫藥典籍文獻擷取索引典42文獻資料,本研究用三層網頁來引導讀者閱覽資料,最下層網頁顯示出“關鍵詞”所在位置前後20行全文資料(見結果),網頁建置之方法已詳載於“網際網路中醫藥典籍文獻動態資料庫研究”5文獻中。結果(一)索引典擷取「傳染病」文獻中相關句子所出現之頻率本研究共整理出與“疫”相關之詞彙共37個及相關條文21,972處(見附件),每個詞彙在22種中醫文獻之出處及全文內容皆以關聯資料庫方式儲存。(二)「疫」疾重要資訊“疫”疾索引典(見附件),關鍵詞“疫”與“瘟疫”兩者中,很容易看出單一“疫”字所篩選出來之文獻數量會比“瘟疫”多,但眾多擷取出來之資料與“傳染病”之“疫”無關,所以單一“疫”字之“精確率”較差,但比起“瘟疫”詞彙相對會有較好的“回收率”;意謂單一“疫”字在篩選出來之文獻資料有很多是與“傳染病”之“疫”是相關的,相對於“瘟疫”詞彙而言,較不容易遺漏資料。索引典中所有關鍵詞與“疫病”皆有一定程度的“精確率”及“回收率”。有些關鍵詞是從臨床角度來看,例如“發熱”、“惡寒”等關鍵詞,因為“傳染病”經常會有這些症狀,雖然“精確率”較差,而“回收率”則需要慢慢細讀文獻內容才能決定,本研究仍然將這些“症狀”詞彙一併提供給讀者,是因為這些症狀對學者們研究疫病將會提供相當重要之信息。(三)網際網路執行情況(見)網頁第一層(Infect_Keyword.asp)提供所有索引典之進入點;網頁第二層(Infect_KeyCont.asp)提供關鍵詞整行文獻資料,還有書目、篇、章、節等文獻出處;網頁第三層(Infect_detail.asp)除提供網頁第二層之資料外,尚有上下文共40行。討論[嚴重急性呼吸道症候群](SARS)在2003年造成中國大陸、香港、台灣、越南、新加坡及加拿大傳染大恐慌,死亡人數約千餘人,而實際感染SARS病毒人數約一萬人疫情雖然不是很嚴重,但造成社會極度恐慌9,人人談[煞]色變,醫界關切SARS在本年冬天是否會再度爆發流行,現代所說的[流行病],傳統中醫文獻常稱為疫、疫癘、瘟、染易、時行、溫病、傷寒6-9等尤其以“疫”一詞最為常見,醫聖張仲景所著《傷寒雜病論》其序記載“「余宗族素多,向餘二百、建安紀元以來,猶未十稔,其死亡者三分有二,傷寒十居其七。」”,可見當年(200AD)的傷寒就是指疫症,東漢末年赤壁之戰,其時曹營中有疫病存在,有些學者認為是感染血吸蟲病(Schistosomiasis),但亦有學者認為另有原因10,可見從歷史文獻推斷病原(Pathogen)為何物實在是不容易,像今年大流的SARS為冠狀病毒(CoronaVirus)由動物傳給人類,病毒可能只是短暫的流行,也許自此之後便消聲匿跡。中國醫學在古代抗疫的經驗,亦相當之豐富,除傷寒論外,還有很多瘟疫專著如吳有性於崇禎十五年(1642)撰成《瘟疫論》,清代醫家戴天章(1644~1722)陳逸光43著《廣瘟疫論》都是相當著名之瘟疫專家,另外值得一提的中醫典籍《外臺秘要》,其之所以重輯是因為在宋朝皇祐年間(1049~1053)疫病流行,朝廷命御醫重新編輯醫籍唐王燾所著《外臺秘要》給全國醫家學習應用,所以在《宋˙重訂唐王燾外台秘要方》序中有云:“臣昨南方州軍連年疾疫瘴癘,其尤甚處,一州有死十餘萬人...如有疾疫瘴癘之處於《聖惠方》內寫錄合用藥方出牓曉示,及遍下諸縣,許人抄劄,仍令秘閣簡《外臺秘要》三兩本,送國子監”,王燾《外臺秘要》自序:貶守房陵量移大寧郡途中,「自南徂北,既僻且陋」,「提攜江上,冒犯蒸暑」,造成「染瘴嬰痾,十有六七,死生契闊,不可問天」的慘劇。可看出當時王燾,亦是因為「痢疾」流行造成親人死傷慘重而編輯《外臺秘要》一書。近代歷史學家亦認同「疫」一詞最常用於描述〔流行病〕之發生,古之「疫」與近代〔流行病〕相似,皆有在一短時間內爆發大量病例,然後慢慢減少至消失為止;若死傷慘重之疫疾通常會以「疫癘」一詞形容其嚴重程度。近代歷史學家亦指出,中國史書記載疫疾經常未明確指出疫疾之名,對疫疾症狀、特徵與病程
本文标题:建立疫疾中医药典籍
链接地址:https://www.777doc.com/doc-362212 .html