您好,欢迎访问三七文档
技術研發分項計畫91年度工作執行簡報計畫主持人:李德財中華民國九十二年二月二十二日2003年2月22日2組織資訊規範及標準整合計畫數位典藏相關技術研發計畫語言座標—參考資源建置與服務時空座標—歷史地圖運用的推動計畫2003年2月22日3資訊規範及標準整合計畫成立『數位典藏技術工作組織』,組成六個工作群,訂定相關的技術規範及規格。數位典藏系統參考平台命名系統與分散式檢索數位物件與檔案格式多媒體數位化參考程序數位典藏服務系統多語言處理設立網站:召開數位典藏技術規範會議辦理業界說明會辦理數位典藏技術研討會及國際研討會2003年2月22日4數位典藏相關技術研發•數位典藏資料庫技術開發•多媒體處理技術•語言處理技術•智慧財產權與隱私權管理機制之核心技術開發2003年2月22日5技術研發成果2國立故宮博物院文物數位典藏系統之研製–故宮書畫數位典藏計畫提供完整的典藏資訊化規劃與設計已完成故宮書畫典藏管理系統第一階段開發–故宮先秦銅器紋飾資料庫經分析提供器物紋飾資料著錄與檢索功能已完成系統設計,正進行資料轉換與測試台灣大學昆蟲標本館典藏數位化計畫–已完成生態模式資料管理系統雛型設計物種分類、物種資訊、標本資訊、採集資訊、鑑定資訊、名錄異動、相關文獻、相關影像媒體2003年2月22日6技術研發成果1典藏系統與HandleSystem間之整合–已完成典藏系統與命名管理系統之整合介面設計多媒體管理中心–已完成多媒體資料管理與儲存之典藏系統–具相簿管理、媒體管理…等多項功能人名權威資料庫–具保存人物典藏資料之能力,並提供相關之管理功能典藏系統權限控管模組–提供典藏系統權限控管功能–已整合到各典藏系統,並已元件化2003年2月22日7故宮書畫典藏管理系統2003年2月22日8故宮書畫典藏管理系統2003年2月22日9故宮書畫典藏管理系統2003年2月22日10故宮先秦紋飾資料庫2003年2月22日11故宮先秦紋飾資料庫2003年2月22日12物種分類管理2003年2月22日13人名權威資料庫2003年2月22日14數位典藏資料庫技術開發數位典藏資料庫製作工具DigitalArchiveDatabaseTool(DADT)多表格資料庫應用系統速成工具資料綱要導向(schemaoriented)Web介面驅動(Webinterfacedriven)資料庫應用系統常用功能之支援與整合中介軟體(middleware)–與不同RDBMS接合強健、良好效能、適用於繁複的需求2003年2月22日15DADT的運作依表格間的親子(parent-child)關係與參考(reference)關係,自主表格建構表格網(tablenet),進而運作表格網分類–表格階層(tablehierarchy)–參考樹(referencetree)–完全表格網(fulltablenet)四種網頁:管理網頁、查詢網頁、條列網頁與報表網頁初步的XML支援:XML文件匯入/出2003年2月22日16DADT支援數位典藏計畫2o台灣本土植物數位典藏o故宮器物數位典藏器物數位典藏管理、查詢子系統主題/紋飾權威檔管理子系統o國史館典藏國家檔案與總統文物數位化國民政府檔案管理系統蔣中正總統文物檔案、蔣中正總統文物照片o人名權威檔後設資料管理系統2003年2月22日17DADT支援數位典藏計畫1o語言典藏台灣南島語語料庫數位典藏o近代外交經濟重要檔案數位典藏o內閣大庫檔案著錄格式、權威檔建立o臺灣文獻館臺灣省行政長官公署檔案數位化o金石拓片與其他媒材古文書數位典藏佛像造像管理系統、查詢系統o臺灣原住民數位典藏2003年2月22日18多媒體處理技術-發展多媒體內涵查詢技術輸出與標準MPEG-2格式相容對MPEG-2視訊作抵抗傳輸錯誤的處理即使影片遭受傳輸錯誤破壞,仍保有不錯的觀看品質視訊錯誤容忍回復技術2003年2月22日19移動向量遺失的情形回復主要移動向量後的結果視訊受到破壞時,一般的方法是假設畫面沒有太大的移動,直接用前一個畫面區塊來取代,但是對畫面移動大時,效果就會不好。事先把視訊的主要移動向量資訊隱藏在畫面中,當視訊遭受破壞時,用來取代原移動向量,對於畫面移動大時,效果還不錯。2003年2月22日20多媒體處理技術-影像型虛擬實境技術建立一個逼真的三維虛擬展示環境。一個良好的三維虛擬展示環境需要:–真實性(PhotoRealistic)–互動性(Interactivity)–網路化(Internet-enabled)影像型虛擬實境技術(Image-basedVRTech.)–環物影片(ObjectMovie)–環場影像(Panorama)2003年2月22日21將影像型技術(Image-basedTech.)作整合,以期提供上述優良之三維虛擬展示環境。目前的成果:–環場影像與環物影片之整合(AugmentedPanoramawithObjectMovie)–增添式環場中平面物體視點之自然轉移(AugmentedPanoramawithview-transitionofplanarobject)2003年2月22日22環場影像與環物影片之整合將環物影片加入到環場影像中,並輔以陰影效果,使得虛擬效果更加逼真。環物影片環場影像2003年2月22日23增添式環場中平面物體視點之自然轉移利用平物物體於不同視點拍攝時,具有Homography的幾何關係之特性,可以將該物體作視點的自然轉移,讓觀賞者具有更直覺化的觀灠效果。+環場中平面物體之特殊幾何關係平面物體視點之自然轉移2003年2月22日24目前技術支援之成果國立歷史博物館–馬諦斯畫展線上虛擬展示台大地質所–礦物展示其它線上展示–中央研究院資訊科學研究所2003年2月22日25語言處理技術年度工作項目與成果–語言分析技術–文件影像資訊擷取技術–跨語言資訊檢索技術–語音檢索技術2003年2月22日26語言分析技術研究新的詞類自動標記方法及詞類標記編修工具開發–完成雛型辨識系統並進行模型效能評估及系統改進中–研究並提出最有效率之標記方法可以大量節省人工校對時間。設計具有未知詞辨識功能的分詞系統–完成具有未知詞辨識功能的分詞雛形系統–目前結合未知詞辨識功能的分詞系統實驗結果,正確率可達96%建立中文詞網系統並研究中文詞與英文詞網自動對應之方法–研究中文詞與英文詞網自動對應,設計歧義詞對應及排歧軟體工具–以ABC辭典中的名詞為例,以字形對應可達97.76%的可對應比例,以詞義對應則可達97.78%的可對應比例設計中文語料庫管理系統–語料蒐集、斷詞及標記詞類、新詞擷取收集、人工檢驗修改工具等–提供語料檢索分類統計資訊2003年2月22日27文件影像資訊擷取技術古籍文件辨識與檢索系統針對古代書籍的工整手寫文字所研發出的辨識與檢索系統,用圖形比對(GraphMatching)技術,能由筆劃的特徵與結構資訊辨識出手寫文字。影視字幕辨識與資訊擷取系統可檢索視訊畫面中的文字並且播放該段影片的內容,活潑地呈現檢索結果,將更有效地滿足使用者的需求。此系統結合了圖文分離、文件分析、文字辨識及資料庫等多種技術,乃是一具體而微的應用系統。ADMS影像文件辨識、檢索及管理系統針對現代各式的印刷文件,如報紙、傳真文件、公文等等,加以辨識並存檔,不論繁、簡中文與英文,以及各種不同種類的文件均可準確地辨識出來,並對紙本文件作一有效之管理與應用,並提供電子郵件、文字檔編輯、個人書籤等便利使用的功能(此系統架構現在已使用於中研院資訊所的公文存檔、公告與管理。)2003年2月22日28跨語搜尋與術語自動翻譯技術可自動翻譯辭典未收錄的查詢關鍵詞,提供檢索以外語表達的網頁及圖像資訊,如”中央研究院”自動翻譯“AcademiaSinica”,”世貿大樓爆炸”翻譯為“TwinTowersAttack”等。利用網路豐富的多語言網頁作為翻譯分析的動態語料(LiveCorpus),決定最佳翻譯。透過網路探勘,可翻譯的術語數量龐大,且不侷限中英文。可以有效克服雙語辭典無法蒐錄人名,公司名等專名的困難。本系統可作為數位典藏系統發展跨語檢索時的關鍵詞翻譯引擎。網址:語音資訊檢索技術–『搜影音』影音新聞檢索系統(SoVideo)約200小時公視影音新聞,使用之關鍵技術包括自動新聞情境切割、語音辨識及資訊檢索等。可輸入關鍵詞來查詢,如陳水扁、公益彩券、臍帶血等。網址:即時網頁浮水印開發:即時線上加入浮水印機制cache機制軟體包裹技術與數位內容產權管理系統整合:windows平台上之軟體包裹技術研究及數位內容產權管理系統整合智慧財產權現有法律與技術相關之研究數位內容簽章系統電子簽章與電子簽章法之相關研究智慧財產權與隱私權管理機制之核心技術開發2003年2月22日31技術支援單位中研院植物所中研院史語所中研院近史所檔案館特有生物研究保育中心國立台灣美術館資料中心2003年2月22日32語言座標-參考資源建置與服務•目的:建置完整的語言參考資料,做為語言座標之基礎架構。語言座標之建立,將分別以空間分布、知識內容、語言分類、及時間軸為基礎,並進行以上座標架構之整合與語言典藏標準之訂立;把座標落實到各個數位典藏中。典藏與時空語言座標關係圖Where空間歷史地圖語言的時代變遷語言的地方差異文獻所使用的語言When時間數位典藏HowandWhat2003年2月22日33NO工作項目完成內容執行狀況1提供自動斷詞系統,訓練並協助各單位使用訓練並協助各單位使用自動斷詞系統持續執行中2提供共用基本詞彙庫架構及資料庫,訓練並協助各計畫使用訓練並協助各計畫使用共用基本詞彙庫架構及資料庫持續執行中3維護各語言斷代、領域詞彙庫,並提供各典藏計畫及檢索系統使用維護各語言斷代、領域詞彙庫,並提供各典藏計畫及檢索系統使用持續執行中4配合資訊技術組完成之缺字平台,協助解決各典藏之缺字問題完成缺字平台,協助解決各典藏之缺字問題持續執行中5完成語言識別標示系統完成語言識別標示系統完成6配合後設資料小組,訓練並協助各典藏加上語言識別資料配合後設資料小組,訓練並協助各典藏加上語言識別資料持續執行中7配合後設資料小組繼續擴充雙語後設資料內容配合後設資料小組繼續擴充雙語後設資料內容持續執行中8提供以詞網(WordNet)概念集範圍之中、英詞彙對譯提供以詞網(WordNet)概念集範圍之中、英詞彙對譯持續執行中九十一年執行工作(九十一年五月至九十二年一月)2003年2月22日34NO工作項目完成內容執行狀況9測試並修正語料庫之識別性metadata系統測試並修正語料庫之識別性metadata系統完成10測試並修正詞彙庫之識別性metadata系統測試並修正詞彙庫之識別性metadata系統完成11建立語料庫之語族層級架構圖建立語料庫之語族層級架構圖完成12建立語料庫之語用層級架構圖建立語料庫之語用層級架構圖完成13建立語料庫之歷史層級架構圖建立語料庫之歷史層級架構圖完成14建立語料庫之地理層級架構圖建立語料庫之地理層級架構圖完成15分析識別性metadata在各語料庫間之共通及個別性分析識別性metadata在各語料庫間之共通及個別性開始執行16中-英詞義對應及整理中-英詞義對應及整理完成17對應關係分析–詞義對應的進一步分析對應關係分析–詞義對應的進一步分析持續執行中18中-英詞義對應資料庫–前期工作統整中-英詞義對應資料庫–前期工作統整開始執行2003年2月22日35工作營/研習營21/22「語言資源建構與標記」工作營:針對「數位典藏」、「語言典藏」、「漢字缺字的解決方案」、「CNS14366中文分詞標準與語料庫建構工具」、「開放語言典藏組織(OLAC)與語言典藏
本文标题:技术研发分项计画
链接地址:https://www.777doc.com/doc-743423 .html