您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 美国数字图书馆发展现况
美国数字图书馆发展现况以及元数据方面的问题曾蕾2004年12月复旦大学网络信息建设方面的几大工程•数字图书馆工程–DLI-1(1994-1998数字图书馆第一期工程)•2400多万美元、六所大学及其工业合作伙伴,面向技术、以试验为目的–DLI-2(1999--数字图书馆第二期工程)•投资翻倍,面向用户、全方位发展、以实用为目的缩小技术研究注意力–国家科学教育数字图书馆(NSDL)•电子政府工程•文本检索会议(TREC)技术technologies内容contents用户群体communities服务services十年进展状况从数字图书馆研究空间看,技术和内容方面的发展十年中占主导地位。ImageadoptedfromGaryMarchionini’spresentation,03/2004UBC技术technologies内容contents用户群体communities服务services•文化遗产(如美国国家、州、县、区、市的‘记忆(memories)’数字图书馆和数字馆藏)•大中小学教育数字图书馆和大型投放库(repository)•科技领域特殊数据的数字图书馆•从存储到检索,可视化,用户操纵的多界面•使用记录和用户档案的自动生成和管理•产权保护的技术方法•大规模集成和转换等面向教学残疾人服务合作空间等高科技用户政府部门数字图书馆研究群体教育群体十年进展状况美国数字图书馆主要项目•针对美国本土文化财富的项目–如美国国家、州、县、区、市的‘记忆(memories)’数字图书馆和数字馆藏–特殊媒体历史材料数字图书馆项目•针对教育的数字图书馆项目–大中小学教育数字图书馆–大型投放库(repository)–围绕大学教学建立的服务设施和工具•科技领域特殊数据的数字图书馆美国记忆(国家数字图书馆历史馆藏)--100多个数字馆藏参与,联合目录查找AmericanMemory美国俄亥俄州历史数字馆藏“俄亥俄记忆”OhioMemory美国俄亥俄州沃兴屯市历史数字馆藏WorthingtonMemory哈佛福大学法学院图书馆的《纽伦堡庭审项目》数字文献馆藏TheNurembergTrialscollection://ciir.cs.umass.edu/~trath/prj/hw_retr/demo_intro.html(手稿检索数字图书馆项目)历史之声HistoricalVoices面向教育的数字图书馆项目•独立的数字图书馆–例:Perseus人文科学数字图书馆–硕士博士学位论文数字图书馆•综合了100多个项目成果的数字图书馆和元数据投放库–国家科学数字图书馆(NSDL)•在已建数字图书馆基础上建成的数字化学习环境–加州大学圣芭芭拉分校亚历山大数字地球模型系统(ADEPT)数字化的学习环境(DLE)Perseus人文科学数字图书馆9millionpages/monthADigitalLibraryfortheHumanities浏览经典电子馆藏包括:经典·古代写在纸莎草纸上的文稿·文艺复新·伦敦·加州·上中西部·莎士比亚·波义耳作品·Tufts历史语言统计地图年代同样数据,多种看的方法,多种探索开发的方向经典文献的地域分布图波义耳作品的时间分布图(1)硕士博士学位论文图书馆•从计算机科学开始,组建推广到其它学科和国家•学生学会‘出版’自己的成果•上交时必须填写元数据记录–(现在很多学术会议录也要求这样)•作者和读者/用人者的更好接触•由用户团体参与、不断扩充资源的数字图书馆,成功的可持续模式NationalSMETEDigitalLibraryScienceMathematicsEngineeringEducationTechnology科学、数学、工程、技术教育国家科学数字图书馆NSDL科学教育数字图书馆(NSDL)的研究空间•收藏collections•服务设施services•特殊问题研究Targetedresearch•专业化的路径Pathways•一体化核心CoreIntegration–这是与各个国家(包括美国)DL项目不同之处,是综合的关键。至2004年6月:共165项目,建起的数字馆藏达118综合是当前的关键步骤•单个数字图书馆馆藏或技术服务可以做到小而全,不成问题,也不影响太大。•问题在于:–怎样把若干个分散的资源综合起来,有机的形成一个大的数字图书馆–怎样能让资源和数据(包括元数据)能被重复使用–怎样做到在综合起来的数字图书馆中原来的语义依然清楚,不失去意义地理学科:数学:NSDL一体化核心项目元数据库CollectionCollectionCollectionSearch&DiscoveryAdvancedDiscoveryuserprofilesAccessManagementUsers门户网站Portals数字馆藏CollectionsNSDL信息结构nsdl查寻:元数据记录:将数字图书馆用于数字环境下的教学•实例:加州大学圣芭芭拉分校亚历山大数字地球模型系统(ADEPT--AlexandriaDigitalEarthPrototype))数字化的学习环境DigitalLearningEnvironment(DLE)ADEPT项目的数字馆藏:1.学习物件(LO)馆藏,2000多件,全部做了详细的元数据记录(属于著名的亚历山大数字图书馆)2.科学概念知识库(KB),现有1200余个概念,每个根据概念的特征和关系理论模型作入知识库3.教学材料馆藏,根据每堂课要讲的概念准备的讲义1.学习物件馆藏Collectionsoflearningobjects(LO),over2000items2.科学概念知识库Knowledgebases(KB)containingcollectionsofSSMofrelevantscientificconcepts;(about1200concepts)SSMforScientificConcepts(1)SSMforScientificConcepts(2)SSMforScientificConcepts(3)3.教学材料馆藏Collectionsofinstructionalmaterialsorganizedbyconcepts•左边是本堂课的总的大纲(结构)•右边是课程内容•ADL本身的通用像标显示符将概念连接到概念属性显示窗。其它显示符连接到物件窗。将这三种数字馆藏应用到学习环境中所用和不断生产的馆藏•科学概念知识库(KBs)•结构化的教学材料馆藏•学习物件(LO)馆藏,做有详细的ADN元数据记录+概念标引为此建造的服务设施•概念–网上概念输入和编辑工具–图示和文字式显示工具•教学材料–网上讲义编制工具–“概念形象化”图示工具“Conceptualization”•学习物件–元数据输入工具IntroductoryPhysicalGeography(F2002,S2003)数字化学习环境的课堂(1)知识窗Knowledgewindow:显示概念和相关关系课程讲义窗Lecturewindow:讲义、实验、或自习材料的显示学习物件窗Collectionwindow:显示数字图书馆的具体物件(图像、地图、文字、动画、录像等)数字化学习环境的课堂(2)知识窗Knowledgewindow讲义窗Lecturewindow学习物件窗Collectionwindow课堂讲义的模式对科学现象的辨识:•主要题目,分题目,子题目等•观察过程•实例对科学现象的表达:•事实•概念•理论对科学现象的理解:•提问–回答•问题–解决方法•假设–评价•陈述–衍生•预言–测试•看法对科学现象的辨识—表达—理解课程讲义窗Lecturewindow物件(馆藏)窗:学习物件CollectionWindow:LearningObjects知识窗Knowledgewindow–根据概念来看所学内容EvolutionoftheMen元数据方面的问题元数据传统的图书馆编目•元数据标准太多,没有哪个能完全满足特定DL需要–投放库(repository)没有整套标准–各家自有一套,照搬的或有修改的–目前按简单的都柏林核心元素集来整合•失去很多细节•由于DC不反映所用schemes,集中起来后的元数据失去上下文–已有些理论上很吸引人的模型,但难以在实践中应用推广(如METS,RDF)元数据方面的问题(1)元数据方面的问题(2)•元数据库是建立在自愿基础上的–不能强行推行任何标准–存在各种质量问题:•完整性、准确性、一致性问题•重复的数据–给用户查找带来麻烦–影响以后用户加注过程•缺乏各种控制词汇(schemes)和标准•如:描述时间的标准格式,描述语言、名称、事物、用户对象、物件类型等的统一的控制词汇–有的根本不采用标准–有的采用了自己的控制词汇–在合并后,由于没有办法知道采用的什么词汇,失去上下文元数据方面的问题(3)元数据方面的问题(4)•以什么为单位?•如:每个图片一条记录,还是2000个图片归为一组做一条记录(想想NASA卫星每天发回的成百上千的图像)•元数据的自动生成–减少人工投入,增加产量•现存的资源比DL人功能描述的多得多•能否在capture时就能自动抓取的数据–自动生产的元数据的质量控制元数据措施(1)(讨论中)对元数据的管理单位从记录改变成元素对每个元素增加来源和日期修饰项重新合并元数据不同来源的记录有不同的详尽程度,合并后可以生成内容更加丰富的记录RecordAdc.titledc.authorRecombinedrecord(richer)元数据措施(2)(讨论中)•为下一个浪潮--加注做好准备–在元数据后面加注:•正式的评论•非正式的个人经验等马上制定一套控制词汇,主要是以下方面:NSDL的重点顺序难度•Educationallevel1RE•Audience3H•Mediator3+M•Pedagogy4H•Resourcetype2M•Interactivitylevel5M+元数据措施(3)(讨论中)元数据质量管理•单条数据•单个数字图书馆•联合数据库–合并后的原数据库•Completeness(完整性)•Correctness(正确性)•Consistency(一致性)•Duplication(重复率)互操作方面的问题互操作方面的问题(1)•硬件/网络•软件–包括中间软件、JAVA、开放标准、应用程序界面,插件、个人化的用户界面•信息–元数据、元数据的对照表、综合、翻译等–打破语词、特征的局限,走向概念•组织–合作协议–劳动力在哪?•委员会都是建立在自愿基础上的,除了围绕每年一次的年会,有些都没有动静。–有关上述各条的标准(硬件、网络、软件、信息)–打造品牌(特别是非盈利的DLs)互操作方面的问题(2)下十年面临的主要挑战•真正成为信息寻求者可求助的力量•杂交、混合•可持续性的持久问题•新模式–学术交流的地方–工作实践的地方•……
本文标题:美国数字图书馆发展现况
链接地址:https://www.777doc.com/doc-546914 .html