您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 中文名称规范数据库的建置与发展概况
1中文名称规范数据库的建置与发展概况谭文力卢百祥冼丽环香港岭南大学图书馆第四次中文文献资料共建共享合作会议2004年11月摘要本论文概述了中国大陆、台湾、香港以及日本等地中文名称规范工作的最新动态。依据网上资源和直接联系方式,我们综合介绍了上述地区著名图书馆及学术机构开发的各式各样的名称规范数据库,并提供了有关各数据库的范围、规模和使用率等统计数据,还列举了从各数据库收集的规范记录示例。本文旨在增进人们对上述地区所开展的中文名称规范工作现况的了解,并探索未来全球性中文名称规范资源共建共享的路向。关键词:中文名称规范、中文名称权威控制、香港中文名称规范数据库、HKCAN冼丽环:香港岭南大学荣誉研究员图书馆前馆长电邮:lhhu@Ln.edu.hk谭文力:香港岭南大学图书馆副馆长电邮:owent@Ln.edu.hk卢百祥:香港岭南大学图书馆编目部主任电邮:patrickl@Ln.edu.hk2导言本文分为四部分。第一和第二部分除了介绍中国国家图书馆创建的中文规范数据库外,还简单介绍了中国高等教育文献保障系统规范工作的最新发展,以及台湾中央图书馆和台湾大学图书馆联合建立的“中文名称权威资料库”。第三部分论述日本国立国会图书馆和TRC图书馆流通中心分别开展的规范工作及其最新动态,以及日本国立情报学研究所管理的NACSIS-CAT,和早稻田大学图书馆当前的名称规范工作。第四部分首先集中介绍在1999年由香港数所高校图书馆共同建立的“香港中文名称规范数据库(HKCAN)”,然后简单介绍一下香港科技大学图书馆开发的XMLNameAccessControlRepository。3一.中国大陆1.中国国家图书馆1(a)规范工作标准化研究制订及出版了《规范数据款目规则》、《中国机读规范格式》及《中文图书名称规范数据款目著录规则》。(b)数据库的概况1995年成立“名称规范组”,编制为10人左右,主要从事名称规范的理论研究与规范数据的生产工作;最初几年,通过整理国家图书馆过去积累的名称标目卡片,同时广泛收集各种中文图书规范数据源,并借鉴各领域权威的工具书进行核对补充,直至到2000年底,累计制作名称规范数据22万条。2000年以后,数据库一直保持每年增加3-4万条记录,并不断维护和完善已经建立的数据,修订和删改量也维持在每年3-4万种的水平。該館规范数庫包括个人名称、团体名称与题名名称三个部分。当中包括两个主要的数据库:“中国古代著者规范数据库”及“现代著者规范数据库”。中国古代著者规范数据库-收录了中国自古代至1911年间作品的著者名称(个人和团体著者)共3万种。每条记录包括著者姓名、生卒日期、朝代、出生地点、风格与化名、家庭关系、科举名次、官职、主要活动与代表作品等。现代著者规范数据库-收录1912年以后著述较多的著者和团体著者的规范记录共49万种。记录内容包括:著者姓名(真名、笔名)、生卒日期、民族、作品标题、著者性别、出生地点和职务等。1数据取自〈中国国家图书馆的规范控制:历史与最新发展〉,曹宁于2003年11月7日在香港举行的InternationalSeminaronCooperativeCataloguing&AuthorityControl会议上宣读。4(c)最新发展从2003年4月开始,随着系统软件(Aleph500)的切换,名称规范数据的制作工作,完全融入编目流程内。国图的规范记录能在该馆的网页上检索。以下以“董桥”为例。2.CALIS规范数据库(a)CALIS现况中国高等教育文献保障系统(ChinaAcademicLibrary&InformationSystem,简称CALIS),是一个由国家经费支持的中国高校图书馆联盟,是中国高等教育“211工程”总体规划中的两个公共服务体系之一。其目的是建设以中国高等教育数字图书馆为核心的教育文献联合保障体系,实现信息资源共建、共知、共享,为中国的高等教育服务。CALIS的管理中心设于北京大学,截止到2004年3月成员馆总数已经达到435家。5自1998年以来,CALIS组织高校图书馆,大量引进国外重要学术文献数据库,同时结合各中心图书馆所在地区和学校的投资,在以全国文理文献信息中心(北京大学)、全国工程文献信息中心(清华大学)为首的各中心点上建立了较为全面的学术文献资源收藏,重点学科的重要学术资源的国内收藏率已经达到90%左右;还组织各重点院校建立了中外文书刊联合目录、高校现刊目次、高校学位论文(文摘)、学术会议论文(文摘)、重点学科网络资源导航与特色文献等一大批数据库,全面揭示了各重点院校的收藏。同时自行开发了联机合作编目系统、联机公共检索(OPAC)系统、馆际互借与文献传递系统、CALIS统一检索系统等,形成了较为完整的CALIS文献信息资源服务网络。(b)规范工作CALIS联合目录的规范工作目前尚处于起步的阶段,正式的规范数据库还在建设中。CALIS联合目录规范数据库的特点:1)中、外文规范记录统一采用CNMARC规范格式,同时建立转换成其它格式的机制,用户可以根据自身需要选择转出格式,方便共享。2)为适应CALIS联合目录多语种、多文献类型的特点,CALIS联合目录规范采取将同一实体不同语种的规范标目,用并列标目的形式记录在同一条规范记录中的方式,这样既避免了重复劳动、也有利于更新维护及建立受控检索系统。CALIS联合目录的规范数据库建立将分为两个阶段:第一阶段:从CALIS联合目录数据库现有的书目记录中,把相关标目抽取出来,经部分成员馆整理后生成初始化的规范记录,这些单纯由系统生成的初始化记录或未经人工干预的记录一般称为“准规范记录”。对于某些重要标目,如高尔基(Горький,Максим)、歌德(Goethe,JohannWolfgangvon)等比较著名或著作较多的责任者编制详细记录,通过批处理的方式装入,覆盖初始化记录,并实现规范记录与相关书目记录的连接。第二阶段:联机建立,下载规范记录,实现联机规范控制。6CALIS联合目录共有150万条相关标目需要整理,整理工作主要由部分成员馆相关人员负责,CALIS软件组提供标目清单,目前这一工作已基本完成。规范数据库所用的软件是由CALIS软件组自行开发的,记录以CNMARC格式储存。CALIS规范记录示例记录控制号001CAL##n2003000001#记录版本005yyyymmddhhnnnss.tCALIS系统控制号099$aCAL##n2003000001#一般处理数据100$ayyyymmmddamul|50######||0实体语言101$achi实体国籍102$aCN是否用于主题106$al个人名称代码120$aaa2000$7jt0yjt0y$a张爱玲,$f1920-19952000$7ft0yft0y$a张爱玲,$f1920-19952000$7ec0yec0y$aZhangAiling,$fl920-19952000$7da0yda0y$a张爱玲,$f1920-1995标目:个人2001$7ba0yba0y$aZhang,$bAiling$g(张爱玲),$fl920-19954000$a梁京,$f1920-19954001$aChang,$bEileen,$f1920-1995见参照:个人4001$aChang,$bAiling,$f1920-1995记录来源8010$aCN$bLHML$c20030425810$a半生缘/张爱玲着.一广州:花城出版社,1997810$aBest-in-books/GardenCity,N.Y.:N.Doubleday,c1955参考源810$aLC:n83124797编目员附注830$a著名女作家,笔名梁京。生于上海,原名张瑛瑛,1930年改名张爱玲。清朝重臣李鸿章之曾外孙女。着有《半生缘》、《红玫瑰与白玫瑰》、《倾城之恋》等。电子定位与检索8564$u张爱玲简介7二.台湾1990年,台湾中央图书馆和台湾大学图书馆联合成立了“中文名称权威资料库工作组”,专门开展台湾的中文名称规范工作。(a)最初设立早于1990年,两馆曾达成协议,共同建立规范记录,后该计划因故暂告中止。由于各界需求殷切,遂于1998年重新开展合作计划,继续共同进行汇整工作。为方便此项计划之进行,将几个部分的工作分别展开,分别是:建立“中文权威参考资料库”规范文件整理原则及制订规范记录汇整程序。在汇整原则方面,成立了“中文权威参考资料库建置小组”,并于1998年年底召开第一次会议,探讨有关资料汇整的议题。台湾中央图书馆馆藏目录系统已建之规范记录,包括有人名规范记录18条、团体规范记录1万条,建档格式为中国机读规范记录格式(CMARC);台大图书馆已建中文人名规范记录近3万条,建档格式则采用美国机读规范记录格式(MARC21)。这个规范档后被称为“中文名称权威资料库”(ChineseNameAuthorityDatabase,简称CNAD)。22“本馆与台大图书馆共同合作建立中文权威参考资料库"。台湾中央图书馆馆讯,总79期。8CNAD主页(b)记录格式为确保数据的一致性及检索的准确,每位著者只建一个条目。规范记录采用台湾创建的CMARC格式,并须遵守由“中文名称权威资料库工作组”制定的标准及指引。(c)现有数据库的规模目前该数据库的合并工作仍在继续,截至2003年5月已整并完成26万7千余条记录3,其中主要为个人名称,另外还有数量不多的团体名称。(d)系统软件的功能1.数据库软件的初步设置完成于2001年5月,软件具备的功能有检索、记录维护、下载等,并提供不同的内码(Big5或CCCII)和MARC格式(MARC21或CMARC),供用户在显示记录和下载时选择。全国图书信息网络系统(NationalBibliographicInformationNetwork,简称NBINet)的成员馆于2002年起,可在远程登录后使用该数据库,进行检索及下载记3“中文名称权威数据库使用手册编制完成”。台湾中央图书馆馆讯,总号第92期。9录。2.非登记用户亦可以从该数据库的网页查询及下载记录。CNAD规范记录示例(e)使用手册–2002年4月,出版《中文名称权威资料库使用手册》和《中文名称权威资料库维护手册》的电子版,供参与合作的图书馆使用。有关MARC21,CNMARC和CMARC规范格式的对比,见附录。10三.日本在日本,较具规模地建立规范数据的图书馆和研究机构有以下四个:z日本国立国会图书馆zTRC图书馆流通中心z日本国立情报学研究所z早稻田大学图书馆1.日本国立国会图书馆位于东京的日本国立国会图书馆于1948年成立,并于1970年开始自动化。该馆的规范记录是用UNIMARC格式著录的。截至2004年7月,该馆共有超过70万笔记录,当中包括个人名称及机构名称。该馆还按需要,在UNIMARC规范记录格式上增加一些栏号(如日期注的栏号及日本汉字注的栏号)。该馆于2001年1月以电脑光盘形式发行近60万笔规范记录,名为“国立国会図书馆著者名典拠録”。机读格式为JAPAN/MARC,当中不但包括日本人的名称,还有中国人、韩国人、外国人的名称及机构名称规范记录。11日本国立国会图书馆规范记录举例122.TRC图书馆流通中心(TRC図书馆流通センター株式会社)TRC图书馆流通中心乃一家商业公司,于1979年成立,服务对象主要是公共图书馆、专上学院及学校图书馆。它于1985年首次刊行规范记录数据库,该数据库称为“TRCMARC人名典拠録”。TRC规范记录举例133.日本情报学研究所(NationalInstituteofInformatics,簡稱NII)该所开发了名为NACSIS-CAT的在线编目系统,其数据广泛为日本各学术图书馆所使用。其宗旨是通过参与大学图书馆的共同编目,编制全国性的联合书刊目录。成员可透过互联网的WebCAT服务访问NACSIS-CAT。a)规范数据的独特之处
本文标题:中文名称规范数据库的建置与发展概况
链接地址:https://www.777doc.com/doc-526705 .html