您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 信息组织的复习资料(重点)
1第一章导言1、信息组织:亦称为信息资源组织,是根据信息检索的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等的分析、选择、处理、序化,并以适当的方式加以提供的活动。2、信息组织的目的:是根据使用需要建立起信息资源收藏系统和检索工具,以便信息资源开发和利用。作为一种为了检索利用的需要对信息资源进行有序化组织的活动,它是与信息检索活动密切联系的。3、信息组织与信息检索的关系(P3)(1)信息组织是信息检索的基础和前提。(2)信息检索是信息组织的出发点和归宿。总之,信息组织与信息检索是密切联系,相辅相成的两个环节。要使信息组织取得较好的效果,必须充分了解系统的检索需要,根据信息资源的特点和用户的使用要求加以实施。4、按照检索工具的对象和特点,可以分为以下类型:(1)文献目录:是以文献集合中的文献单元为对象,对其进行记录、报道与揭示的工具,包括文献收藏和数目。前者以一个或多个文献单位收藏的文献为对象加以描述和揭示;后者则以某一领域、地域或者时限内出版的文献为对象进行组织,为用户提供较为全面的文献信息。(2)索引:是以文献集合中的文献单元或者文献中的信息单元为揭示对象的检索工具,包括图书索引、期刊索引、报纸索引、专利索引、标准索引、档案索引、会议文献索引、词语索引、书后索引等。(3)机读数据库:是由文献资源为对象的机读记录的有序集合。这是一种依托现代计算机技术,以机读形势建立的索引系统。(4)网络搜索引擎:这是一种以网络信息资源为研究对象的检索系统,实际上是数据库的一种特殊形式。5、按照依据的标识特征,检索工具可以分为两种:一类以信息资源的外部特征为检索依据,提供从资源形势出发进行检索的途径。常见的这类标识包括:责任者名、题名、机构名、出版地、出版社、标准书号、专利号、档案号、文献登录号等。另一类则以表达信息主题内容标识为依据,提供从内容角度进行检索的途径。主要有分类法和主题法两种。分类法以表达信息资源内容的标记符号为标识,按照主题之间的关系进行系统组织;主题法直接以表达文献内容的词语为标识,依据主题字顺等方式检索途径。按照系统中标识组配的特点,检索系统可以分为先组式和后组式两种。信息组织的常见类型(P7)6、对信息资源处理的基本做法是:(1)对信息资源的特征进行描述。(2)对信息资源的内容进行浓缩。2(3)提供检索点。7、检索语言:是一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,国内亦称为情报检索语言。8、信息组织活动包括两个基本的方面:(1)信息组织的操作。指根据信息资源的内容和特征,对信息资源进行描述、标引、并将其组织进相应系统的过程。(2)信息资源组织规范。这是根据信息组织的需要,按照信息资源的特点预先确定的规则和方法系统,是进行信息组织操作的依据。第二章信息组织原理1、信息组织的主要目的是为了有效地检索和利用。一般认为下述因素是一个信息组织系统必须考虑的重要因素:(1)检全率(2)检准率(3)检索速度和系统的及时性(4)系统的易用性(5)检索的成本效益2、检全率亦称查全率、命中率,指系统实施检索时检出的与某一检索提问相关的信息资源数与检索系统中与该提问相关的实有信息资源总数之比。可以表示为:检全率=检出相关信息资源量/系统相关信息资源总量*100%表示系统检出相关信息资源的能力。3、检准率亦称查准率、相关率,指系统实施检索时检出的与某一检索提问相关的信息资源数与检出的信息资源总数之比。可以表示为:检准率=检出相关信息资源量/检出信息资源总量*100%表示检索系统排除与检索提问无关信息资源的能力。检索系统的检全率与检准率之间是一种互逆关系。因为检全率高,必然会检出一些内容关联程度较低的信息资源,从而影响系统的检准率;反之提高检准率,则要求排除与检索提问关联程度较低的信息资源,必然会反过来影响系统的检全率。4、检索速度:指用户实施检索时获得检索结果花费的时间。5、系统的及时性:检索工具能否在较短时间内将信息资源纳入系统,以较快速度提供使用。6、系统的易用性:系统是否便于进行描述和标引操作,是否需要掌握复杂的专门技能才能使用,在处理过程中是否可以得到各种减少处理差错的提示和帮助等。7、描述控制:描述记录一般概要记录下一资源各种基本特征的数据,可以以浓缩的方式集中反映资源的特征和内容。(1)描述项目的控制:根据资源特点选择具有组织和揭示价值的资源特征作为描述的项目。描述项目应该充分反映信息资源的基本特征和数据。(2)描述文字的控制:规定描述信息资源时所采用的文字,应当准确、精炼、统一、规范。(3)描述级别的控制:规定对信息资源进行描述的详略程度。应根据不同的使用对象和需求、信息资源的特点、设备条件加以确定。3(4)描述格式的控制:包括各种描述项目的次序、描述的标识、描述项目的表达形式等。对此做统一规定的目的是方便不同类型信息系统之间的交流。8、词汇控制:词汇控制是根据信息资源标引和检索的需要,对自然语言中的词汇进行选择、规范并揭示其相关性的过程。9、词汇控制包括下述内容:同义控制:即对字面形势不同,含义相同的词进行控制,使一个概念只能用一个语词表达:目的是克服一义多词现象,将同一内容、特征的资源集中在相同的标识下。词义控制:即对同形异义词和语意含糊的词进行控制,使得词义明确,一个词语之表示一个概念,客服克服一词多义现象。常用措施:加限义词、增设含义注释和范围性注释等方法。词间关系控制:指揭示词汇之间的各种联系,使其还曾为一个语义相关的系统。10、句法控制:根据信息资源标引和检索的需要,通过一定的组词造句的规则,对检索语词的组合方式作出规定。11、句法控制的内容:1、引用次序:指复合主题标引和检索时,各个主题因素的组合次序2、辅助符号:是检索语言解释主题概念之间关系意义,进行检索操作的标识形式3、句式转换:简单地说,就是转换语词的排列顺序。12、辅助符号是检索系统进行句法控制的重要句法手段,它根据系统的特点和使用需要设置,可分别用于先组式检索系统和后组式检索系统。13、常见的组配符号有以下几种:(1)关系符号——用于揭示语词组配中形成的关系类型的符号,常用于先组式检索系统。(2)逻辑组配符号——使用逻辑符号对组配关系实施控制,可以进行各种演算,实施精确查找,常用于后组式检索系统。(3)联系符号——用于揭示同一文献主题之间联系强度的专用符号,目的是防止主题词之间出现错误的组配关系,常用于后组式检索系统。(4)职能符号——用以表明主题标识在组配中的句法职能的辅助符号,作用是明确主题标识的句法含义,防止出现错误的组配关系。14、句式转换的形式通常有三种:(1)轮排转换。即依次将检索语句中每一个有检索意义的语词轮流在排检位置上出现,并对句子中其他语词在保持原有相对位置的情况下随着移动。(2)链式转换。即通过逐次拆卸链环的方式,依次将检索检索语句中每一个有检索价值的语词作为检索语句的入口。(3)分析转换。即每次抽取少量主题词组配标题,使所有检索价值的词都可以成为检索入口。15、概念之间的关系:(1)同一关系:具有相同外延的概念之间的关系。(2)包含关系:一个概念在另一个概念外延之中,并且是另一个概念的组成部分。(3)交叉关系:部分外延重合的概念之间的关系。4(4)不相容关系:不存在共有外延的概念之间的关系。(5)矛盾关系:外延之和等于上位概念的两个不相容概念之间的关系。(6)反对关系:外延之和小于属概念的两个相互对立概念之间的关系。(7)并列关系:一个属概念下几个不存在共有外延的并列种概念之间的关系。16、信息资源组织的特点:信息资源组织除应采用逻辑的方法,以知识分类为基础外,同时还必须根据信息资源的特点和检索需求进行控制,一般应考虑以下各方面因素:(1)文献保证原则:文献保证亦称文献根据,指信息资源组织应根据信息资源类型、数量等因素进行相应控制。(2)用户保证原则:所谓用户保证,即是指根据用户需要进行描述控制和词汇控制。(3)与设备条件相适应:信息组织中的规范控制是在一定的设备条件下使用的,只有与设备条件的特点相一致,才能取得较好的实际效果。第三章信息描述1、信息描述:信息描述,亦称信息资源描述,是指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。在传统文献检索系统的编制中,信息描述又称为文献著录或书目著录,是信息资源组织的重要内容。信息描述的结果,是获得描述记录,亦即元数据,用作信息资源的代替物组织检索工具。2、元数据:所谓元数据是关于数据的数据,或关于数据的结构化的数据。3、信息描述的作用:(1)识别:确认并对要进行组织的信息资源进行个别化描述,使用户能识别该组织的资源对象(2)定位:提供信息资源位置的信息,以便供用户访问时使用(3)检索:通过在描述数据中提供检索点,方便用户对资源的检索和利用(4)选择:通过记录信息资源的各种特征,诸如主题、作者、资源类型、篇幅、出版或发布信息以及日期等,供用户对信息资源的使用价值进行判断,决定是否选择该资源4、信息描述的规范:为了一致、有效地对信息资源进行描述,便于不同机构之间的信息交换,信息描述通常应依据一定的描述规范进行。(书目文献领域描述标准化的努力最为典型。文献描述标准,亦即文献著录标准。)5、著录格式:指描述记录内各个描述项目的记录次序和表述方式。6、描述信息源:又称著录信息源、著录根据,指进行信息资源描述时描述信息的来源和出处。7、检索点:检索信息资源所使用的题名、责任者、分类号、主题词等各种供检索使用的数据。8、题名检索点:建立题名目录的依据,可以从题名角度查找信息资源局,是检索文献的重要途径之一。9、参照法的基本类型:(1)单纯参照、(2)相关参照、(3)一般参照。(1)单纯参照,又称直接参照,从不用作标目的标识去查找用作标目的标识。(2)相关参照,又称兼互参照,从一个使用的标目去参考另一条或几条相关标目的参考5(3)一般参照,又称普通参照,是提供关于一定编目事项的说明,介绍用户使用系统的方法。9、规范文档:一种根据信息组织的需要,对元数据记录的标目进行控制、跟踪、维护的工具,包括名称规范档、主题规范等。10、规范控制的作用:(1)有利于以统一的方式加以记录。(2)以规范、通用的形式加以记录(3)方便标引和检索(4)有助于实现国际书目共享。11、名称规范档:是一种对描述记录中的名称标目进行规范控制的工具。其处理的范围,包括人名、机构团体名、著作题名等。12、对几种基本名称类型的规范:(1)人名规范控制(2)团体责任者规范控制(3)题名规范控制13、计算机编码的作用:(1)控制显示方式(2)提供检索点(3)促进资源共享14、MARC格式:机读编目格式是根据文献特点和文献机构之间信息交换的需要建立的标准化的计算机可读形式。我国使用的是《中国机读目录格式》,简称CNMARC。15、机读目录格式中,一个书目记录通常由以下四部分组成:(1)记录头标区(2)地址目次区(3)数据字段区(4)记录分隔符16、标记语言的作用:为了方便计算机处理文档,例如标记前的文档,标记后的文档。17、标记语言:标记语言是指在文本文件中使用一个代码集,用于指示计算机在打印机或显示器上编排文件的格式,以及文件中的索引和链接内容等。18、标记语言的分类:一般通用的标记语言、特殊用途的标记语言。19、SGML:描述电子文件的结构及内容的国际标准,文献的一种计算机语言的一种元语言。20、SGML与XML、HTML的关系:HTML是由SGML定义的,是SGML在上的具体应用,XML是SGML的子集。21、XML:SGML的子集的一种元语言。它的优越性:扩展性,数据的显示与处理分离,支持异构系统间的通信,更有意义和更准确地搜索第四章信息描述工作1、为了保证元数据的质量,信息描述操作必须客观的反映信息资源的特征,严格遵守元数据规范进行操作,一般应做到:(1)准确。即对信息资源的描述应真实反映其内容特征,通常应根据描述对象提供数据加以记录,必要时,也可以参考其他来源对有关的数据加以纠正,使用可以通过描述,对信息资源的特征有一个准确的
本文标题:信息组织的复习资料(重点)
链接地址:https://www.777doc.com/doc-2692987 .html