您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 综合/其它 > 论电子资源在线使用统计数据的收集与分析
(郑州大学信息管理系,郑州大学文献信息资源研究中心)(cjsuo@zzu.edu.cn)[摘要]本文在对电子资源在线使用统计的国内外研究现状系统分析的基础上,对与电子资源服务绩效评估相关的使用统计数据进行了系统的分析,进而论述了统计数据之间的关系,并就各个统计数据的目的、定义、获取方法和相关指标进行了系统的论述。[关键词]电子资源、在线使用、统计数据收集Discusstheon-lineusageoftheelectronicsresources'statisticsandanalysisSuochuanJun(InformationManagementDepartmentofzhengzhouUniversity,DocumentInformationresourcesresearchcenterofZhengzhouUniversity)[Abstract]Thisarticle,onthebaseofsystematicanalysistothedomesticandinternationalresearch'spresentconditionthaton-lineusageoftheelectronicsresourcesstatistics,systematicallyanalyzestheralatedstatisticsindexoftheelectronicsresourcesservice'sperformanceevaluation,thendiscussestheralationbetweenstatisticsindexes,andsystematicallydiscusseseachstatisticsindex'spurpose,definition,obtainmethodandrelatedindexes.[Keywords]electronicresource,on-lineusage,statisticsindex1电子资源在线使用统计的作用与意义电子资源或者说数字资源,已经成为当前图书馆馆藏资源建设的重要内容之一。在部分地区和领域,其建设经费已经占到图书馆文献信息资源建设总经费的1/3左右。而且,随着网络的普及,读者特别是年轻的读者(如高校的学生和青年教师等),更多地习惯于借助网络来获取自己所需的文献信息资料。但图书馆为读者订购的电子资源是否符合读者的需要,其利用率如何?等等都是需要研究的问题。图书馆通过调查也许能够获得读者对电子资源的反映情况,但要知道其客观质量和利用情况,或者说对用户的使用价值,就需要对其进行科学的评价和评估。科学的评价能够帮助采访人员正确地选择电子资源,而对电子资源的服务绩效进行评估,能够使图书馆了解其利用效率,从而调整其服务策略。因而无论是对电子资源质量的评价,还是服务绩效的评估,都具有十分重要的意义。但这些,都有赖于对电子资源使用情况的统计分析,这正是其作用和意义所在。2国内外“电子资源在线使用统计”的现状2.1国内外研究现状分析。对中国期刊全文数据库,维普中文科技数据库,全国报刊索引,人大报刊复印资料和中国高校学位论文等数据库检索得知:关于电子资源使用统计的文献仅有何雄的“图书馆电子资源使用统计”[1]和“图书馆电子资源使用统计的简易实现”两篇论文,其内容只是通过分析IIS日志文件,对页面和IP访问量进行统计。对EmeraldFulltext,ProQueseDigitalDissertation,ACMDigitalLibrary,SCIExpanded,IEEE/IEEEleceronicLibrary等十几个外文数据库检索和Google搜索可知,从上世纪90年代中期以来,国外不仅有一些文献探讨,而且,关于电子图书馆服务评价、绩效评估,在线数据库商使用统计等相关研究项目有10余项,其中美国、欧洲研究较活跃。从这些项目看,国外对电子资源的管理问题重视地比我国早,研究地更深入。一个十分明显的特点就是,多1。如美国图书馆和信息科学委员会的“在线数据库使用统计数据及报告机制[2]”和美国博物馆和图书馆服务研究所的“公共图书馆网络统计和绩效测度的国家数据收集模型”[3],试图为公共图书馆的统计和绩效测度设计一个可靠的、及时的数据收集、分析和报告系统。英国出版和图书馆理事会的“在线数据商使用统计数据研究[4]”等都非常重视信息资源管理过程中数据的可获取性等应用基础问题研究。近几年来,IFLA等一些国际学术会议也开始关注数字图书馆或电子资源的服务绩效问题。如Northumbria国际绩效评估研讨会,其四届会议,均涉及电子资源、数字图书馆的绩效评估问题[5]。美国国家图书馆和信息科学委员会也组织召开了四次“网络绩效评估”研讨会[6]。因此,从有关的文献和项目看,国外对电子资源使用统计和绩效评估等方面的研究十分重视,2.2实践现状分析。通过Google搜索发现,国内个别图书馆、数据库商和软件商已经意识到使用数据统计的重要性,已开始收集、统计有关电子资源的使用情况,如CALIS的试用数据库统计报告、沈阳师范大学图书馆的“网络数据库统计表”[7];万方公司的“万方数据资源系统北大镜像站使用统计”[8]等。但这些统计不规范,不系统,内容过于简单。2.3电子资源在线使用的统计标准建设。为了适应图书馆科学管理的需要,国际标准化组织和美国国家标准局等对图书馆统计标准做了相应的修改和补充,增加了有关电子资源的内容。如,国际标准化组织对只覆盖传统服务的《ISO2789信息和文献:图书馆统计数据》进行了修订,颁布了国际图书馆统计数据修订版,增加了一个附件:《ISO2798AnnexA:电子图书馆服务使用评价》[9]。2002年美国NISO发布了新版图书馆统计标准(TheLibraryStatisticsStandard,ANSI/NISOZ39.7)[10]。概括地说,关于电子资源的质量评价、服务绩效评估和其在线使用统计等方面的研究还没有引起国内学者的重视,但国外的有关组织和学者已经开始了相关的研究,并取得了一定的成果。3、电子资源在线使用的统计数据近年来,随着图书馆信息化程度的提高,虽然节省了一些基本的馆务数据的收集、统计成本,但电子资源使用过程中所产生的数据,用户使用电子资源的感知情况等统计更加困难。需要运用专业技术(如数据挖掘等)和统计分析系统工具,从服务器日志文件和检索结果中分析、判断、整理出管理所需的数字,以便对电子资源的服务绩效进行科学的评估。以往个别图书馆或数据库商通过用户IP和访问某数据库页面的日志文件,对单位时间内(例如一个月等)读者的访问次数进行统计。而要真正了解电子资源的利用绩效,就必须知道读者对某种电子资源的每次访问或检索时间、下载记录或文献数量、系统拒绝访问的数量以及电子资源单位时间内正常的服务时间等等。这些数据是反映其服务绩效的重要指标。这些指标虽然不能直接获取,但是通过对电子资源的一些使用数据的统计分析可以获得,因而,对电子资源的在线使用统计显得尤为重要。依据对电子资源的使用情况的了解或对电子资源服务绩效评估的需要,可以从以下方面进行数据统计:①某段时间内用户访问电子资源的任务数。任务是指对一个数据库一次成功的请求,是用户使用数据库从连接成功到任务完成后退出或超时为止的过程。该指标反映电子资源的利用率,可通过服务器获得。②某段时间内的检索次数。它反映系统服务的效能,可通过电子资源检索系统获得。③某段时间内的访问时间和检索时间。该指标某种程度上能反映某资源对用户的重要程度,或用户对该资源的偏爱程度,可以从数据库服务器获得。④某段时间内下载记录、文献和数据数量。下载数据说明用户已经找到了与自己需求相关的内容。单位时间内下载数据越多,说明用户找到自己所需的信息越多,该电子资源的绩2。从“平均每次下载文献数量”看,用户每次下载的越多,说明检索到自己所需的信息越多,与用户需求的相关度就越高。⑤某段时间内拒绝访问的平均任务数。拒绝访问可能是因为系统超出并发用户数限制,也可能是系统故障。拒绝访问的任务数越多,用户满意度越低,感知服务绩效越差。⑥系统平均无故障时间。该指标主要测度电子资源系统的稳定性。是测度电子资源可获取性的重要指标之一,也是用户感知服务绩效测度的重要指标。它需要数据库管理员统计。⑦某段时间内正常服务时间。它是指单位时间内,除去电子资源系统、服务器等设备、网络和电源等故障,以及数据更新造成电子资源不能使用的时间后,剩余的时间。这项指标反映了电子资源服务的及时性与可获取性及用户的满意度。可以通过系统管理员统计获得。指标①-④可以客观地反映电子资源的服务效率和效能;而⑤-⑦能反映用户的满意度,测度用户对服务的感知绩效。简单地说,通过这7个指标,基本上反映了电子资源服务的数量和质量。4电子资源在线使用统计数据对比分析4.1任务数与检索次数。一个任务(session)是指对一个数据库的一次成功的请求(request),是用户使用数据库从连接成功到任务完成后退出或超时为止的过程[11]。一次检索即代表一次唯一的情报需求,向来向服务器提交一次检索请求记录为一次检索。一次任务可以包含多次检索。一次检索必然是某个任务的一部分或全部(当某个任务就进行一次检索时)。任务和检索是密切联系的,没有不包含检索的任务,也没有与任务不相关的检索。因而一个任务的时间一定大于或等于一次检索的时间。4.2下载(或浏览)文献数量与记录的数量。一条被下载的记录是检索一个数据库后全部显示出的一条编目记录和数据库条目。一篇被下载的文献就是一篇文献的全文和其中的一部分,在电子馆藏中就是传递给用户的文献,包括从电子期刊和数据库中下载的全文文献。用户检索其根本目的就是获取文献信息资料。但用户通过数据库检索,首先得到的不是文献,而是若干条检索记录的集合(记录数大于等于0),也就是数据库条目。然后用户再根据检索记录去获取文献的全文信息。如果用J表示一次检索获得的记录数,用W表示一次检索用户下载文献数,那么二者之间具有如下关系(其中J,W都是大于等于0的正整数):(1)J≧W,即一次检索,用户可能下载的记录数量一定大于等于下载文献的数量,而且,1≧W/J≧0。(2)当W=0时,W/J=0,即用户下载文献数量为0,表示本次检索记录没有与用户需求相关的文献信息。(3)当J=W时,W/J=1,即用户下载的文献数量与记录数量相同,表示本次检索记录与用户需求完全相关。因而,每次检索,W/J越大,表明系统的检准率越高,该电子资源的服务绩效也就越好。否则,相反。4.3单位时间内拒绝访问的任务数与任务数。这二者是紧密相关的,二者之和是某段时间内对电子资源访问的总任务数。4.4系统平均无故障时间与单位时间内正常服务时间。系统平均无故障时间与单位时间内正常服务时间是相关联的,二者成正比。系统平均无故障时间越长,单位时间内正常服务时间就越长。但正常服务时间不仅仅与系统平均无故障时间相关,而且还与系统其他因素,如更新时间,停电时间等有关。它们,虽然不是影响电子资源的服务绩效的主要指标,但它们对用户满意度影响很大。3、电子资源在线统计数据与服务绩效指标的计算由第3部分可知,单位时间内用户访问电子资源的平均任务数和每次检索平均下载记录、文献和数据数量等指标,是评估电子资源服务绩效的重要指标。但这些指标如何获取或计算,是评估中需要解决的问题。下面我们将对每个指标的目的、定义、获取方法以及影响因素等进行详细的分析。另外,为了论述的方便,我们首先作以下几点说明或假设:(1)每个用户指图书馆的合法读者群中的任何人;例如大学图书馆中的学生和教师等;(2)所有的统计数据都是针对某一段时间内某一种电子资源的服务的;(3)假设要统计的指标都是可以通过某种方法可以获取的;(4)假设每种资源所处
本文标题:论电子资源在线使用统计数据的收集与分析
链接地址:https://www.777doc.com/doc-79345 .html