浅谈目前电子资源使用统计存在的问题及解决设想——以西安交通大学图书馆为例

来源:岁月联盟 作者:张静 阎晓弟 周奇 时间:2010-07-05
关键词:资源 利用统计 网关 大学图书馆
论文摘要:文章分析了当前大学图书馆网络电子资源利用与统计存在的突出问题,包括统计标准和计量方法的问题、数据的真实性问题、统计数据无法真实反映读者需求的问题等,提出建立电子资源访问网关系统”,来实现和完成网络电子资源利用与统计的方案。
1研究电子资源使用统计的意义
近几年,随着电子资源建设从高速增长期进入稳定增长期,图书馆电子馆藏工作的重心已经从最初的资源引进转向了有效的电子资源使用评估。在对现有资源评价的基础上不断优化资源是当前图书馆解决读者日益增长的需求与图书馆相对紧缺的资源之间矛盾的有效方法,而使用统计方法正是评价电子资源的重要手段之一。电子资源使用统计,是某个单位或组织,利用一定的方法和手段对某种电子资源在某段时间内的用户访问、检索和下载数据等情况进行的统计。图书馆利用电子资源使用统计有三个主要的日的,一是对某一种电子资源近几年的使用情况进行纵向比较,以了解该资源在一段时间内的使用情况;二是对购买同一种电子资源的成员馆各自的使用情况进行横向比较,用以了解本单位的使用情况在整个集团用户中的总体状况;三是对电子资源进行成本效益分析,由于电子资源的计价模式不同,统计指标不同,为了能够比较不同种类的电子资源,用当年引进该资源的总经费除以当年的使用总量出单次使用的成本,从而实现不同种类电子资源之问的比较。
使用统计除了直接用于了解电子资源的使用状况、经费使用效益等情况之外,还可以用于图书馆工作的其它方面,例如可以通过使用统计分析来调整采购决策、优化现有资源;可以通过使用统计分析来预测并发用户的增减、划定回溯数据的购买起始点、选择永久保存的电子期刊品种;可以通过使用统计分析帮助图书馆员发现读者在使用中存在的问题并及时予以帮助,从而完善图书馆的服务;可以通过使用统计分析来了解读者的学科背景、读者需求、使用行为、使用偏好等,以使电子资源引进、宣传、培训等工作更有针对性;还可以通过使用统计分析向上级主管单位汇报经费的使用效益,从而争取更多的文献资源建设经费。因此获取和分析电子资源使用统计是图书馆一项非常重要的工作。
2当前电子资源使用统计的研究现状及存在的问题
2.1电子资源使用统计的研究现状
国外相关方面的研究始于1998年,一些图书馆组织、学术团体和标准化组织相继致力于研究电子资源利用情况和服务效益的评价方法,目的在于制定一套规范化的使用统计指标体系,从而解决数据库商提供的统计指标缺乏规范性和标准化的问题。’目前较为重要的研究项目以及颁布的标准主要包括:
(1)图书馆共同体国际联盟(InternationalCoalitionofLibraryConsortia.ICOLC)提出的《网络信息资源使用统计测评指南》(GuidelinesforStatisticalMeasuresofUsageofWeb—basedIn—formationResources);(2)美国研究图书馆协会(AssociationofResearchLibrary,ARL)发起的电子资源计量(MeasuresforElectronicResources,E—Metircs)项目;…(3)国际标准化组织(InternationalStandardsOrganization,ISO)制定的有关图书馆网络信息服务与评价指标的标准IS02789:2003中的《附件A:电子图书馆服务使用测评》(ANNEXA:MeasuringtheUseofElectronicLibrayrServices);(4)美国国家信息标准协会(NationalInformationStandardsOrganization,NISO)颁布的NISOZ39.7—2004,即《信息服务和使用:图书馆和信息服务机构统计指标——数据字典》(InformationServiceandUse:Metrics&statisticsforlibrairesand information pmviders——datadictionary);…(5)美国“网络化电子资源在线使用统计”(CountingOnlineUsageofNetworked Electronic Resources,COUNTER)项目。…这些标准对于使用统计数据的定义、收集、获取、使用、保密等问题都做了详细的规定,其中以COUNTER项目的影响最为巨大。这是目前电子资源使用计研究取得的最为重要的研究成果之一。COUNTER规范的核心内容包括“用语定义”、“使用报告”、“数据处理”、“使用报告的传递”等。它从使用统计的标准化、统计数据的获取方法、数据的收集分析等多个层面对于使用统计进行了系统的研究和规定,得到了越来越多的出版商和服务商的遵从,截止2004年已经有30个出版商和服务商获得“遵从COUNTER”的认证,国际上主要的出版商和服务商均在此列。
国内对电子资源使用统计的研究始于上世纪九十年代末期,2002年肖珑、张宇红在《电子资源评价指标体系的建立初探》一文中较为详细地论述了电子资源使用评价的作用,使用统计数据存在的问题,并针对北京大学电子资源的利用率、电子资源的使用价值与成本进行了分析评价。应该说,这是国内首篇较为系统论述电子资源使用评价的论文。此后相关文献逐渐增加,但大多停留在理论探讨的层面上,对于目前电子资源使用统计存在的问题缺少有效的解决方案。本文基于此提出了建立图书馆“电子资源访问网关系统”的设想,并在本馆进行实验,用以帮助图书馆获取最准确最符合图书馆要求的使用统计,以解决目前数据库商提供的使用统计的不准确、不规范、不符合图书馆需要等问题。
2.2目前电子资源使用统计存在的问题
2.2.1统计标准和计量方法的问题
虽然COUNTER规范的颁布改变了电子资源使用统计无法比较的混乱状态,但并不是所有的问题都迎刃而解,目前遵从COUNTER的出版商、服务商也只占一小部分而已,还有许多电子资源,尤其是中文电子资源在使用统计方面还处于没有标准的状态,不同商家的统计数据在类型、格式、频率、深度、计量方法及可用性等方面都存在差别,从而使不同信息提供商的统计数据缺乏兼容性。…这导致了图书馆面对各式各样的统计数据而无从比较,严重影响了对电子资源的评估工作。
2.2.2数据的真实性问题
目前除了遵从COUNTER规范的电子资源外,其它电子资源的使用统计还是由出版商或服务商提供,图书馆无法获得第一手的数据,而出版商或服务商在提供使用统计时常常趋利避害,只提供对自己有利的数据,而隐瞒一些对自己不利的数据。例如一些数据库商以保护用户隐私为由,拒绝提供集团成员横向比较的数据,因为这样会使一些使用状况不好的学校退出集团。此外用户的盗用、滥用、系统下载等不规范使用行为也会导致统计数据虚高,这样的使用量是无效的,不应该被计入使用统计当中,数据商却常常以这样超高的使用量作为下一年度涨价的依据,图书馆员如果不深入的调查研究就无法发现问题所在。可以说数据的真实性问题直接影响图书馆的利益,但图书馆对于这种状况却束手无策。
2.2.3统计数据无法真实反映读者需求的问题
数据库商常常以使用统计为依据向图书馆推荐引进或续订某种电子资源,或抬高某个数据库的价格,理由是使用量高说明读者有需求,图书馆如果不对使用量和需求加以甄别,很容易被假象蒙蔽。使用量并不完全等同于需求,使用量中包含有一部分与需求无关的虚假用量,这是由于用户使用行为不当或数据库商统计方法的不当产生的,例如读者的违规使用行为,读者出于好奇的随意浏览或下载以及一些数据库商对同一篇文献不同下载格式的重复计算等,这些使用量均与用户需求无关。要分析用户需求和使用量的对应关系,就必须了解用户身份、学科背景等信息,将这些信息和使用量对应起来分析,凡是能将用户身份与学科相互印证的才为有效使用量。要实现这一目的必须要将读者的IP地址与下载文章一一对应起来,通过IP地址了解读者的身份及学科背景,再分析与下载文章的相关性。目前许多数据库不能提供这样的使用统计,一方面是受限于技术因素,另一方面是出于保护用户隐私的目的,这些数据由数据库商提供是不妥当的。图书馆是出于研究读者需求,维护读者利益的目的来研究这些数据的应当有自己的一套方法来获得这些数据。
3建立统计数据获取方法和数据收集分析系统的设想
鉴于目前电子资源使用统计存着的问题,西安大学图书馆提出了图书馆“电子资源访问网关系统”的规划,来实现和完成电子资源的“统计数据获取”和“数据收集分析”的功能,以满足图书馆对使用统计的需要。
3.1电子资源网关系统简介
将原有的校园网IP作为合法地址IP改为:将一定数目的IP地址(比如10—20个),作为访问网络数据库的合法IP地址加载到电子资源网关的IP池中,用户要访问网络数据库时必须通过网点认证,网关将地址池中的某个IPI临时分配给合法用户,一旦访问结束,IP地址将被收回,为下一个用户准备。电子资源网关只作为访问图书馆有使用权的网络数据库,其所有的出口流量都是访问网络数据库的行为数据,作为日志保存下来。志服务器可以把这些数据按照不同的策略和方式进行分析统计,生成图书馆想要的统计报表。
用户通过统一认证平台登录电子资源网关后,包括检索和下载在内等所有的行为都将被记录在案。一方面,可以将不同商家的电子资源的统计类型、格式、频率、深度、计量方法等信息统一,从根本上解决统计数据兼容性的问题;另一方面,从根本上杜绝用户的不当使用行为,获得的用户所有行为信息都是真实的,使得统计数据更具有说服力,可以作为决策的可靠依据。 3.2资源网关系统的架构.
这个系统是以门户网关为核心,所有用户访问电子资源的进程必须通过网关,再经认证服务器进行用户认证,认证的方式可以不同,比如用户名/密码方式、授权IP方式等。通过认证的合法用户才能访问电子资源。用户通过网关访问电子资源的行为,包括数据库的选择、检索提问式的输入、检索结果的已经浏览和下载被详细记录在日志服务器中,并根据事先约定的策略进行分析、比较、汇总,形成电子资源利用的统计文档。


3_3电子资源网关系统获取数据的途径
3.3.1用户认证日志
用户通过用户名/密码认证、IP地址认证、证书认证等各种认证方式登录网关门。无论认证成功或者失败,都将记录此次认证的详细信息:用户IP地址、认证时间、用户名、认证方式、认证结果、系统信息,并保存到日志数据库中。
3.3.2用户访问日志
用户成功登陆网关门户后,可以选择访问有权限使用的电子资源。根据用户选择的不同电子资源,门户系统将分配给用户唯一的身份标识码,并将用户访问请求通过URL重定向至不同的应用网关上。远端电子资源的WEB界面及数据经应用服务器处理,相关的外部URL转换为系统内部的“i—URL”。用户一旦发生某种动作,比如进行检索或者下载,系统根据内部及外部uRI对应的关系,判断出用户的动作,同时将其记录人数据库。所以,用户的每个动作都将被记录在案,包括每个动作发生的时间,动作内容等。
3.4电子资源网关系统对用户使用电子资源的统计结果
3.4.1对用户的访问行为进行统计
(1)每个用户都访问了哪几个数据库,了解读者数据库的喜好程度;
(2)每次访问提交了几个检索提问式,了解该数据库满足用户的信息需求程度;
(3)每提交一个检索提问式下载了多少篇全文;
(4)用户身份类型的确定与统计(本科生、硕士生、博士生、教师……)。
该组统计,可以判读出读者对那种数据库的喜好、读者的信息检索能力以及不同类型的读者对不同电子资源的使用偏好等。
3.4.2数据库被访问的数量统计
(I)每个数据库被访问次数(按年、月、日等);
(2)每个数据库被下载全文篇数(按年、月、日等);
该组统计,可以让图书馆了解每个数据库在不同时段的利用频率和使用密度。
3.4.3统计结果分析
(1)按数据库利用率排序(检索次数、下载全文篇数);
(2)按使用数据库次数的读者类型排序(本科生、硕士生、博士生、教师……);
(3)数据库效益评估(购买费用与使用率之比:
(4)提供是否继续购买该数据库的依据;
统计结果分析是这个系统的核心功能,通过以上的数据积累,得到相关的对比数据,从而可以了解读者使用电子资源各个方面的情况,为图书馆的电子资源建设提供强有力的数据支持。
4结语,
电子资源使用统计是目前研究的热点问题,采用电子资源网关系统获取电子资源使用统计,可以帮助图书馆获取电子资源使用情况的第一手资料,并且可以设定各种图书馆需要的数据项,有效地解决目前电子资源使用统计中存在的一些问题。电子资源网关系统在图书馆的典型应用,特别是针对电子资源的访问管理与统计、用户针对电子资源的访问与统计,是图书馆对电子资源的利用和读者个性化分析的必要条件,对图书馆提升服务质量、规范服务方式、提高资源有效利用率具有重要意义。