谈高校图书馆特色数据库建设的质量保障

来源:岁月联盟 作者:张元晶 刘新庄 时间:2010-07-05

  [摘要]本文从特色数据库建设的实践出发,提出应从建库之初、系统建设和具体应用三个方面强化特色数据库建设的质量保障,从而有利于充分发挥其价值,体现其生命力,实现资源共享和优势互补。

  [关键词]特色数据库;质量保障;数字图书馆
  
  目前,特色数据库建设已经成为高校图书馆的研究热点。特色数据库建设是图书馆数字化资源建设的核心和方向,而其价值和生命力的体现则需要通过数据库的质量保障来实现。笔者从本校图书馆特色数据库建设的实践出发,认为特色数据库的质量保障主要包括三个方面的内容:1、针对建库之初的质量控制;2、针对系统建设的流程控制;3、针对具体应用的技术控制。
  
  一、针对建库之初的质量控制
  
  特色数据库的建设是一个系统工程,包含着规划、论证、收集、整理、加工、分类、网页建设与维护等环节,同时还包含一些技术问题。在这个系统工程建设中,首先应该从源头开始严格把关,即在建库之初的规划、论证阶段要有严谨的态度,在全面了解特色数据库建设总体情况的基础上,提出可行性报告。
  1、选题论证要严谨
  目前特色数据库建设中低水平重复建设、缺乏特色、更新缓慢等现象比较普遍。作为高校图书馆,应该划定范围,有所为,有所不为,才能找准自己的位置,才能建设既符合高校的办学特点。又有可持续发展潜力的特色数据库。因此开发特色数据库首先要选好题,把好立项论证关,在对国内外数据库信息资源分布状况进行认真调查的基础上,针对馆藏特点、重点学科设置、用户需求等因素,确定适当的主题范围或类型范围。不要一味地求“大”、求“全”,而应该求“精”、求“特”,也就是说内容不要太杂。面不要太广,要重点关注某一领域,尽可能地将该领域内的有价值的东西收录进来,体现数据库的专题性和独特性。本着这个原则,我校图书馆经过仔细调查、论证,构建了中文馆藏图书数据库、教学书数据库、本校博硕士学位数据库、会议论文数据库等。其中,中文馆藏图书数据库主要是将我馆的全部印刷版中文图书进行回溯建库。实现馆藏资源数字化:教学参考书数据库是考虑到教学参考书作为高校教学、科研最直接、最具体的必备工具而建立的,同时为了缓解图书价格的飞涨与图书经费的紧张、教学活动中参考书需求量较大与图书馆馆藏复本量相对有限的矛盾:博硕士学位论文数据库主要收录我校硕士研究生、博士研究生的毕业论文以及博士后出站报告,由于高校硕士生、博士生的学位论文具有专业性强、内容新颖、学术价值高、信息含量大的特点,已经成为师生了解学术动态、掌握科技信息和研究前沿问题的重要信息源;会议论文数据库的文献来源于由我校主办或参与主办的各种学术会议,这些会议论文的文献能反映某一学科的前沿动态、研究热点、发展趋势以及最新的学术思想、科研成果、实验方法等,是比较重要的信息资源,能够充分为我校的广大师生提供针对性较强的知识信息。
  2、数据源的收集要全面
  数据是数据库的核心,数据质量从某种意义上说就是数据库的质量。因此,数据的收集是数据库建设中十分重要的环节。要确保收集信息的完整性和权威性,主要应注意以下几方面:(1)确定合理的收集范围,包括学科范围、时限范围、地域范围、文种范围等。例如,中文馆藏图书数据库主要是将我馆的全部印刷版中文图书进行回溯建库,学位论文数据库主要收集我校博、硕士学位论文等:(2)确定信息源的种类,包括图书、期刊、会议录、论文集、专利文献、产品说明、科技报告及网上信息等;(3)确定收录信息的形式,包括文字、表格、图片、动画、及多媒体信息。以我馆会议论文数据库建设为例,我们主要收集我校主办或参与主办的国际性学术会议的论文。最近一次收集的是2007年5月18日召开的,由北京化工大学、印度圣雄甘地大学和《塑料》杂志社联合举办的高分子材料加工国际会议(ICPP2007)的论文。会议期间,参会学者和专家口头发表论文90篇,壁报发表30篇。聚合物加工领域最高水平的权威学术期刊《PolymerEngineering andScience》和《International Polymer Processing》为本次学术会议出版了特刊。会议结束后,我们立即和我校外事办取得了联系,及时获得了这次会议的印刷版和光盘版会议论文集。
  
  二、针对系统建设的流程控制
  
  在数据库建设过程中,对软件平台的选择、标准和规范的制定、数据加工、数据库的集成等阶段都要严格实行规范操作和质量控制,从而保证数据库的整体质量。此外,建库人员的素质也是一项重要的影响因素。
  1、平台的选择
  特色数据库的建设必须依赖一定的软件平台,对于大多数图书馆来说,这种软件平台需要通过购买产品来实现。软件一旦选定一般不能轻易更改,因此对于每个图书馆来说,选择自己的建库软件是一项非常重要的工作。应在充分考察的基础上,对加工管理系统平台的资源制作、管理、发布等各项功能进行充分的论证,通过比较后完成加工管理系统平台的引进工作。
  经过深入细致的调查、比较、分析,我馆引进了清华同方知网(北京)技术有限公司TP14.5平台系统,它是一套基于平台上用于知识仓库创建、生产、管理、维护和发布的工具软件系统。使用它可以快捷、方便地掌握知识仓库建库、管理以及网上发布技术,建设自己的知识仓库和知识网站。其主要性能和突出的特点是:完全兼容现阶段普遍使用的MARC标准:支持Z39.50服务:完全兼容最新的Dublin Core标准;支持XML文件格式;支持最新的OAI协议:支持最新的METS协议:支持11种CALLS元数据模板:支持统一认证和单点登录:检索手段丰富。TPI系统的特殊功能是:拥有先进的安全机制;可制作图书;支持动态实时信息的处理;实现了流水线控制:可以利用COM组件实现二次开发。该系统的性能可以满足我馆自建特色数据库的要求,因此依托该平台进行我校图书馆特色数据库的建设是可行的。
  目前已经在该系统平台上构建起了会议论文数据库和教学参考书数据库。会议论文数据库的构建选择的是CNKI模板,界面简洁、清新,可以进行快捷的初级检索和多功能的高级检索。还可按学科、年代和会议名称的分类方式进行检索。检索功能完备。教学参考书数据库采用自定义模板,界面和CNKI模板类似,重要的是该数据库实现了和馆藏图书的OPAC系统的链接,读者可以点击该链接,方便地获取该参考书的馆藏信息。

  2、标准和规范
  图书馆在建设特色资源数据库时,都要坚持执行统一的标准规范才能实现互联网上的信息资源共享。2002年发布的《数字资源加工标准规范与操作指南》是指导我们进行特色资源建设的重要资料。“《数字资源加工标准规范与操作指南》针对一般数字资源加工和有关专门数字资源加工,分析确立应采用的数字编码与内容标记标准,针对保存格式、浏览格式和预览格式提出了应该采用的数字内容格式标准,确立了数字资源加工标准和程序的选择原则。编制了数字资源建设指南的基本操作规范”。
  清华同方TP14.5专业数据库制作管理系统已经通过CALLS认证。其技术在国内属于领先水平,完全兼容现阶段图书馆普遍使用的CNMARC标准和最新的Dublin Core标准。支持Z39.50协议标准和XML文件格式。并且支持最新的OAI协议和METS协议、支持11种CALLS元数据模板。依托该系统构建特色资源数据库符合CALLS的标准和规范,为资源共建共享奠定了基础。
  3、数据的加工
  (1)筛选。并不是收集到的所有信息都有必要入库,一定要进行认真的审核筛选,去掉重复的、不准确的及价值不大的信息,最终确定哪些数据被收录进数据库。
  (2)标引。标引结果的好坏影响数据库的质量,决定数据库的检索效率。因此,应根据实际情况,选择合适的标引方式、制订标引细则,具体规定标引的深度、分类的集中与分散、主题词和关键词的选用规则等。提高标引质量。TP14.5原数据标引工具能标引的文件类型包括*.KDH文件、*.Nil文件、*.PDF文件、*.TXT文件、*.HTML文件和*.WORD文件等六种。在标引的过程中只需要对标引的字段进行鼠标框选、拖拽即可完成,非常方便。
  (3)录入。数据录入也是不可忽视的重要环节。有了完整的数据源,进行了高质量的标引,如果录入的时候错误百出,也会前功尽弃。因此,为了确保输入数据准确无误,要制定严格的质量管理制度,选择责任心强的工作人员。在会议数据库和教学参考书数据库的构建中,数据的录入按照原始录入、分次检查的方式进行。首先进行原始数据的录入,这一步要求仔细认真,否则对后续工作的进度有很大影响;然后是对录入数据进行第一次检查,查缺补漏;之后是在数据转化过程中进行最后一次核查。在建库的实践中我们发现,即使前两步已经很仔细认真,在最后进行数据转换时还是会出现重复或遗漏记录的情况。因此,笔者认为这样安排录入工作对于提高建库质量还是非常有必要的。
  (4)审校。数据审校绝对不是可有可无的。要避免标引错误,提高标引的一致性,减少数据录入中的失误,保证每一条记录的准确性,就要全面、认真、细致地做好审校工作。笔者认为可以采取“人工审校加程序控制的双审制”。这样可以确保数据库的质量。
  4、建库人员的素质
  高素质的人才是建设特色数据库的核心和关键。在环境下,专业图书馆的图书资料人员不仅应对数据库用户的主攻方向和动态有比较深入的了解,而且还应有较高的思想素质、丰富的图书情报专业知识、外语知识和较强的工作能力,如对信息的敏锐反应能力、系统导航能力、较强的科研能力、整理加工信息的能力等。这些都是一个合格的网上专业人员所必备的素质。否则再充足的信息资源。再先进的网络设备,也无法发挥其应有的作用。可以说,没有信息人员事前对信息的取舍、组织、评价和解释,就不会有高质量的特色数据库,因此,必须注意培养高素质的人才。
  
  三、针对具体应用的技术控制
  
  数据库的质量控制是一项集管理和技术于一体的综合性工作,它贯穿于数据库建设的整个过程。数据库在使用过程中是否便于检索、读者检索到的数据是否新颖、是否能尽早获取最新信息等是考察一个数据库质量的很重要的因素。
  1、检索功能要完善
  特色数据库最大的功用在于检索,检索点越多越便于使用,特色数据库的质量也就越高。因此要建立功能强大的检索系统,就要完善检索系统的功能:创造良好的网上检索界面,人机对话尽可能简捷方便;根据文献信息的内容及形式,选取最能反映其特征、最有可能被利用的检索途径。设置丰富有效的检索点:既能提供包括书名、责任者等外部特征检索和全文检索,又能提供分类和主题词检索;既能实现各项之间的“与”、“或”、“非”的逻辑组配检索,又能实现标引词的位置算符检索。并在一次检索结果的基础上实现多次循环检索。
  以会议论文数据库为例,该数据库的建设选取的是CNKI模板,可以进行快捷的初级检索和多功能的高级检索。还可以按学科、年代和会议名称的分类方式进行检索,设置了篇名、作者、作者单位、关键词、会议录或者文集名等11个检索字段,对检索结果还可以进行二次检索,检索功能完备。同一条记录分为概览区和细览区,既可以了解一篇文献的基本情况还可以了解其详细情况,例如出处、会议召开年份、地点、语种、摘要等信息,并且均提供有原文下载按钮。
  2、数据的更新维护要及时
  数据库建成后并不意味着大功告成,还要进行经常性的更新和维护,才能保持生命力。安排专门人员收集数据库在使用过程中的反馈信息,定期对数据内容进行更新追加、清理和修正,经常对系统的运行状况(如存储空间状况)和响应时间进行分析,从而可以结合用户在使用过程中发现的问题确定改进措施,使系统逐步完善,为广大读者提供高质量的数据信息资源。
  
  四、结束语
  
  特色数据库建设是高校图书馆信息化、数字化、网络化建设的一项重要基础性工作,也是一项难度大、投入多、需要深入而持续研究的复杂系统工程。在数据库的建设过程中需要严把质量关,以确保数据库在满足读者对教学科研的信息需求、提高教学科研质量和水平等方面起到积极的推动作用。