档案编研选材数据库的合理开发

来源:岁月联盟 作者:卢东清 时间:2014-04-25
  三、建立档案编研选材数据库的步骤和方法
  
   (一)对数据库的功能需求的调研。编研选材数据库一般容量较大,因此要具有较快的检索速度和较高的查全率、查准率,这样才能真正提高编研效率。将来开展网络编研是编研工作的趋势,不同的档案馆之间,档案馆、室之间,档案馆与社会有关部门之间都可以进行广泛的联合编研,因此编研选材数据库要适合在网络环境下使用,要具备较高的检索性能,便于实现数据库资源的信息共享。
   (二)准备数据库材料。编研选材数据库的数据来源主要是馆藏档案和资料,现行文件中心的现行文件资料,档案室保存的档案信息,其他档案馆保存的资料,通过网络、公开出版物等途径获得的资料信息等。比如,目前我们已收集了档案馆的90多万条目录的综合数据库,基层档案室报送的30多万条的电子目录,为建立选材数据库做好了准备。
   (三)数据库选型。数据库的类型有很多,比如Access、Datebase、SQL server等,一般应选择功能齐全、通用性强、兼容性能好的数据库。比如根据我馆的实际,可采用Access数据库格式,一是编研人员使用操作比较熟练,二是区档案馆、各单位档案室已建立的数据库也是这种格式,我们可以直接在原数据库上进行操作。
   (四)数据库的设计。主要是设计字段和设置字段类型。根据实际需要可以设置档号、类别、文件题名、内容简介、时间、保管单位、档案原文等字段,其中要注意以下几点:
   1、类别的设置是关键。可以按专题设置类别,如可以设置历史、地理、人文、自然、政治、经济、科技、教育、文化、综合类等专题。专题的设置要以实用为主,如果专题分得太多,就不容易辨别区分,不容易归类;如果专题分得太少,检索使用起来就不方便。因此,设计专题要做好广泛的调研并通过实践修改完善,也可以参考县志、百科全书的类目设置。由于类别字段较多,可以用代字或代号表示,并编制字段设计说明。
   2、内容简介字段要设计成文本型。它是对文件内容进行准确、简要的概括,内容较单一的文件可以用主题词、关键词进行标注,内容较多的文件,可以编写摘要。标注内容简介是建立数据库的难点,工作量巨大不说,单就一份文件的内容来看,有的可能涉及政治、经济、文化、教育、体育等各个方面的重要信息,综合性文件可能还包含着历史、地理、自然等社会各个方面的信息,标注起来非常复杂。这就要求编研人员具备较高的判断、分析、研究能力,从一份文件材料中查找有利用价值信息,同时还要具备较好的总结、提炼、文字加工功底,全面细致准确地标注档案内容。
   3、档案原文字段要设计成超级链接型。由于嵌入式档案原文所占空间较大,影响检索速度。档案的载体、类型又有文本、照片、声像等多种形式,因此,应采用超级链接方式链接档案原文。
   (五)窗体界面的设计。设计窗体界面表文件,是为了方便输入文件内容简介和档案原文等字段的内容,主要设计类别、文件题名、内容简介、时间、档案原文等字段。
   (六)数据库的实施。从实际情况来看,数据库的建立可以分步实施。
  第一步是从原目录数据库中挑选出可用的条目,建立选材目录数据库。具体方法:可以在原数据库中设置“是否存留”和“类型”两个新的字段,然后就需要从头至尾浏览数据库,从中找出可用的条目,并在是否存留字段中标注“1”,同时在类型字段中标注应属于哪个类型,比如政治、经济、文化等类或用代号表示。数据库录入完成后,为方便使用,可以用检索工具,检索出所有“是否存留”字段中是“1”的条目,另建新库保存,也就是新建一个有用的数据库。
  第二步是在新建数据库中,添加内容简介。由于填写档案内容简介的工作量非常巨大,可以有针对性、有侧重点地进行文件内容简介录入。从馆藏来看,早年形成的档案文件标题不很规范,比如革命历史档案,敌伪档案,县委、人委、革委、五大公社档案,六大区委档案、四清档案等,而这些档案又往往是编研或者办展利用的重点,可以先从这些档案入手,边调研边录入内容简介。
  第三步是录入档案原文。目前我馆还没有档案原文数据库,基层档案室电子档案还没有接受进馆,只能靠我们日常积累。比如我们在编研或是办展过程中要注意积累,对已形成的电子文件、数码照片等随时链接到数据库中。

图片内容