民国档案数字化研究与思考
来源:岁月联盟
时间:2014-03-26
四、档案数字化建设
1.档案目录数据库
由于馆藏档案历史跨度大,数量多,早期档案整理编目工作较粗,目录数据库质量不高。例如案卷过大过厚,目录笼统不准确,不能反映卷内内容或只反映部分内容等,造成大量有价值的信息没有被揭示出来,降低了档案利用的效益。2009年4月我馆正式启动馆藏档案数字化扫描工作,先期将教育部全宗和内政部全宗进行整理编目,共计36931条目录,比原来增加了6000多条,解决了部分案卷过厚、标题不准确、档案著录项缺失(如形成时间、责任者不详、事由不清)等问题,使整理后案卷标题规范,主题清晰,能够全面反映卷内文件内容。然后将这些优质目录和规范数据输入计算机档案管理系统,形成的新案卷目录数据库质量大为提高。同时,也为今后数字化全文扫描准确挂接,为档案利用者快速和准确查询提供了重要保证。
2.纸质档案全文数字化
通过扫描仪、数码相机对档案原文进行光学扫描,以图片格式或光学字符进入计算机,形成图像文件。之后可用OCR识别软件,将扫描后的图像文件转换成文本文件。
扫描系统参数的选择和确定对扫描数字影像质量有着较大影响,其中扫描分辨率直接关系到扫描文件的清晰度和还原效果。我们在选择分辨率时应根据实际需要综合考虑,包括扫描文件的可阅读性、存储空间、输出打印质量等。
根据档案纸质的不同,采用不同的分辨率。否则,有的幅面清晰度好;有的幅面则清晰度差。对大幅面的表册和地图等档案资料进行分块扫描,形成的多幅图像,要即时合并为一个完整的图像,避免遗忘,以保证档案资料数字化图像的整体性。
3.多媒体档案数字化
(1)照片档案数字化。可采用以下两种方法进行输入,一种是利用光电扫描仪将照片存贮到计算机中的磁盘上,然后将照片采用压缩文件格式进行缩小,解决因扫描图象占用磁盘空间较大的问题。另一种方法是采用数码相机对照片进行拍摄,图像存贮在相机的磁盘上,再将图像下载到计算机的硬盘或光盘上。对照片档案进行扫描转换,照片档案扫描采用图形格式,一般格式为JPG、TIFF,并且采用较高的分辨率,便于日后冲洗和印刷利用。
(2)声像档案数字化。主要是对录音带、录像带进行数字化处理。声像档案采用视频采集卡和软件进行模数转换,音频数据采用MP3、WAV等格式存储,视频数据采用MPEG、MOV等格式存储。
(3)对数码照相机和摄像机产生的已经是数字化格式的多媒体档案,则可直接进入对应的多媒体档案管理系统。
(4)档案缩微品的数字转换。使用缩微胶片扫描仪进行扫描,直接将缩微胶片转换成数字信号,避免再对纸质原件进行重复扫描。
4.实现扫描文件和已有目录数据库的挂接
通过档案目录数据库和扫描文件的快速挂接,系统就可初步实现对目标档案的全文检索。然而,真正意义上的全文检索,不仅应该构建功能完备的档案全文数据库,而且能够集成数据库检索技术、全文检索技术、图像内容检索技术以及数字化音频和视频信息的检索技术等。由于数字化档案要求必须与档案原件完全一致,然而目前的数字转换、识别技术又不能完全满足这一要求,因此,要实现数字档案全文检索,还有待技术的进一步发展。
5.开展网上利用服务
档案数字化的目的就是要组织数字信息上网,面向应用,建立“活性”,实现档案信息的网上检索和利用,为用户提供更好的服务。
五、结束语
档案数字化是对档案部门的挑战,也给档案工作带来了新的契机。面对新的挑战和机遇,我们要勇于担负起社会使命,以优化理论为指导,以用户需求为导向,以档案利用为目的,加快档案数字化建设的进程,实现“资源共享、保护档案、传承历史”的愿景目标。
注释:
①熊飞,熊艳.城建档案数字化建设[J].城建档案,2009(2):12-13.
②赵宁燕等.档案数字化建设危机[J].兰台世界,2008(10):6-7.
③王素立.档案信息数字化边界问题的研究[J].档案学通讯,2008(4):65-67.
④王俊明.九州图籍归天府——中国第二历史档案馆解放初期接收政权档案纪实[J].中国档案,2009(9):37-39.
⑤陈光谊.浅谈档案数字化建设中应遵循的几个原则[J].四川档案,2009(3):46-47.
⑥赵炜.档案的影像化趋势研究[J].中国档案,2009(7):44-49.
上一篇:谈档案部门做好扫描工作的几点经验
下一篇:刍议法院诉讼档案管理体系的完善