试论南京大学图书馆和元智大学的古籍数字化比较研究

来源:岁月联盟 作者:陈书梅 时间:2010-07-05
   摘要:“中华古籍保护计划”于2007年启动。古籍数字化是对古籍的一种再生保护,有利于古代文化在更大范围内传承。对南京大学图书馆和地区元智大学的古籍数字化情况进行了比较研究.揭示了两者各自的特色。
  论文关键词:南京大学图书馆;元智大学;中华典籍资料;古籍数字化

  文化是一个国家的软实力。我国有五千年的灿烂文明,这是我们丰富的宝藏。把传统文化发扬光大,是我们的责任.更有助于提高国家的综合实力,增强民族凝聚力。
  现在,古籍文献保护工作,已经引起了国家有关部门的高度重视。从2007年开始,启动了“中华古籍保护计划”,展开了全国性古籍文献普查工作。预计将用3年到5年的时问,在全国范围内组织开展古籍文献普查登记工作,全面了解各级图馆、博物馆等单位及民间所收藏的古籍文献情况,最终日标是编纂一部《中华古籍口录》。国家财政今后将每年至少拨款2500万元人民币,重点资助《中华占籍目录》中古籍文献的保护和“全网占籍重点保护位”的建设。
  古籍文献作为传统文化的载体,起着传播占代文化的作用。但是.纸质载体容易被毁坏,而且传播范围有限。纸质籍文献的这些局限性,使传统文化远远没能为大众所熟识和应用。在信息技术高度发达的今天,采用机技术,对古籍文献进行加工、处理,制成古籍文献书目数据库和古籍文献全文数据库等,可以更好地揭示古籍文献的丰富信息资源。从而在更大范围内传播灿烂的传统文化,为深层开发和利用打下良好的基础。
  古籍文献数字化引起了大陆和港台地区各界的重视,经过各方努力,已经建成了一批颇具规模的数据库,并通过网络为研究者和普通大众所利用,更为古籍走向世界、让世界了解中国古代文化开了一个好头。大陆和港台地区的古籍数字化各有特色,笔者就南京大学图书馆和我国台湾地区元智大学的古籍文献数字化进行了比较研究。
  一、南京大学图书馆的古籍文献数字化情况
  南京大学图书馆有占籍线装书、大型影印古籍丛书、新修方志以及文史资料等近40万册。在馆藏的30多万册古籍线装书中有556种、1万余册被列入全国善本书目。地方文献、古代目录学文献以及丛书的收藏已形成特色。地方志共收藏有4000余种、近4万册,在全国各大图书馆中处于领先地位。为了保护这些古籍文献,图书馆配备有古籍专用书库、专门保护机构和专项古籍保护经费。在最近公布的全国重点古籍保护单位中,南京大学图书馆被列为全国51个单位之一。
  南京大学图书馆为中国高等文献保障系统(CAIIS)华东北地区中心和江苏省高等教育文献保障系统(JAIIS)的管理中心,承担起为华东北地区(江苏、山东、安徽三省)高等学校提供文献信息服务、协作、资源共享、管理的重任。为了更好地进行文献信息服务,南京大学图书馆引进了一系列文献信息资源,包括“高等学校中图书数字化国际合作计划”(CADAL)、“学苑汲古…一高校古文献资源库”、“中国历代石刻史料汇编”等。
  (一)高等学校中英文图书数字化国际合作计划
  “高等学校中英文图书数字化国际合作计划(CADAI)由美国卡内基——梅隆大学教授Dr.RaReddy和西蒙学院陈刘钦智博士、中国院研究生院常务副院长高文博士共同发起,旨在建设面向教育和科研的包含100万册(中、英文书籍各50万册)图书的数字图书馆,由教育部“2ll工程”建设办公室归口管理,浙江大学和中国科学院研究生院等单位共同承担建设任务和运行管理。计划通过4年时间,建成2个数字图书馆技术中心(浙江大学、中国科学院研究生院)和12个数字资源中心(北京大学、清华大学、吉林大学、武汉大学、西安大学中国科学院研究生院、浙江大学、复旦大学、南京大学、中山大学、四川大学、上海交通大学),开发出3个左右的大型特色数字资源库。
  CADAI网站收录的中文图书中包括各馆珍藏的古籍善本、古籍影印本以及后人的研究资料等。该网站为多媒体检索系统,用户进入该网站服务平台后,可以享受到全方位、个性化的文献检索浏览、资源导航、个性化定制等服务,产生的电子书字迹清晰、阅读效果良好。系统采用Image/Djvu (djvu格式,检索到古籍图书后能够看到图书的一些详细信息,如作者、贡献者、类型、关键词以及相关的描述。可进行全文阅读、全文检索,阅读界面简洁、容易操作。
  该数字化系统不仅对古籍文献的文字进行了输入,对图像(如古文中的插图)也进行了描述揭示,从而可以提供方便的检索。其图像检索功能齐全,包括内容检索、语义检索以及交叉检索。检索出的图像清晰,改变了数字化古籍文献纯文本的单调格式,形式更加丰富多样,更好地反映了古籍文献的多样化特点,全面展现古代文化的深厚内涵。该工程还覆盖l万册中英文双版本图书,并在此基础上,利用机器翻译技术支持双语服务。在明确翻译内容和百万册图书文本及相关元信息的基础上,对国内外现有的翻译系统进行了评测,找到最适合数字图书馆读者应用的机器翻译系统。
  为了满足保护修复、考古研究、鉴赏等人员对珍贵濒危文物数字化信息共享与交流的要求,该网站还提供了一个以大容量文物数字化信息库为核心、支持用户通过计算机网络进行异地异时信息浏览查询与交流共享的平台。
  (二)学苑汲古——高校古文献资源库
  该资源库为中国高等教育文献保障系统(CALIS)的特色数据库项目之一,汇集了高校古籍文献资源,由北京大学、北京师范大学、南京大学、四川大学等高校图书馆先行合力创建。内容不仅包括各参建馆所藏古籍文献资源的书目数据,而且还配有部分相应的书影或全文图像,可以为读者提供一定范围内的文献传递服务。对该资源库呵使用中文繁体字或汉语拼音进行检索。汉语拼音检索仅限于题名、责任者、主题词三种检索途径。普通用户如想获得古籍文献图像或全文,可点击详细记录显示界面下方的“文献传递请求”,会弹出一个表格,填写完成后,点击“提交”,将该项请求发送至相应的图书馆,双方商定付款金额和方式后,即可应用户要求将所需文献的复制件用某种合适的方法传送给该用户。
  (三)中国历代石刻史料汇编
  “中国历代石刻史料汇编”系由十几位石刻文献研究专家历经数年,精心编选,由北京书同文公司制作而成。“中国历代石刻史料汇编”的内容字字可查、句句可检,读者可利用全文检索工具在最短的时间内获得最大的信息量。该系统提供中日文字,简繁体、异体汉字关联查询,打破了时空、地域的汉字使用习惯,增强了知识检索的全面性。该软件还提供逻辑检索及字、词间距检索。同时,读者也可以不输入任何检索文字实现按朝代浏览碑文。此外,该系统还提供联机字典、文字代码页与原书图像页关联、复制打印、添加注释、纪年换算、八卦查询以及手写输入等功能。 
  二、台湾地区元智大学的古籍数字化情况
  元智大学一个重要的古籍数字化成果即为网路展书读网站的“中华典籍网络资料库”。该资料库由元智大学在文学和资讯方面均有造诣的罗凤珠先生主持开发,所需经费多由学校、台湾地区国科会与教育部编列补助,以中国古典文学资料为主要特色,包括诗经、全唐诗、唐宋词、宋诗、台湾地区古典汉诗、红楼梦、三国演义、水浒传等多个各自独立的全文检索系统。
  (一)唐宋代文史综合研究资料中心
  “唐宋代文史综合研究资料中心”是中华典籍网络资料库网站的一个子系统,其中的“唐宋词全文数据库”收录唐五代词2500余首,全宋词近2万首;宋诗包括苏轼、晁补之、陆游、范成大、杨万里、王禹偶、范仲淹、晏殊、梅尧臣、欧阳修、苏舜钦、苏洵、王安石、苏辙、邓忠臣、秦观、黄庭坚、贺铸、陈师道、张耒、李扇、晁说之、王令等宋代名家诗全文。该检索系统支持复合检索,并根据不同文学体裁的特点,在检索选项上加以变通,使查询更为便利。例如,唐宋词检索,可依作者、词牌、词序、词题、词文等进行检索。其中作者可用作者本名、字、别号等检索。该资料库包含唐宋词作者及词文中引用之每一个人本名、字、号及别名,使用者从作者检索点检索时,以任何一个名称检索,系统会蔓动到此搜寻其字号、别名,使检索范围更完整。检索结果可列出该作者生平资料、作品目录及浏览全词,词文可使用关键词和模糊句检索。
  宋诗检索提供了作者、涛题、诗句、综合检索等几个检索点。例如,要查苏轼诗作中有关茶的诗句,先到宋诗的查询页,若用诗句检索,将会得到所有宋代诗人的相关诗句,但若用综合检索一作者栏输入“苏轼”、诗句栏输入“茶”,就可找全苏轼所有品茗说茶的诗50首;如果在诗题项目上点一一下,就可看到某首诗的全文。十分便捷。
    (二)红楼梦网路教学研究资料中心
    “红楼梦网路教学研究资料中心”是中华典籍网络资料库的另一个子系统,整合了中国著名古典小说《红楼梦》的各种资料。
  罗凤珠先生表示,《红楼梦》是中国近代最重要的小说之一,也是国外翻译本最多的文学著作,并且内含很多诗词,与系统中以诗词为主的要求相一致。在红楼梦系统中可以看到多元化的艺术,包括人物特写、大观园平面图、戏曲欣赏、红楼彩绘图及扬州红楼宴的名菜食谱,以及文物图文展示等。另外,该系统也可以教导上网的人作诗填词。
  红楼梦全文及注解系统所采用的是杭州大学中国文学系教授、著名红学家蔡义江的《红楼梦》版本。采用这个版本的原因,是因为它拥有比较完整清楚的注解本。该系统从1992年开始制作,在制作过程中不断搜集资料并且自费建置网站。
  “红楼梦网路教学研究资料中心”开启中文学门引用计算机科技,作为研究与教学工具的典范,因此获得l998年台湾地区中华民国资讯月活动执行委员会所举办的“杰出资讯应用暨产品奖”。
  三、两者的比较分析
  (一)从古籍文献数字化的理念看
  古籍文献数字化是传统古籍文献整理与计算机技术相结合的产物,通晓计算机技术的人才并不难找.而精通古籍文献知识的人才却不是太多,既懂古籍文献又精通计算机技术的人才更是少之又少。占籍文献数字化的关键之一是需要有能够利用计算机技术来驾驭古籍文献并具有很好理解能力的“专业”人才。   元智大学“中华典籍资料库”的主持者罗凤珠在文学和资讯方面都颇有造诣。该网站设计从一开始就制定了独特的设计理念。网站成员包括计划主持人罗凤珠,制作群为优特资讯科技股份有限公司和元智计研,文学推广组包括文学顾问黄启方教授、曾永义教授,顾问陈慧如,技术指导谢清俊教授、朱四明教授,顾问德律国际专利商标联合事务所。该系统由文学领域的学者提出规划需求。再与技术人员充分讨论,最终设计出真正符合学科需求的系统。该网站不仅充分利用机科技为文学服务,在网络上为教学和学习提供rr便利,也更加展现了古典文学的多样化风貌,极好地完成了文学与、、建筑的学科整合。
  南京大学图书馆是其工作人员参与到古籍数字化的工作之中,因而不可能完全按照有关研究者的思路进行网站设计和古籍文献的处理,不可避免地会降低专业人员使用数字化古籍文献的有效性。南京大学的文学学科为国家“211工程”的重点学科,其前身中央大学、金陵大学(后又成立金陵大学中国文化研究所)有许多学富五车的学者教授,具有深厚的文化底蕴和内涵。因此,中文系师生参与古籍文献数字化这项利国利民的庞大工程,能保障古籍文献数字化之路走得更远。学校已经充分认识到兼晓古籍文献和计算机技术的人才匮乏,而注意培养这方面的专业人才。
  (二)从古籍数字化资源的建设方式看
  南京大学图书馆采用的是引进资源或者与其他单位合作实现资源共享。例如,“中国历代石刻史料汇编”即为引进的资源;而“学苑汲古高校古文献资源库”和“高等学校中英文图书数字化旧际合作计划”皆为合建而成。其中,前昔为国内高校问的合作,后者为国际间的合作共建。高等学校中英文图书数字化国际合作计划通过国际合作的方式进行数字图书馆建设与研究,是首次利用引进外资方式进行“211工程”建设。这一项目的实施将推动海量数据存储、管理、检索和多媒体处理等方面的研究工作,促使我国在大规模数字图书馆建设和信息服务领域向世界先进水平迈进,将为带动数字图书馆领域新的国际合作计划提供基础,对于改善我国高校教学科研的信息环境、建设一流大学具有重要意义。
  而元智大学的“网路展书读”由元智大学主导.采用了学校与技术公司合作开发的形式。这说明,元智大学在技术方面略胜一筹,但要想实现资源价值的最大化,进行更大规模的古籍数字化工作,合作共建、资源共享才是更好的方式。这样做,可以减少资源的重复建设,充分利用人力、物力和财力,使数字资源规模化,增加国际影响力。
  (三)从数字化古籍的内容看
  南京大学的数字化古籍有书目数据和全文资源库两种形式。例如,“学苑汲古——高校古文献资源库”主要为书目数据的合作共享,并可在此基础上实现馆际间的合作;“高等学校中英文图书数字化国际合作计划”则是对古籍的全文数字化,可进行全文检索和阅读。元智大学的“网路展书读”是全文数据库,对古籍进行了全方位的全文数字化,并开发了一系列辅助工具,从更深层次揭示了古籍内容。例如,对《红楼梦》这本古典著作,完成了人物特写、大观园平面图、戏曲音乐欣赏、红楼彩绘图、扬州红楼宴名菜食谱,以及文物图文展示等成果。
  元智大学的“中华典籍网络资料库”是将古籍数字化后放到网络上免费提供给公众使用,为教学与研究提供便利。其资源简单易用,可充分调动学习者的积极性。例如,红楼梦网路教学研究资料中心系统就可以教导上网的人作诗填词。而南京大学的数字化古籍资源丰富,但美中不足的是缺少统一性,通过“高等学校中英文图书数字化国际合作计划”数据库阅读全文,必须安装Djvu插件和tiff插件。 
  四、“网路展书读系统”设计值得借鉴之处
  (一)DIY个人平台的建立
  “网路展书读系统”最大的特色是以使用者自助式(DIY.Do It Yourself)为导向。中国古籍自动化的瓶颈,一为资料的输入,二为资料的分析整理。前者叮借人力键人或扫瞄机功能,较容易获得解决。资料的分析整理:一方面,需要专家学者投入大量时间与人力;另一方面,资料分析见仁见智,无法完全符合不同使用者的需求。冈此,提供一个简单、便捷、人性化工作平台,在网路上快速方便地取用、交换、编撰资料,进而建立个人资料库,是本系统研究的重点。
  自助式系统设计方式,除了可以节省系统设计者分析资料的时间外,其最大的优点是让使用者有更多的主控权,并使系统设计者对使用者想象空间、思辨过程的影响降到最低。读者可以自建注解眉批资料,自建艺文媒体资料,自建个人研究资料,自建教材编撰资料,补建研究论著资料,自建词文相关资料,增补唐宋词全文资料,倚声填词,避免系统设计者的主观影响,让使用者有更多的自主性,把系统的局限性降到最低。
  在当今竞争激烈的社会中,学习观念已经从阶段学习逐渐转变为终身学习。南京大学图书馆肩负着充分满足学校师生乃至华东北三省公众提高技能、扩充知识的重任。然而,每个人的需求又各有不同,这就需要数字化系统既有能基本满足需求的平台,又可以通过同类优秀网站的链接和个人编辑平台,来扩充数字化系统的资源范围,满足不同使用者的个人需求。
  (二)地理信息系统的应用
  古籍文献中有许许多多的地名,甚至一地有数名,一地的辖区范围在不同时代又各不相同。而且,由于的变迁,很多地名已经变得完全不一样,有的已经不再使用。这样,就给阅读古籍造成理解的障碍,数字化过程中对古籍中的地名规范处理起来也非常困难。因此,有必要建立一个以地理信息系统(GIS)的方式构建的古代地理信息系统。这个系统并不是简单地附上一个现代的地图,而应该正确地反映不同时代地理的变迁情况,同时辅以古代地名名称规范数据库。“中华典籍网络资料库”中的唐宋代文史综合研究资料中心就包括一个宋代的地理信息系统,使用起来非常方便,并且一目了然。
  南京大学图书馆藏有大量的方志古籍。这些方志古籍牵涉的内容众多,而要很好地、直观明了地揭示出其主要内容,完全有必要将现代地理信息系统技术移植过来,依照地方志的描述建立一套古代的地理信息系统。这样就不再只是对古籍的文字录入,而是真正地使技术服务于古籍整理,使古籍数字化内容高出原版古籍,为学习与研究提供方便。
  (三)网路讨论区的设立
  中华典籍网络资料库研究中心,秉持的信念是“文化的遗产、人类累积的知识都不是商品”,系统内之资料只提供教学、研究之用,强调资源的共享。“中华典籍网络资料库”设有类似于的网路教学讨论区,使用者可将个人心得、见解、眉批资料等置于此区,通过网路与他人交换意见,并町凄取他人置于此区之资料。
  “中华典籍网络资料库”还设有主题讨论区,可以设定一些主题,在网路上进行讨论,广纳各方意见。还可设立自由讨论区,不设定任何主题,由各使用者自由提供意见,有较多人参与之问题可移入主题讨论区。设立资源共享区,使用者可以使用网路上的任何资源,若有资源愿与大家分享时,可置于此。古籍研究者和古代文化爱好者可以在网路讨论区中交流经验,释疑答问,资源共享,各抒己见,更加有利于对古籍文化的全面和深刻理解,增强对古代文化的兴趣。