论建立中文循证医学证据知识库探要

来源:岁月联盟 作者:孙海英 时间:2010-07-05
  【关键词】循证医学 中文研究证据 知识库
  【论文摘要】论述循证医学及其证据知识库现状,建立中文循证医学证据库的意义,知识库的架构及主要技术问题。
  循证医学(evidence—based medicine,EBM)是2O世纪末产生的临床医学新兴交叉学科,一经问世,在国际、国内临床医学领域内得到了迅速发展。其核心思想是:任何医疗决策都应建立在新近最佳临床研究证据(cuITent best evidence)的基础上,即遵循证据的临床医学。目的是为了临床医疗决策的化。进入时代,信息和证据的检索日趋完善,机和决策支持以及临床实践指南不断更新,使临床证据的获得更为快速和便捷。但是我国与发达国家比较还有很大差距,在传统经验医学向循证医学转变过程中,还需要下大力气向广大临床医学工作者普及循证医学理论和方法,指导循证医学临床研究与实践。因此建立巾文循证医学证据知识库对于循证医学的普及和发展具有重要作用。
  1循证医学及其知识库发展现状
  1.1知识库及其特点
  知识库又称智能数据库或人工智能数据库,正是由于人工智能(AI)与数据库(DB)这两项计算机技术相结合才促使知识库及其系统的产生和发展。作为一种开发工具与环境,知识库为用户开发基于知识的系统提供支撑。知识库系统的核心组成部分是知识库和推理机构。知识库是以一致的形式存贮知识的机构,推理机构则是为了使用知识库藏内的知识执行推理的控制机构。
  知识库系统具有下列特点:
  ①具有支持数据库的全部功能,包括对大批量数据的高效存取以及数据共享、数据的安全性、并发控制、故障恢复等功能。
  ②具有存取知识、管理知识的功能。
  ③知识库系统的核心部分是一个推理机构,它完成对知识的处理。
  ④一般以关系数据库管理系统为基础,外加一个规则库与推理层,组成一个知识库系统。
  ⑤一个知识库系统一般应能存储与管理适量的事实与规则。
  1.2循证医学及其证据知识库的发展现状
  循证医学(EBM)的产生与随机对照试验(RCT)的问世和方法学发展密切相关。网络技术的发展起着巨大推动作用。1948年英国医学研究委员会领导开展了世界第一个临床随机对照试验,1976年美国心家Glass首次提出Mata一分析(Mata-analysis)一阐及其统计学分析方法。1982年,英国Chahners提出了累积性Mata一分析概念,从而为完成针对某一干预措施所有高质员RCT的系统评价提供了方法学支持,为循证医学的产生提供了最好的证据。20世纪70年代,英国医师Arcl1ieCocl1rafle及其同事率先进行了探索性研究,其成果RCT和系统评价的真正里程碑,1992年加拿大Mcmaster大学循证医学工作组正式在JAMA上发表文章,首次提出循证医学的概念和术语。加拿大Mcmaster大学Sackett领导的课题小组将循证医学(EBM)定义为“慎重、准确和明智地应用当前所获得的最好的研究证据,同时结合临床医生的个人专业技能和多年临床经验,考虑病人的价值和愿望,将三者完善地结合制定出病人的措施”。循证医学与传统医学的最大区别在于前者将医学研究证据放在了临床决策的首要位置,这就使得实践EBM要解决的核心问题是:如何在浩如烟海的信息、中筛选出最恰当和最优的证据。
  网络技术的发展推动着医学领域信息资源的数字化,1976年美国斯坦福大学的医学专家系统MYCIN被认为是医疗专家系统最成功的实例之一。MYCIN的成功研制,激发和鼓舞了把专家系统技术应用于医学领域的努力,特别是对医学专家系统的核心部分——医学知识库的广泛研究已经成为人工智能研究中最活跃的一个分支,推动了循证医学的迅速兴起和发展。
  1993年底,英国IaiflChamers博士创建Cochrane协作网,随后由Sackett领导Cochrane协作网生产Cochrane系统评价,建立临床研究数据库的工作,标志循证医学证据获取走上了人工智能化道路。
  随着信息高速公路和循证医学的迅速发展,数字化的信息资源成为杏找医学证据的丰要来源,EBM信息资源日趋丰富。目前,按不同的标准可对网上EBM信息资源进行不同的分类,有人按其内容分为:系统评价、临床实践指南、卫生技术评估、临床试验;也有人按其类型分为:EBM期刊、网上循证医学资源中心、EBM医学数据库、EBM元搜索引擎、临床实践指南等等。虽然目前EBM信息资源种类和数量口趋增多,但都处于一种分散的状态,不便于医学工作者的集中使用,这也正是建立中文循证医学证据知识库的原因之一。
  2建立中文循证医学知识库的意义
  2.1为数字图书馆建设增加高质量的馆藏
  佳木斯大学图书馆作为黑龙江省东部地区规模最大、设备最优、化水平最高的高校书馆,在数字化图书馆建设中已经建立了自己的特色化道路,建设了一系列特色数据库,中文循证医学证据知识库的建立,无疑将成为数字书馆馆藏的重要组成部分。与图书馆机构知识库一起,构成图书馆知识库体系。
  2.2为临床医学院师生提供知识服务
  知识服务是指向用户提供经过智能化处理的符合用户需求的知识产品。中文循证医学证据知识库所提供的循证医学知识信息、知识手段及问题解决方案,是以解决用户问题方案为直接目标的,是面对本校临床医学院师生的。中文循证医学证据知识库不仅为循证医学教学提供比较全面、系统的循证医学知识,而且为学生临床实习和教师指导实习提供科学的临床证据,促进师生实现最佳教学效果和临床实践成果。
  2.3为临床医生提供科学的临床证据
  佳大三所附属的临床医生以及黑龙江省东部地区医院的医生都可以通过网络或光盘的形式享受循证医学证据知识库的知识服务,从而为普及循证医学和推动循证医学发展做出贡献。
  3中文循证医学证据知识库的架构
  3.1知识架构
  循证医学是运用流行病学的科学方法沦解决医学各种问题而发生的一场医学实践的革命。循证医学则认为:经验远不如科学研究的知识快速和可靠,从科研中学习是第一位的,经验仅可以弥补科研知识的不足。循证医学依赖于计算机、网络通讯、互联网等技术,而循证医学临床证据知识库则是其核心。关键是临床研究证据质量及其知识体系。
  循证学知识库的知识体系可分为3个层面:
  第一层面:循证学知识的丰要方面(一级架构)包括:“基础”知识、循方法、实用知识、支持体系和其他知识。
  第二层面:循证医学荩本知识的架构(循证方法、二级架构)包含循证实践操作流程和各步骤的展开。构成循证隈学的基本知识和核心知识——循证方法。   第三层面:循证医学实用知识的架构(三级架构)是循证流程与病症的描述和处理流程的融合。包括病症表现的循证、流行情况的循证、病因的循证、危险囚素的循证、诊断的循证、的循证、预防的循证和预后的循证等。
  3.2内容的分类
  为有利于对知识库使用者提供准确快捷的临床研究证据,知识席的证据可以根据不同需要分类:
  3.2.1按研究方法分类。①原始研究证据(primaryresearchevidence);②二次研究证据(secondaryresearchevidence)。
  3.2.2按研究问题分类。①病因临床研究证据;②诊断临床研究证据;③预防临眯研究证据;④治疗临床研究证据;⑤预后临球研究证据。
  3.2.3按用户需要分类。①系统评价;②临床实践指南;③临床决策分析;④临证据于册;⑤卫生技术评估;⑥健康资料。
  3.2.4按获取渠道分类:①公开发表的临床研究证据;②网上信息;③已完成,但未公开发表的临床研究证据;④在研的临研究信息。
  3.3研究证据的来源
  由于巾文循证医学证据知识库都是中文临床研究证据信息,因此知识库临床研究证据的来源也必然都是中文数据库、、杂志、会议以及在研和未发表的临床试验等。
  目前,数据库资源中书目数据库有“生物医学文献数据库”、“巾国生物医学文献数据库”。临床研究证据专用数据库有中文循证医学图书馆(中文光盘版),由|fI围循证医学/(cochane)中心和当地软件公司共同开发制作。收录了系统评价数据库、临对照试验数据库、循证医学方法数据库、卫生技术评估数据库等循证医学一些相关知识与信息等数据库信息。网站有中国卫生部、中国疾病预防控制中心、中华医学会网站、中国循证医学中心网站等网站。此外有《中国循证医学杂志》、《循证医学》等医学杂志,还可以从围家科技图书文献中心、中国医学学术会议数据库等获取会议文献信息。
  4相关的技术问题
  4.1研究证据的采集
  研究证据的采集从两方而获取。一是由杂志、会议文献等纸质临床研究证据经过扫描、识别、标引、引人证据知识库,完成采集工作;二是直接从网络现有的数据库中检索出自己所需要的临床研究证据,经过工具软件转换后进行标引,引入证据知识库。
  4.1.1杂志文集采集流程。①书页扫描,即利用扫描仪对所需文献进行扫描;②图像处理,是指倾斜校正、去噪、剪裁、粘贴、亮度对比度调整、除装订线、内容居中等处理,目的是为了提高OCR识别率及美观整齐度;然后把一篇文章经扫描处理后的书页合并起来,存为PDF或T1F文件,生成与印本文献对应的数字对象文件。
  4.1.2网络数据库的采集流程。①手工采集:可以采用搜索引擎技术实现对网络中特色信息资源的采集。按照预先制定的检索词、检索策略,利用通用搜索引擎如lGoogle、Yahoo、Baidu等进行检索并不断调整检索策略,直到得出较为满意的检索结果,手动将所需信息进行下载、格式转换、标引、加入知识库。②自动采集:面对数量大、更新快的网络信息资源,手工采集、组织信息的方法显然不能胜任工作,通常的解决方法是利用机技术实现网络信息资源的自动采集与组织。自动采集软件对网页进行精确分析后,将信息的标题、来源、内容、发布时间等项目存入知识库。③具有访问权限的网络信息资源的采集:现有的数据库,特别是使用价值较高的数据库,大多提供网络服务方式,采用密码口令或IP地址控制的方法实现用户对这些数据库或其镜像站的访问。主要采用手工采集、转换格式和标引的方法。
  4.2研究证据知识库的发布
  4.2.1 Intemet发布。www是一种建立在Intemet上的全球性、多平台、分布式、多媒体的动态信息系统。同TELNET、GO~PHER、FTP、WAIS等相似,它也是建立在Internet上的一种网络服务。www是Internet上最快、应用最广泛也最实用的超文本信息发布系统,它将复杂的网络操作通过超文本技术和简单的协议变成了简单的“点击”,用户不需要网络知识和约定便可以容易地访问任意地点的计算机资源。为了满足用户使用的交互性,需要通过专门的手段将数据库与www连接起来,这些手段主要有CGI技术、专用API技术、JAVA/JDBC技术等。通过这些手段建立起数据库的www服务器,用户通过Internet登录到服务器上,执行浏览、检索等操作。通过In ternet发布:一是用户不需要专门设备,只需要一台计算机、一根网线就可以使用数据;二是实时数据,服务器更新后,用户不用升级直接可以得到最新信息。
  4.2.2光盘发布。由于技术的发展,无论是服务器还是个人计算机都带有光盘驱动器,可以对光盘进行读取,这使得用光盘作为媒介发行临床研究证据成为可能。一是存储量大,一张VCD光盘的容量为700MB,而DvD则达到4.7GB;二是成本低,无论是VCD还是DVD,每张盘片的价格均不高;三是保存时间长,便于携带。我们所选用的知识库建设平台里都有信息发布系统,我们可以通过知识库建设平台对所建的知识库进行发布,为用户提供服务。