中药科技基础信息数据库的研究与应用

来源:岁月联盟 作者:刘岩 时间:2015-05-19

【关键词】  数据库;中药科技基础信息库;中药知识挖掘

“中药科技基础信息数据库”的建库理念是建立可提供结构型、规范性标准化中药科技基础数据,支持用户多用途、多途径、多层次检索查询、中药数据挖掘的结构型中药基础数据库,为中医药科研、临床、教育、管理、生产开发等各类人员提供中药单味药、中药资源品种、中药化学成分、中药药理、中药临床药理、中药毒理、炮制品等规范化的基础数据,可进行关联查询的新型检索工具。

  1  中药科技基础信息数据库的结构

  1.1  中药科技基础信息数据库远程录入程序

  中药科技基础信息数据库目前有8张库表,即:单味药、品种、生药材鉴定、中药药理、中药毒理、中药临床药理、化学成分、炮制品,分别设有:14、17、26、30、18、26、27、14共172个字段。每张库表即可成为一个独立的个体,又与各表间有着一定的内在关联,使之成为一个有机的整体。

  中药科技基础信息数据库结构以“单味药”为主表,二级表有:品种、生药材鉴定、中药药理、中药毒理、中药临床药理、化学成分、炮制品。
    该库远程编辑加工的界面能够在很大程度上组织起一个中医药信息系统,容纳了中草药中的大量知识。该系统设计了远程录入程序botany,这个程序采用了不同的数据库结构,具有较强的容错性,提供数据的远程录入和维护、多用户分级分权限管理、表查询字段管理、人员录入工作量统计等功能。

  1.1.1  标准表的建立 

  在中医药数据中,存在着一些专用的标准词汇,对这些词汇的引用和管理一直以来没有很好的技术支持。为此,该系统设计开发了标准表管理程序,提供了对标准数据的统一管理和规划。其功能包括标准表的创建,标准表的删除以及对标准表数据的添加、删除、修改以及向标准表中批量导入输入。

  基于中药科技基础信息数据库的结构数据关系我们建立了33张标准表,标准表的设立引导了与关联数据项的关联。见表1。表1  中药科技基础信息库的标准表(略)
 
  1.1.2  数据来源 

  以“中药数据库”为基础数据,以权威工具书《中华本草》、《中华人民共和国药典》、《中国常用中药材》、《中国药材学》、《中药现代研究与临床应用》、《现代中药栽培养植与加工手册》、《常用中药成分与药理手册》、《植物活性成分辞典》、《天然活性成分简明手册》、《中药炮制学》以及普通高等教育中医药类规划教材为数据依据。

  1.1.3  质量控制 

  该课题组先后制定了“中药基础库界面编辑标准”、“中药基础库操作手册”、“中药药理补充说明”、“中毒理及中药临床药理样本”、“中药炮制学说明”、“中药炮制学加工工艺标准”,为数据制作奠定了基础。

    中药科技基础信息库的完成数据量:单味药11 013条、化学成分5 944条、品种8 199条、生药材鉴定4 350条、中药药理5 407条、中药临床药理632条、中药毒理1 160条、炮制品375条,总计37 080条。

  1.2  中药科技基础信息数据库导入程序

    本系统为面对管理人员的管理系统(Magic)。目前支持导入远程录入的有8张表:“单味药、化学成分、品种、生药材鉴定、一般药理、一般临床药理、一般毒理、炮制品”。登陆以后进入主界面,选择需要导入的表,就进入相应表的导入界面。每个表的导入界面都是一样的:最上面是一些筛选条件,用来选择需要导入的记录;中间是将要导入的记录,为了简单起见(远程界面提供添加、修改、删除全套功能),只显示了1个ID、1个相关字段(如中药名称等)和一些附加信息(录入人员、状态标志等);最下面是记录导入的统计和控制。在导入时要先填入筛选条件,然后点击统计生成要导入的记录集,才能进行数据的导入。

    此外,Magic附带了统计录入人员工作量的功能,在主界面点击统计工作量即可。

  1.3  中药科技基础信息数据库导航系统

    中药科技基础信息数据库的导航系统包含了几十张大型复杂的数据表,其拓扑结构之复杂、数据格式的多样化以及表与表之间的关系纷繁错杂是中医药学科固有的特性。为了能实现这些表数据之间的导航,设计了BaseView网页导航系统。该系统将错综复杂的表结构及其关系通过网页联接起来,实现了数据相关性的良好导航。

    该导航系统查询是以查询类别对应相应的查询内容的导航系统,可以进行精确与模糊两种查询。查询类别设有“单味药、品种、炮制品、药理作用、化学成分”。查询单味药主表可直接查询到11个相关联关系。
   
  从查询类别五大板块查询,可查询与五大板块相对应的每个主题的关系项,如“单味药”对应本库表14项与之关联的内容。以此类推,“品种”对应本库表17项、“炮制品”对应本库表14项、“中药药理”对应本库表30项、“中药化学成分”对应本库表27项,这样查询点共有102个。与102个查询点相关联的库表可进行系列关联查询。

图片内容