人工神经网络在类风湿关节炎诊断中的应用
作者:陈华忠 谢忠好 曾碧新
【摘要】 目的:应用BP人工神经网络原理,设计一种类风湿关节炎疾病诊断的方法。方法:选用对类风湿关节炎敏感的8个指标,作为BP人工神经网络的输入数据,对样本进行训练和预测。结果:BP人工神经网络经通过对150例样本的运算,训练集的113例样本,训练正确率为97.4%;预测集的37例样本,预测正确率为91.9%。结论:BP人工神经网络能为类风湿关节炎作出较准确的诊断,能提高诊断的客观性。
【关键词】 人工神经网络; 类风湿关节炎; 预测
类风湿关节炎(Rheumatoid arthritis ,RA)是一种以关节滑膜发生慢性炎性病变的自身免疫性疾病,其病程多呈进行性进展,致残率高,治愈率低下[1],早期临床表现不典型,单项自身抗体检测的灵敏度和特异性均有不足,类风湿因子的检出率也偏低,容易造成误诊[2,3]。因此医务人员主要是通过敏感性互补的几个检验指标和临床表现对类风湿关节炎作出诊断[4],但在疾病的诊断中往往带有很多的主观因素。近年来发展起来的人工神经网络是种理论化的数学模型,是模仿人脑神经的网络结构及其功能而建立起来的一种信息处理系统,具有自行学习、联想记忆、错误容纳和强大的非线性处理能力[5]。因此人工神经网络常常被应用到临床医学疾病的诊断上。本研究结合类风湿关节炎诊断的8个主要指标,设计一种基于人工神经网络类风湿关节炎的诊断方法,通过对150例样本的网络运算,探讨了人工神经网络对类风湿关节炎诊断的可行性。
1 人工神经网络基本原理
人工神经网络可以通过对外界信息的学习,以特定的方式对这些信息进行处理和概括,从而具备了对这些信息的识别功能,并产生了一个相对应的结论。因此,再次给人工神经网络这样一个相似的条件时,神经网络就会根据已学到的知识,自行推理判断,得到一个我们需要的结果。
1.1 人工神经元
人工神经元是组成人工神经网络的基本处理单元,简称为神经元。如图1显示了一个具有r个输入分量的人工神经元模型[6]。
图1中p(r=1,2,…,r) 为该神经元的输入数据;Wr 为该神经元分别与各输入数据间的连接强度,称为连接权重,权重值的大小代表上一级神经元对下一级神经元的影响程度。b为该神经元的阈值,f(x)为作用于神经元的激励函数,通常采用的是S 型函数,其数学表达式见式(1)[7]:
f(x)=(1+e-Qx)-1(1)
a为神经元的输出数据。神经元将接收信息pi与连接权重wi 的点乘积求和构成其总输入, 在神经元阈值b的作用下经函数f(x)的作用,产生信号输出a。
图1 人工神经元模型
1.2 人工神经网络
人工神经网络是由多个不同的神经元连接而成,一般含有多个层次,每个层次又包含了多个神经元,上一层次的神经元只能对下一层的神经元产生作用,同层神经元间无相互作用[7]。根据神经元的不同连接方式,就形成了不同功能的连接网络模型。比如BP神经网络,Kohonen神经网络,Hopfield神经网络等等,多达数十种。在医学中应用比较广泛的是BP神经(Back Propagation),也就是误差逆向传递网络[8],本研究中采用的也是BP神经网络。BP神经网络一般由输入层,隐含层和输出层构成,其结构模型如图2所示。
神经网络输入层的神经元是接受外界信息的端口,不包括数据运算功能,他将外界的输入数据通过一个连接权重传递给下一隐含层的神经元。隐含层是神经网络的核心部分,数量上可以有一个或多个层次,随着层次的增多,网络结构变得更复杂,网络数据处理功能也增强。网络的最后一层是输出层,输出层接收到隐含层的各项信息,然后经过转换把信息传给外界。
输入层 隐含层 输出层
图2 BP人工神经网络模型
1.3 人工神经网络工作原理
为了解决临床上对疾病的预测或识别等问题,神经网络主要是通过学习来获取"知识"或"经验"的,这一过程总体上可分为训练和预测两个阶段。所谓训练就是形成一种病因与疾病之间的函数映射关系,即给定一个实际输出与期望输出的目标误差值,将病人的各种病因、实验室检查、影像超声检查、临床表现等作为网络的输入信息加到其输入端,输入信息经过隐含层神经元的处理后,传递给输出层。如果输出层得到的结果大于预先给定的误差目标值时,神经网络将这种误差信号沿原来的传递路线逐层返回,并调节各个层次间神经元连接的权重值,这种过程不断交替进行,直到误差达到目标值时,训练过程结束。经过训练可使疾病的各种情况分布到连接权上, 使学习后的网络权重值存储了临床症状和疾病类型等相关的知识,此时可以认为神经网络建立起了病人的各种因素与该病人是否患有某种疾病的映射关系,这种映射关系就是一个预测疾病的判别函数。预测就是检验判别函数的可靠程度,利用一些未包括在训练集中的样本构成预测集,将预测集中与疾病相关的数据输入到训练好的网络中去,在训练阶段所得到的判别函数的作用下,就可以得到一个测试结果,从网络的输出端就可以诊断病人是否为疾病患者。
2 人工神经网络诊断类风湿关节炎实例
2.1 病例选取及变量确定
实验数据来源于哈尔滨医科大学附属医院,总共有150例。其中类风湿关节炎患者83例,女71例,占85.5%;男12例,占14.5%。年龄范围为20~79岁,平均年龄为48.92岁。所有患者均符合1987年美国风湿病协会修订的类风湿关节炎诊断标准。用来作正常对照的有67例,其中女62例,占92.5%;男5例,占%7.5,年龄范围为18~79岁,平均年龄为43.63岁。病人资料主要包括临床症状与体征,相关实验室检查,相应影像学检查。
根据中华医学会风湿病学分会制定的类风湿关节炎诊断指南,典型的类风湿关节炎按照1987年美国风湿病协会修订的类风湿关节炎诊断标准来诊断并不困难,但某些不典型、早期类风湿关节炎,常常被误诊或漏诊。2008年,胡勇等[9]通过研究发现,抗CCP抗体对类风湿关节炎的敏感性和特异性分别为80.0%和93.7 %,联合抗CCP抗体和RF可以提高诊断的准确性,对类风湿关节炎的早期诊断有重要意义。因此为了提高神经网络诊断各种类型类风湿关节炎的准确率,我们选取了x1(关节晨僵)、x2(对称性关节炎)、x3(腕、掌指或者近端指间关节至少有一个关节肿)、x4(3个或者3个以上关节部位肿)、x5(关节X线改变)、x6(皮下结节)、x7(RF )和x8(抗CCP抗体)这8个指标来作为神经网络运算的输入数据。其中x1、x2、x3、x4、x5、x6和x7这几个输入数据是1987年美国风湿病协会修订的类风湿关节炎诊断标准所包含的内容,x8是为了提高对不典型、早期类风湿关节炎的诊断所采用的输入数据。上述x1、x2、x3、x4、x5、x6是定性变量(离散变量),临床上常用阳性和阴性来描述,实验中用1和0对这些变量进行赋值,当变量值为1时表示阳性,为0时表示阴性;而变量x7、x8是定量变量(连续变量),用原始数据来描述。
2.2 确定训练样本及预测样本
在以上150例样本中(83例类风湿关节炎和67例正常对照)中分别选取63例类风湿关节炎和50例正常对照的样本,用来组成训练集,并用1~113的数字对其进行顺序编号,1~63号代表是类风湿关节炎,64~113号代表的是正常对照组的样本。剩余的样本用来组成预测集,集中样本总数为37例,其中类风湿关节炎患者有20例,正常对照组有17例,也用同样的方法进行编号。训练集与预测集样本比例大约为4:1。
2.3 网络参数的设定及算法程序
首先对神经网络参数设定如下:输入神经元个数为8,输出神经元个数为1,期望目标输出值用0表示正常,用1表示类风湿关节炎,隐含层采用tansig函数。训练次数为6000次,训练目标为0.06,学习速度为0.05,网络连接权重初始值是[-1,1]之间的随机数,其次网络进行运算所采用的是批动量梯度下降算法,应用MATLAB6.5来编写该程序算法。
2.4 训练及预测结果
将训练集样本的8个指标输入到BP网络的算法程序中,网络经过500次的训练后,达到了训练目标的要求,训练结果如图3所示,预测输出以0.5为阈值,>0.5者为类风湿关节炎患者,<0.5者为正常对照样本。