小波神经网络在肿瘤预后中的应用研究

来源:岁月联盟 作者:王阿明 柳红 时间:2010-07-12

【摘要】  介绍了小波神经模型,给出了相应的算法和公式。将小波神经网络模型用于肿瘤患者预后研究。结果表明,与传统BP网络相比,小波神经网络具有较快的学习收敛速率,在肿瘤患者预后方面具有良好的应用前景。

【关键词】  小波变换; 神经网络; 模型; 预后

  肿瘤患者预后是一个多因素相互作用的复杂问题,各因素之间一般为非线性关系。由于其间的函数关系解析形式难以把握肿瘤的多种类型以及多种相关因素,使得现有的预测在准确性和实用性方面都存在着局限性。人工神经网络的成就表明它特别适合于处理不确定性和非结构化信息,和统计模式识别方法相比,具有抗干扰能力强、能自适应学习、能把识别处理和若干预处理融为一体来完成等优点,因此其应用非常广泛。P.B.Snow等用BP神经网络对结肠癌患者后的存活期进行预测[1],其算法主要是利用梯度搜索技术使代价函数最小化。此类网络存在一些局限性,如隐层单元数目难以确定、收敛速度较慢且有可能收敛于局部极小点等等。近年来,将小波变换与神经网络相结合构成的小波神经网络(Wavelet neural networks, WNN)展示了良好的网络性能[2~5]。利用WNN研究肠癌患者术后存活期预测问题,仿真结果表明该模型能较好地反映疾病程度与术后存活期之间的关系,因此在肿瘤患者术后存活期预测方面具有良好的应用前景。

  1  小波神经网络模型

  WNN是近年来神经网络研究中的一个新的分支,是将小波变换理论与人工神经网络理论相结合而构造的一种新的神经网络模型。WNN中第n个样本的输入为Xn={xni},i=1,2,…,L,网络的输入为Yn={ynk},k=1,2,…,S,对应的目标输出为Dn={Dnk},k=1,2,…,S,n=1,2,…,N,N为样本总数。输出层单元数为S输入层单元数为L,中间层为小波变换层(单元数目为M),Vji表示中间层第j单元与输入层第i单元之间的连接权,Ukj表示输出层第k单元与中间层第j单元之间的连接权。利用当前网络参数的输出为:Ynk=∑M     j=1UkjΨ∑L     i=1VjiXni-bj     aj(1)误差函数E:E=1     2N∑N     n=1 ∑S     k=1(Ynk-Dnk)2(2)可以求出误差函数E的各种导数:?E     ?Ukj=1     N ∑N     n=1(Ynk-Dnk)Ψ∑L     i=1VjiXni-bj     aj(3)?E     ?Vji=1     N ∑N     n=1 ∑S     k=1(Ynk-Dnk) Ukj?Ψ(T)     ?T Xni     aj(4)其中  T=∑L     i=1VjiXni-bj     aj?E     ?aj=1     N ∑N     n=1 ∑S     k=1(Ynk-Dnk) Ukj?Ψ(T)     ?T (-∑L     i=1VjiXni-bj     a2j)(5)?E     ?bj=1     N ∑N     n=1 ∑S     k=1(Ynk-Dnk) Ukj?Ψ(T)     ?T (-1     aj)(6)取Ψ(x)为Morlet小波,该小波为余弦调制的高斯波,时域频域同时具有较高分辨率。Ψ(x)=cos(1.75x)exp(-x2     2)(7)则?Ψ(x)     ?x=-[xcos(1.75x)+1.75sin(1.75x)]exp(-x2     2)(8)按共轭梯度下降学习算法有:Uii+1kj=Uiikj-α?E     ?Uiikj+ε(Uiikj-Uii-1kj)(9)或写成:ΔUii+1kj=-α?E     ?Uikj+εΔUiikj(10)Uii+1kj=Uiikj+ΔUii+1kj(11)类似地可以给出Vii+1ji、aii+1j和bii+1j的迭代公式,按这些迭代公式逐次学习,直至满足误差要求(或达到最大学习次数)。

  2  数据处理和结果

  2?1  资料收集及处理病例资料取自徐州医学院病理教研室1987~1997年外检档案中手术切除的结直肠癌标本195例,对其进行随访研究,获得具有完整随访研究结果的病例资料65例。根据《全国大肠癌病理研究统一规范》的标准复查全部HE切片,观察结直肠癌的组织学类型、生长方式、间质纤维组织增生(有或无)和淋巴细胞浸润等,进行免疫组织化学实验,检测大肠癌患者的多种免疫组化因素。在此基础上,建立患者病情诊断资料及手术标本病理分析资料数据库。包括患者的一般情况、部位、肿瘤大小、分期、组织学类型、生长方式、浸润范围、淋巴结转移、免疫组化实验结果、其它病变等。对应的输出结果为随访所得的存活期。

  2?2  WNN训练集的选择按照用于训练WNN的数据集应该能最大限度地兼顾各种病例的原则。经过仔细筛选,取含有55个病例的集合构成WNN的训练集,含有10个病例的集合构成测试集。WNN输入层有14个单元,具体的取值是通过数据编码(对应于无或有,阴性或阳性)和实验测试所得数据的归一化处理将输入数据变换到(0,1)区间。将随访所得存活期按是否超过5年为标准分为两类,输出为1个单元,输出值分别为0(否)和1(是)。这样就可以建立输入输出模式对,构成网络的训练集。

  2?3  结果取WNN的各初始连接权、伸缩和平移参数为[-0.5,0.5]之间的随机数,学习参数为0?9,动量参数为0?7,按WNN模型算法编程。输入层有14个单元,输出层有1个单元。取小波变换层单元个数为12时学习效果较好。根据计算结果,可以作出误差函数E与学习次数K关系曲线,如图1所示。经260次学习训练,误差降为0?00004997。

  图1  WNN误差函数E与学习次数K关系曲线(略)

  对同样的数据样本集,用传统BP网络进行对比研究,输入层、隐层和输出层单元数目分别为14、10、1。其误差与学习次数关系曲线如图2所示,误差曲线中会存在较强震荡和较长的平台,即网络误差的局部极小点。经10000次学习训练,误差为0?0124866。利用经过如上所列学习训练过程后所得WNN模型进行测试。首先对已学习过的55例训练样本进行测试,结果表明,对已学习过的样本集,WNN模型预测成功率为100%;而对未经网络学习训练的10例样本,分别用WNN模型和BP网络模型进行测试,其结果如表1所示。如果以网络输出的最大绝对误差不超过0?25为标准,WNN模型有8例预测成功,准确率为80%。BP网络模型有7例预测成功,准确率为70%。

  图2  BP网络误差与学习次数关系曲线(略)

  表1  WNN模型和BP网络模型对10例样本的测试结果(略)

  从上述结果可知,在人工神经网络肿瘤患者预后应用方面,WNN模型学习收敛速率、预测成功率明显优于传统BP模型。

  3  讨论

  WNN能够较好地综合处理肠癌患者各项诊断指标对其术后存活期的影响。利用该模型进行肠癌患者术后存活期的预测,较好地符合了已知数据,能反映疾病程度与术后存活期之间的关系。比起传统的BP网络来,WNN学习收敛速率快,并且可以自适应地确定隐层单元数目。因此WNN为癌症患者存活期预测提供了新的途径。在传统BP网络中,存在隐层单元难以确定的不足,而WNN中间单元数目可以根据具体的问题自适应地确定小波变换单元个数,从而克服传统网络的不足。要进一步提高预测精度,就应该注意收集更多更全面的病例数据。如果我们所使用的数据越多越全面,其中所蕴含的事物本身的性就越强,利用WNN从中所抽取的函数关系就越具有普遍性,预测就更准确。

【】
    1 P.B.Snow, D.J.Kerr, J.M.Brandt, et al. Neural network and regression predictions of 5?year survival after colon carcinoma treatment. Cancer Supplement, 2001,91(8):1673~1678.

  2 Pati Y, Krishnaprasad P. Analysis and synthesis of ef feedforward neural networks using discrete affine wavelet forms. IEEE Trans. On Neural Networks, 1993,4(1):73~85.

  3 Zhang Q, Benveniste A. Wavelet networks. IEEE Trans. On Neural networks, 1992,3(6):889~898.

  4 Delgon B, Juditsky A, Benveniste A. Accuracy analysis for wavelet approximations. IEEE Trans. On Neural Networks, 1995,6(2):332~348.

  5 王阿明,刘天放,王绪?用于图像与模式识别的小波神经网络模型?矿业大学学报,2002,31(5):382~384?

  6 孙高,周宝森,等?基于人工神经网络的肺癌诊断研究?中国卫生统计,1999,16(3):142~144.