类风湿性关节炎中医证候诊断中特征信息的选择
作者:李建婷,邓兆智,郭新峰,余煜棉
【摘要】 【目的】利用机模式识别法从类风湿性关节炎(RA)中医证候的众多症状、体征等指标中筛选出每个证候最有效的特征性信息,使RA证候的诊断更为规范化。【方法】将RA患者的症状、体征等54项指标输入计算机,通过马氏距离判别法筛选出有效指标。【结果】根据54个变量的权重值大小以及T检验结果,经过反复试验,表明17个变量判别准确率最高(马氏距离判别法),达96?5%。【结论】计算机模式识别法对RA证候的判别结果与临床诊断基本一致,提示该法能使中医的辨证分型诊断在保持中医特色的前提下得以标准化和规范化。
【关键词】 关节炎,类风湿; 证候; 计算机模式识别法; 特征参量
类风湿性关节炎(RA)的发生是多种致病因素共同作用的结果,其病机复杂,病情反复缠绵,病程冗长,证候繁多复杂且多变,临床中医辨证较难准确掌握,妨碍了辨证技能和临床疗效的提高。我国卫生部药政局颁布的“中药新药临床研究指导原则”[1]对RA制订了7种中医证候的分类标准,无疑对RA的临床研究有—定的指导意义,为了使RA中医证候建立在更为严格的、的基础上,更好地指导临床诊疗,我们拟应用计算机对RA的证候诊断中最有效的特征信息进行筛选。现将结果报道如下。
1研究对象与方法
1?1诊断标准西医诊断标准按1987年美国风湿病学会制定的RA诊断标准。中医证候分类依据《中药新药临床研究指导原则》[1]、《实用中医风湿病学》[2]、《中医证候诊断学》[3]等相关标准制定。
1?2病例来源广州中医药大学第二附属风湿病专科连续收治的242例类风湿性关节炎病例。
1?3调查方法编制类风湿性关节炎中医证候调查表,记录患者的相关中医症状、体征、关节功能分级、实验室检查(包括骨关节X线、类风湿因子、抗“O”、血沉、免疫五项、肝肾功能及其他血液生化指标)。中医症状、体征分为无、轻、中、重4级,中医辨证采用3级医师负责制,由住院医师先进行望、闻、问、切四诊,根据诊断标准判别证型,再由主治医师、主任医师分别进行证型诊断,最后统一意见。
1?4统计学方法将上述数据输入计算机,用Dbase进行数据管理,用既往课题组研制并经过验证的用BASIC语言编制的模式识别软件(广东大学余煜棉编制的判别分析使用马氏距离算法)[4-5],结合指标的权重值大小进行统计分析,并与临床判断进行比较。权重值的大小由计算机根据各个变量在分类中的作用与积累贡献率大小自动计算出。
2结果
2?1一般资料242例患者中,男69例,女 173例;年龄15~72岁,平均46?5岁;工人 96例,干部45例,农民40例,其他职业61例。病程最短6个月,最长19年,平均6?2年。按病情进展分级 (放射性分级):Ⅰ级 118例,Ⅱ级 86例,Ⅲ级38例;功能分级:Ⅰ级 135例,Ⅱ级71例,Ⅲ级 36倒 。以202例作为训练样本,40例作为预报样本:其中寒热错杂证候训练样本45例,预报样本12例;寒湿阻络证候训练样本41例,预报样本13例;气阴两虚证候训练样本39例,预报样本8例;湿热阻络证候训练样本41例,预报样本3例;痰瘀阻络证候训练样本36例,预报样本4例。
2?2指标的权重值RA最常见的54个症状体征(1.关节红,2.关节肿,3.触热,4.酸痛,5.刺痛,6.冷痛,7.活动后痛,8.麻胀,9.拘急,10. 晨僵,11.强直变形,12.结节红斑,13.重着,14.怕冷,15.喜暖,16.自觉发热,17.屈伸不利,18.局部紫黯,19.功能,20.X线摄片,21.发热,22.恶风寒,23.口渴,24.烦热,25.遇天冷湿发作,26.面色白,27.面色晦暗,28.眼睑浮肿,29.五心烦热,30.咽干,31.失眠多梦,32.眩晕,33.盗汗,34.午后潮热,35.倦怠,36.气短乏力,37.易汗,38.眼干,39.口干不欲饮,40.手足不温,41.胸脘满闷,42.纳差,43.遗精,44.月经量少,45.肌肤无泽,46.形体消瘦,47.腰膝酸软,48.耳鸣,49.尿黄,50.尿频,51.夜尿,52.大便烂,53.大便溏,54.大便干)的权重值见表1。所谓变量在分类中的贡献大,是指该变量能使不同类的样本点在多维模式空间中分隔得远,而使同一类的样本点靠得近,所以权重因子为该变量的组间偏差与组内偏差之比。组内偏差大相应于类内点的弥散度大,组间偏差小相应于类与类在空间上的差别小。所以权重值大小能反映该变量是否能使“物以类聚”,也就是反映了该变量在分类中的作用与贡献。权重值愈大,所含疾病的信息量愈多,对疾病的证候诊断愈重要。权重因子可增强对分类有明显贡献变量的作用和削减那些对分类贡献较小的变量的影响,从而改善分类效果,使性更明显。通过这种方法,可使RA中医证候中各类证候的特征性信息更明显,即依靠计算机选出特征参量,提高临床判断准确率,使RA证候的诊断更为规范化。
2?3特征参量的决定根据54个变量的权重值大小以及T检验结果,对变量进行筛选,经过反复试验,结果表明17个变量判别准确率最高(马氏距离判别法),达96?5%,筛选出以下17个指标作为RA的分类特征参量:关节肿(X1)、触热(X2)、晨僵(X3)、强直变形(X4)、结节红斑(X5)、怕冷(X6)、喜暖(X7)、自觉发热(X8)、屈伸不利(X9)、局部紫黯(X10)、功能(X11)、X线摄片(X12)、口渴(X13)、遇天冷湿发作(X14)、倦怠(X15)、眼干(X16)、便溏(X17)。
2?4各特征参量对分类判别的影响减少某一因素后其余16因素对全体样本的判别率和各证候的判别率来判断该因素对各类型样本和总体样本判别的影响程度,见表2。
表2结果表明,对整体样本证候判别影响较大的因素为X8(自觉发热)、X6(怕冷),去掉此二因素时判别率最低,分别为89?60%、89?11%,说明自觉发热、怕冷对整体样本的证候判别作用最大,其次是X1(关节肿)、X2(触热)、X3 (晨僵)、X10(局部紫黯)、X15(倦怠)等,说明这些指标对证候整体判别的贡献稍小。
各类证型中对判别影响较大的因素:①寒热错杂:分别去掉X6(怕冷)、X2(触热)、X3(晨僵)、X8(自觉发热)时,剩余16因素对寒热错杂的判别率分别为86?67%、93?33%(后3项),可见怕冷、触热、晨僵、自觉发热对判别寒热错杂最重要。②湿热阻络:分别去掉X14(遇天冷湿发作)、X10(局部紫黯)、 X8(自觉发热)、X3(晨僵)时,剩余16因素对湿热阻络的判别率分别为87?80%、90?24%、92?68%(后两项),可见遇天冷湿发作、局部紫黯、自觉发热、晨僵对判别湿热阻络最重要。③气阴两虚:去掉X1(关节肿)时,剩余16因素对气阴两虚型的判别率为79?49%,分别去掉X6(怕冷)、X9(屈伸不利)、X15 (倦怠)、X16(眼干)时剩余16因素对证型的判别率分别为82?50%;84?62%(后3项),可见关节肿、怕冷、屈伸不利、倦怠、眼干对气阴两虚的判别意义较大。④寒湿阻络:分别去掉X6(怕冷)、X8(自觉发热)时,剩余16因素对寒湿阻络的判别率均为92?68%,可见怕冷、自觉发热对判别寒湿阻络最重要。⑤痰瘀阻络:分别去掉X6(怕冷)、X8(自觉发热)、X1(关节肿)、X2 (触热)、X4(强直变形)时,剩余16因素对痰瘀阻络的判别率为86?11%、80?56%、91?67%、94?44%(后两项),可见怕冷、自觉发热、关节肿、触热、强直变形对判别痰瘀阻络最重要。2009年第26卷广州中医药大学学报表2各因素对判别的影响
3讨论
计算机模式识别技术是国内外近年来广泛应用的建立在计算机技术和多元统计分析基础上的一种非函数的方法。这种技术避免建立因素(变量)间的严格的数学关系,采用一定的数学统计手段去研究由数据组成的高维空间,寻找,为进行聚类、判别、预报等研究的新型统计手段。人类自身只能识别三维以下空间样本点的聚集状态,对于三维以上空间的识别要借助多元统计分析技术,计算机模式识别技术就是其中一种十分有效的研究高维空间的手段。它借助于计算机技术将高维空间的样本点分布,利用一定的数学模型降维到人类能判别的一、二、三维空间上,让人们对样本点进行比较、判别及预报等研究,进而探讨变量间的关系。
马氏距离法是设有3个母体G1、G2和G3,均有m个特征值,分别有n1、n2、n3个样本,对这些已知分类样本数据进行识别学习,通过计算找出各类样本在高维空间的重心,建立判别函数(或规则),然后计算待判未知类别的样本点到各类“重心”的马氏距离,将待判样本判为距离短的那一类;或者将各已知分类的样本点从高维空间降维到二维平面上形成各类样本的二维区域,待判样本判为所落在区域的那一点。将已知分类的样本的多维空间数据(症状及生化、免疫、微量元素等指标)作为母体,按照一定数学模式降维到某一“平面”上,其优点在于因判别函数和判别规则并不牵涉到分布的类型,可以不要求母体为正态分布,具有广泛的实际意义[6]。
本研究通过对RA患者的临床症状、体征定性定量,将从RA的54个症状、体征等指标筛选出的17个因素作为特征参量时其分类最好,并采取减少某一因素后计算其判别率的方法判断17个因素对各类型样本和总体样本判别的影响程度,进行多因素分析,寻求其规律性。结果表明,自觉发热、怕冷、关节肿对整体样本的证候判别作用最大,其次是触热、晨僵、局部紫黯、倦怠等。而在各类证候中,怕冷、触热、晨僵、自觉发热对判别寒热错杂最重要;遇天冷湿发作、局部紫黯、自觉发热、晨僵对判别湿热阻络最重要;关节肿、怕冷、屈伸不利、倦怠、眼干对气阴两虚的判别有显著意义;怕冷、自觉发热对判别寒湿阻络最重要;怕冷、自觉发热、关节肿、触热、强直变形对判别痰瘀阻络最重要。以上研究结果与临床诊断基本一致,说明应用该法对症状、体征等指标进行因素分析后,能阐明症状、体征对于证的贡献度;通过不同水平的剔选及比较,能确定有关因素对RA各种证候判别的作用和意义。本研究中计算机模式识别法对RA证候的判别结果与临床诊断基本一致,提示该法有利于中医对RA辨证分型诊断在保持中医特色的前提下得以标准化和规范化。
【】
[1]国家食品药品监督管理局.中药新药临床研究指导原则(试行)[S]. 北京:医药科技出版社,2002:5.
[2] 路志正,焦树德.实用中医风湿病学[M].北京:人民卫生出版社,1996.
[3] 程绍恩,夏洪生.中医证候诊断学[M]. 北京:技术出版社,1995.
[4] 邓兆智.不同证型类风湿性关节炎患者发样微量元素水平及其相关分析[J].中医杂志,1994,35(12):743.
[5] 刘俊,余煜棉.计算机模式识别法对关节变形强直性脊柱炎微量元素谱的研究[J].广东微量元素科学,2001,8(9):46.
[6] 张尧庭,方开泰.多元统计分析引论[M].北京:科学技术出版社,1982:194