脑白质病变MRI视觉分级方法的比较
作者:张秋娟,杨军乐,郭佑民,姚晓新,徐敏,张静,白芝兰
【摘要】 目的:比较7种常用的脑白质病变(WMLs)MRI视觉分级方法,评价各分级之间的相关性和一致性,并两两间相互转化的参数. 方法:随机选取50例MRI T2?FLAIR显示有不同程度WMLs患者,由两名医师分别用7种分级方法对其WMLs进行评分. 视觉分级间的相关性评价采用Spearman 等级相关分析,不同评估者之间的一致性分析采用Kappa检验,通过回归分析计算各分级间相互转化的参数. 结果:不同视觉分级在WMLs评分上均有较强的相关性(相关系数rs: 0.579~0.917, P<0.05). 除Schelten(modilified)分级和Ylikoski分级外,其它分级在不同观察者间的一致性好(κ>0.585). 除Aharon?Peretz J分级和De Groot JC分级外,通过回归分析得出了其它5个分级间相互转化的参数,其确定系数R2的范围为0.5856~0.8892. 结论: 7种不同白质病变的MRI视觉分级间有较好的相关性,而不同评估者间Aharon?Peretz J分级的一致性最好.
【关键词】 脑白质病变;磁共振成像;视觉分级
0引言
脑白质病变(white matter lesions,WMLs),也称脑白质疏松,指CT或MRI T2WI上双侧脑白质内斑片状或弥漫性低密度或高信号病灶. 65岁老年人中CT或MRI上WMLs发生率较高,尤其是在脑血管病、认知损害及运动障碍的患者中. WMLs的临床意义目前仍不清楚,尤其是对认知功能的影响目前仍存在较大争议. 有学者认为这些争议的存在可能与评估WMLs所采用的方法不同有关[1]. 目前用于WMLs定量的方法有视觉分级和体积测量两种. 与耗时的体积测量相比较,视觉分级简单易行,更适用于多中心的大样本研究. 然而,不同的视觉分级对WMLs范围及形态学的描述,包括病变的直径、高信号区的解剖分布(脑室旁periventricular white matter lesions, PVLs或深部白质deep white matter lesions, DWMLs)等方法的不一,可能会导致因采用不同的分级方法评价WMLs而得到不同的研究结果,因此,评价WMLs不同分级间的相关性及一致性对临床进行多中心大样本研究是很有必要的.
1对象和方法
1.1对象自2005?07/2006?07,连续收集因腔隙性脑梗死或短暂性脑缺血发作而行颅脑MRI检查的患者,并从中随机选取50例伴有不同程度的WMLs, 年龄>60岁的患者,符合以下条件之一者均予以除外:①累及皮层的大范围梗死;②分水岭梗死;③颅内肿瘤;④脑出血.
1.2方法
1.2.1脑白质病变视觉分级方法采用中常用的分级方法,即Aharon?Peretz J分级[2],De Groot JC分级[3],Fazekas分级[4],Scheltens(Modified)分级[5],Ylikoski分级[6],Manolio分级[7] 和M?ntyl?分级[1] 共7种.
1.2.2图像的采集及评价采用GE Signa 1.5T磁共振行颅脑常规MR扫描. 成像序列包括T1?FLAIR, T2?FLAIR和T2WI. 层厚5 mm,层距1.5 mm. WMLs定义为T2?FLAIR,/T2WI图像上白质内边界不清、形态不规则的高信号区. 由两名相同资历的放射学医师分别采用7种视觉分级方法,独立在工作站进行WMLs评分,并记录各自所得结果.
统计学处理: 采用SPSS13.0软件包. 不同视觉分级方法在评价WMLs上其相关程度的显著性检验采用Spearman等级相关分析;线性回归模型用于不同分级间分值的相互转化,模型的预测效果用R2(范围0~1)表示;对于同一种视觉分级方法,不同观察者间的一致性评价采用Kappa检验.
2结果
2.17种不同的WMLs视觉分级方法间Spearman等级相关分析与Aharon?Peretz J分级相比较,De Groot JC分级与其他4种分级方法[Frazekas,Schelten(modilified),Ylikoski和M?ntyl?]在评价脑室周围白质病变上具有较好的相关性(rs>0.6915). Frazekas分级、Schelten(modilified)分级、Ylikoski分级、M?ntyl?分级和Manolio分级之间也有很好的相关性(rs>0.748,表1).
2.2不同的视觉分级方法间的线性回归分析Frazekas分级、Schelten(modilified)分级、Ylikoski分级、M?ntyl?分级和Manolio分级间的回归分析见表2. 利用两个参数建立的线性回归方程:Y=a+b×X. 通过方程可进行不同分级间分值的相互转化. 例如用Frazekas分级方法测得WMLs为4分,通过方程可转化为Ylikoski分级,其分值Y=-14.940+8.1400×4=17.62.表1不同的视觉分级方法间Spearman等级相关分析表2不同的视觉分级方法两两分值间的线性回归分析
2.3不同观察者间WMLs分级的一致性评价对于同一种分级方法不同观察者间的一致性检验结果见表3. Aharon?Peretz分级的一致性最高(κ=0.862),Schelten(modilified)分级(κ=0.416)和Ylikoski分级的一致性较差(κ=0.411).表3不同观察者间WMLs分级Kappa检验
3讨论
目前,WMLs的严重程度已作为血管性痴呆诊断标准及性试验的重要部分. 因此,选择一个既能准确评价又具有较好可重复性的评价方法很有必要. 常用的评价方法有视觉分级和体积测量. 后者能较准确评价WMLs的范围,更易显示WMLs的进展[8]. 但体积测量需借助数字化的MRI数据、专门的计算机软件和设备,而且耗时,这使其在以人群为基础的大样本研究或多中心的临床试验中的应用受到一定限制. WMLs的视觉分级不需专门的计算机软件,可在CT或MRI胶片上进行,应运简单、快速,尤其适用于临床多中心研究或流行病学研究.
根据内容WMLs视觉分级分为3类:①评价脑室周围WMLs(PVLs):Aharon?Peretz J分级和De Groot JC分级;②分别评价脑室周围(PVLs)和脑叶深部白质(DWMLs):Fazekas分级、Schelten(modilified)分级、Ylikoski分级和M?ntyl?分级;③综合评价脑白质病变:Manolio分级. 我们的结果显示各分级间均有较好的相关性(rs>0.5; P<0.05). 对于PVLs,De Groot JC分级与M?ntyl?(PVH)分级的相关系数最大(rs=0.823,P=0.0030). 其余5种方法中,M?ntyl?分级和其他分级之间的相关性极好(rs>0.8). 通过线性回归分析得出了不同方法间分值转化或预测的相关参数,确定系数R2最大为0.8892,最小为0.5856.
对于每个分级方法,除了要考虑与其他方法之间的相关程度外,还应注意每个方法的可重复性和可操作性. 我们发现Aharon?Peretz 分级在不同测量者间的一致性最好(κ=0.862),M?ntyl?分级次之(κ=0.776),Ylikoski 分级(κ=0.416)和Schelten(modilified)分级(κ=0.411)一致性较差. Aharon?Peretz 分级一致性最高可能与其评分方法简单有关. 其根据PVLs发生部位分为5级,不论病变的范围或程度. 遗憾的是该方法仅评价PVLs,未涉及DWMLs,故不能全面反映WMLs程度. M?ntyl?分级方法在不同测量者间的一致性仅次于Aharon?Peretz 分级(κ=0.776),而且与其他方法之间呈高度相关(相关系数rs>0.8). 与Aharon?Peretz分级不同的是,M?ntyl?分级根据WMLs的形态和范围分别对PVLs和DWMLs进行评价,两部分之和为总体WMLs评分. 但该方法在评价DWMLs时未考虑病变部位及数目. 有研究表明皮层下高信号病灶的数目较同体积单发病灶更能反映白质联络中断的范围[9]. 尽管Schelten(modilified)分级在不同测量者间的一致性较差,但该方法克服了Aharon?Peretz分级和M?ntyl?分级的不足,在评价WMLs时不仅考虑病变的大小及部位,而且同时评价DWMLs数目. 有研究表明Schelten(modilified)视觉评分与WMLs体积之间有很好的相关性 [10],提示该方法对WMLs评价可能更为准确.
总之,7种WMLs分级方法在评价WMLs中各有其优缺点,而且不同方法之间均有较好的相关性. 我们建议应根据研究的侧重点不同来选择适当的分级方法. 对于多中心研究,选择一致性较好的M?ntyl?分级或Aharon?Peretz分级;如果要纵向观察WMLs的进展及其与临床表现之间的关系,选择Schelten分级(modilified)可能更敏感. 需要指出的是我们研究的主要目的是评价不同方法间的一致性,未能与体积测量或白质病变的病理改变相联系,故不能判断各分级方法在评价WMLs方面的准确性. 进一步需要研究的是WMLs视觉分级方法与体积测量或临床表现之间的相关性,明确视觉分级方法的准确性.
致谢感谢西安市中心提供实验条件.
【】
[1] M?ntyl? R, Erkinjuntti T, Salonen O, et al. Variable agreement between visual rating scales for white matter hyperintensities on MRI: Comparison of 13 rating scales in a poststroke cohort [J].Stroke, 1997, 28:1614-1623.
[2] Aharon?Peretz J,Cummings VL, Hill MA. Vascular dementia and dementia of Alzheimer type: Cognition, venticular size, and leuko?araiosis [J].Arch Neurol, 1988, 45:719-721.
[3] De Groot JC, de Leeuw FE, Oudkerk M, et al. Cerebral white matter lesions and cognitive function. The Rotterdam Scan Study [J].Ann Neurol, 2000, 47:145-151.
[4] Franz F, John B. Chawluk, Abass A, et al. MR signal abnormalities at 1.5 T in Alzheimer?s dementia and normal aging [J].AJNR Am J Neuroradiol, 1987, 8: 421-426.
[5] Scheltens P, Barkhof F, Leys D, et al. A semiquantitative rating scale for the assessment of signal hyperintensities on magnetic resonance imaging [J].J Neurol Sci, 1993, 114:7-12.
[6] Ylikoski R, Ylikoski A, Erkinjuntti T, et al. White matter changes in healthy elderly persons correlate with attention and speed of mental processing [J]. Arch Neurol, 1993, 50:818-824.
[7] Manolio T, Kronmal R, Burke G, et al. Magnetic Resonance abnormalities and cardio?vascular disease in older adults: The cardiovascular health study [J].Stroke, 1994, 25:318-327.
[8] Prins ND,van Straaten ECW,van Dijk EJ, et al. Measuring progression of cerebral white matter lesions on MRI: Visual rating and volumetrics [J].Neurology, 2004, 62:1533-1539.
[9] Zhang QJ, Guo YM, Zhang GJ, et al. Correlative factors of cognitive impairment in patients with lacunar infarcts [J]. Acad J Xi?an Jiaotong Univ,2007,1:86-90.
[10] Kapeller P, Barber R, Vermeulen RJ, et al. Visual rating of age?related white matter changes on magnetic resonance imaging scale comparison, interrater agreement, and correlations with quantitative measurements [J].Stroke, 2003, 34:441-445.