ROC曲线及Logistic回归评价肿瘤标志物在胃结肠肿瘤的诊断价值

来源:岁月联盟 作者:刘靳波 时间:2010-07-12

【摘要】  目的: 探讨肿瘤标志物(TM)癌胚抗原(CEA)、甲胎蛋白(AFP)、糖类抗原CA72?4(CA72?4)、糖类抗原CA19?9(CA19?9)在胃结肠肿瘤诊断中的应用价值. 方法: 应用电化学发光免疫法测定106例胃结肠肿瘤、111例胃结肠良性病、92例正常对照血清中CEA, AFP,CA72?4和 CA19?9水平,通过ROC曲线分析和逐步logistic回归结果的ROC曲线下面积(AUC),对TM单独及不同组合方式的敏感性、特异性、Youden指数和阳性似然比/阴性似然比进行比较分析. 结果: 各TM在胃结肠肿瘤组的浓度显著高于胃结肠病良性病组和正常对照组. 胃结肠良性病?胃结肠恶性肿瘤中,逐步 Logistic回归法模拟变量的AUC高于单一TM的AUC. CA72?4,CEA,CA19?9联合应用的敏感性、Youden指数、阳性似然比/阴性似然比最高. 结论: 基于logistic 回归的ROC分析可以改善诊断的准确性. 在胃结肠肿瘤的鉴别诊断中,CA72?4,CEA及CA19?9联合分析是较好组合.

【关键词】  胃肿瘤 结肠肿瘤 癌胚抗原 甲胎蛋白类 糖类抗原CA72?4 糖类抗原CA19?9 诊断

  0引言

  近年来,越来越多的肿瘤标志物(tumor marker,TM)已在胃肠道肿瘤的筛查和辅助诊断方面显示了其应用价值,但如何能使多种TM合理使用以达到最佳的效果仍是目前临床诊断急需解决的问题. 我们分析了胃结肠肿瘤中癌胚抗原(CEA)、甲胎蛋白(AFP)、糖类抗原CA72?4(CA72?4)和糖类抗原CA19?9(CA19?9)的分布,同时应用ROC曲线[1-4]和 Logistic回归[3-4]评价上述单个指标和不同组合对胃结肠肿瘤的诊断能力.

  1对象和方法

  1.1对象

  收集住院胃结肠恶性肿瘤106(男61,女45)例,平均年龄47.3(31~88)岁. 其中胃癌47(男29,女18)例,平均年龄48.1(38~82)岁;低分化型11例;中分化型27 例;高分化型9例;结肠癌59(男32,女27)例,平均年龄45.6(31~88)岁;Duke?s A,B,C,D期 分别为9,16,23,11例. 所有病例均经内窥镜检查、手术及病理检查确诊. 另选临床明确诊断的胃结肠良性病变组111(男82,女29)例,平均年龄44.2(21~72)岁. 其中消化性溃疡58例,溃疡性结肠炎53例. 正常对照组92(男55,女37)岁,平均45.7(16~83)岁,各项体检指标均正常,肝肾功能正常,无心、肺疾病,无胃肠道病变. 全自动电化学发光免疫分析仪Elecsys 2010及配套试剂(德国罗氏公司).

  1.2方法

  术前或放化疗前抽取患者空腹静脉血4 mL. 凝固后以3000 r/min离心5 min,分离上清液,电化学发光免疫分析检测血清AFP,CEA,CA72?4和 CA19?9,正常值分别为 <13.6 mg/L,<3.40 mg/L,<6.9×103 U/L,<35×103 U/L.  
统计学处理:对各组患者TM的浓度分布进行 K?S正态性检验. TM中位浓度及百分位数(P25 和 P75)并进行 Kruskal?Wallis和Mann?Whitney U检验;用SPSS13.0绘制ROC曲线并进行逐步Logistic回归,分析TM单一和联合检测对胃结肠肿瘤的鉴别诊断价值.

  2结果

  2.1TM正态性检验对4个TM在各组患者中的统计学分布进行正态性检验(Kolmogorov?Sminov test),Z=1.39~4.58,P<0.05,属非正态分布,以下统计学处理均使用非参数检验(nonparametic tests).

  2.2各组TM浓度除AFP(χ2=1.759,P=0.184)在3组之间无统计学差别之外, 其余3个TM在3组之间差异有统计学意义(χ2=39.363~80.564,P=0.000~0.001). CEA,AFP,CA72?4和 CA19?9在各组中依次升高(表1). 表1各组血清肿瘤标志物浓度[略]

  2.3TM在各组阳性率按参考值,胃结肠肿瘤患者的4种TM的测定结果与正常对照组相比有统计差异(P<0.01,表2). 表2CEA,AFP,CA72?4及CA19?9在各组中的阳性数及阳性率[n(略)]

  2.4胃结肠肿瘤组、胃结肠良性病组Logistic回归和 ROC曲线

  2.4.1胃结肠恶性肿瘤组与胃结肠良性病组血清CEA,AFP,CA72?4和 CA19?9单一变量的 ROC曲线TM的ROC曲线下面积分别为CEA:0.760(95%可信区间:0.695~0.826, P<0.001);CA72?4:0.755(0.688~0.822,P<0.001);CA19?9:0.670(0.597~0.743,P<0.001);AFP:0.575,P>0.058,图1),统计显示无差异.

  2.4.2逐步Logistic回归法和模拟变量的ROC曲线运用软件逐步回归出胃结肠恶性肿瘤组与胃结肠良性病组血清AFP,CEA,CA72?4及CA19?9的 Logistic回归方程,AFP被剔除(P>0.1,P 表示根据CEA,CA72?4和 CA19?9联合推测胃结肠恶性肿瘤发生的概率). P= ex / ex+1;x=-4.593 +0.393 ×ln CEA +0.171 ×ln CA72?4+0.054 ×ln CA19?9. 用逐步Logistic回归建立模型,通过模型中的概率值(PRE)来拟合ROC曲线(图1). 单一TM和逐步Logistic回归曲线联合三种TM预测概率的AUC如表3所示,当4种TM单独检测时,CEA的AUC最大,CA72?4次之,AFP最小,而逐步Logistic回归模型中(剔出AFP)联合3种TM的AUC要大于各项TM单项检测的AUC. 表3单一肿瘤标志物和逐步Logistic回归曲线联合三种肿瘤标志物预测概率的AUC(略)

  2.5TM评价参数根据 ROC曲线和逐步 Logistic回归,计算出各指标的敏感性、特异性、Youden指数(敏感性+特异性-1)和阳性似然比/阴性似然比(表4). 联合分析:以CA72?4为基本指标,在此基础上与AFP,CEA,CA19?9指标联合分析,按任一指标超过“界值”即定为胃结肠肿瘤,CA72?4,CEA,CA19?9的Youden指数、阳性似然比/阴性似然比最高,并兼顾了较高的敏感性和特异性. 其余指标的联合方式虽然特异性有所上升,但敏感性等其余参数明显下降.  表4肿瘤标志物的联合分析对胃结肠肿瘤的诊断效率(略)

  3讨论

    CEA,AFP,CA72?4和 CA19?9对胃结肠恶性肿瘤的诊断均有一定的临床价值[5]. CEA是传统的肿瘤相关抗原,在消化道各种肿瘤中均可升高,且结果可靠稳定,缺点是特异性不高;在非肝脏来源的胃结肠肿瘤中,AFP浓度升高不到21%;CA72?4属糖蛋白类癌胚胎抗原,其浓度上升与肿瘤分期(如Duke?s分级)有关;CA19?9在多种消化道腺癌中升高[5-8].

  ROC曲线以良、恶性胃结肠病为研究对象,以敏感性对假阳性率(1-特异性)作曲线,是敏感性和特异性的综合反映. 本文通过绘制ROC曲线,并比较不同TM的AUC,同时按照AUC原则提供“界值”,以保证最大限度地区别胃结肠良性病与胃结肠恶性肿瘤[4]. 用逐步Logistic回归拟合最佳曲线时,AFP(P>0.1)预测价值相对较小而被剔除. 这样得到的ROC曲线可以从几何意义上直观地反映模型拟合情况,通过曲线下面积定量反映Logistic模型的拟合效果,以此更好地对模型优度与实际资料的符合情况进行评价[1-3]. 本文方程拟合的优度和预测效果比较理想,其预测概率ROC曲线的AUC为0.934. 

  目前TM应用尚有不足之处,如用单项指标判别,漏诊率较大,在肿瘤筛查和早期诊断中有一定的局限性,但联合检测可以在一定程度上弥补[4-9]. 本文中TM组合,与单一项目比较,灵敏度呈上升趋势,特异性呈下降趋势,而Youden指数增加,以A72?4+CEA+CA19?9组合最佳. 因此对肿瘤患者进行适当的TM联合检测是十分必要的[9]. 联合分析的价值大小可用逐步Logistic回归分析来衡量[8]. 因AFP对诊断胃结肠肿瘤价值较小,未进入回归模型,其余三个指标则进入Logistic回归模型,此结果与两组间TM浓度分析结果相吻合(如表1所示). AUC和Youden指数能综合反映TM的诊断能力,因此我们通过ROC曲线,以Youden指数最大为原则,首先重新设定界值,在此基础上进行单一指标和多指标的联合分析,得出CA72?4是胃结肠肿瘤研究中的最佳单一指标,多项联合分析以CA72?4+CEA+CA19?9为最好,与逐步Logistic回归建立模型结果一致. 然而,本文logistic回归拟合模型的效果有待在有病组织检查为标准的更大患者人群中验证. 至于它评价胃结肠肿瘤外科、化疗、放疗的效果、判断预后[6]、肿瘤转移情况以及能否单独用作疗效评估[1,9-10],还需作进一步研究.

 

【】
    [1]Brumback LC, Pepe MS, Alonzo TA. Using the ROC curve for gauging treatment effect in clinical trials[J]. Stat Med,2006,25(4):575-590.

  [2]Molodianovitch K, Faraggi D, Reiser B. Comparing the areas under two correlated ROC curves: parametric and non?parametric approaches[J]. Biom J, 2006,48(5):745-757.

  [3]Dodd LE, Pepe MS. Partial AUC estimation and regression. Biometrics.2003, 59(3):614-623.

  [4]宇传华. SPSS与统计分析[M]. 北京:出版社,2007:356-408.

  [5]Lothar Thomas主编,吕元,朱汉民,沈霞等主译. 临床实验诊断学[M]. 上海:上海技术出版社,2004,579-682.

  [6]Ferroni P, Palmirotta R, Spila A,et al. Prognostic value of carcinoembryonic antigen and vascular endothelial growth factor tumor tissue content in colorectal cancer[J]. Oncology,2006,71(3-4):176-184.

  [7]Lai IR, Lee WJ, Huang MT,et al. Comparison of serum CA72?4, CEA, TPA, CA19?9 and CA125 levels in gastric cancer patients and correlation with recurrence[J]. Hepatogastroenterology,2002:49(46):1157-1160.

  [8]Pepe MS, Cai T, Longton G. Combining predictors for classification using the area under the receiver operating characteristic curve[J]. Biometrics,2006,62(1):221-229.

  [9]Louhimo J, Kokkola A, Alfthan H,et al. Preoperative hCG beta and CA72?4 are prognostic factors in gastric cancer[J]. Int J Cancer,2004,111(6):929-933.