血清蛋白质谱在单纯性室间隔缺损诊断中的应用

来源:岁月联盟 作者:仇小强, 李永红, 时间:2010-07-12

【摘要】  目的 通过构建血清诊断模型,探讨血清蛋白质谱在诊断单纯性室间隔缺损中的意义。方法 采用病例对照研究设计,用CM10蛋白质芯片检测56例单纯性室间隔缺损患儿、85例儿科常见病患儿及23例其他先天性心脏病患儿血清,筛选血清差异蛋白,并构建诊断模型。结果 完整模型ROC曲线下面积、预测准确率、灵敏度、特异度、阳性预测值及阴性预测值分别为0.988、95.00%、100.00%、92.42%、87.18%和100.00%,简化模型ROC曲线下面积、预测准确率、灵敏度、特异度、阳性预测值及阴性预测值分别为0.948、94.00%、88.24%、96.97%、93.75%和94.12%。简化模型与完整模型之间预测准确率、灵敏度及特异度比较,差异均无统计学意义(P>0.05)。结论 利用血清蛋白质谱建立的诊断模型能够较好地区分病例与对照,对诊断室间隔缺损具有一定的和应用前景。

【关键词】  血清蛋白质谱; 室间隔缺损; 病例对照研究


  

  【Abstract】  Objective  To explore the value of serum protein profiling for diagnosis of isolated ventricular septal defect (VSD) through developing the serum diagnostic model. Methods  Using case?control design, serum samples from 56 isolated VSD patients, 85 patients with common pediatric diseases and 23 patients with other congenital heart disease were detected by CM10 ProteinChip for searching the proteins that were significantly different between serum of VSD and control. Diagnostic model was established by Biomarker Patterns software. Results  In the intact model and the terse model, the area under receiver operating characteristic curve, accuracy, sensitivity, specificity, positive predictive value and negative predictive value were 0.988 and 0.948, 95.00%(95/100) and 94.00%(94/100), 100.00%(34/34) and 88.24%(30/34), 92.42%(61/66) and 96.97%(64/66), 87.18%(34/39) and 93.75%(30/32), and 100.00%(61/61) and 94.12%(64/68), respectively. Between these two models, the accuracy, sensitivity, and specificity were similar (P>0.05). Conclusions  The model, constructed by serum protein profiling, has capability of distinguishing the cases from the controls, and shows great potential for diagnosis of VSD.

  【Key words】  Serum protein profiling; Ventricular septal defect; Case?control study

  单纯性室间隔缺损(ventricular septal defect,VSD)是先天性心脏病(congenital heart disease,CHD)的常见类型,传统的影像学诊断方法不便于在人群中快速筛检出VSD患儿及对其早期干预。本研究采用病例对照研究设计,利用表面增强激光解吸/电离飞行时间质谱(surface?enhanced laser desorption/ionization time?of?flight mass spectrometry,SELDI?TOF?MS)技术获取VSD患儿与非VSD其他患儿的血清蛋白质谱,并以此构建VSD的血清诊断模型,探讨血清蛋白质谱对VSD的诊断意义。

  1  材料与方法

  1.1  材料

  1.1.1  研究对象  病例为经多普勒超声心动图确诊的单纯性VSD患儿,对照为经多普勒超声心动图排除单纯性VSD的儿科常见病(主要为肺炎、支气管肺炎、支气管炎等)患儿和其他CHD患儿。病例与对照来自广西自壮族自治区妇幼保健院、广西医科大学第一、第三、第四附属及南宁市第一人民医院,收集时间为2005年3月~2005年10月。病例与对照的性别、年龄及疾病诊断情况来自医院病历,基本情况见表1。

  表1  研究对象的基本情况及在模型训练集与测试集中的分布(略)

  Table 1  Basic information of study objects and their distribution in training data and testing data of the model

  1.1.2  主要试剂与仪器  尿素、乙酸钠、三氟乙酸、乙氰、CHAPS、DTT 、Tris?HCl、HEPES和SPA(sinapinic acid)均购自Sigma公司,ProteinChip Biology System(PBS Ⅱ?c)质谱仪及CM10蛋白质芯片购于美国Ciphergen公司。

  1.2  方法

  1.2.1  血样的采集与保存  空腹采集静脉血2 ml,经静置、离心后,取血清分装于0.5 ml离心管,-80 ℃保存。

  1.2.2  血清样品的处理与上样  血清样品置冰上融解、离心后,取10 μl加入含20 μl U9(9 mol/L尿素、2%CHAPS、2 mmol/L DTT、50 mmol/L Tris?HCl pH9.0)的离心管中,经冰浴振荡,再加入360 μl缓冲液(50 mmol/L乙酸钠pH4.0)混匀;用缓冲液恒温孵育过的芯片每孔中加入100 μl处理好的样品,孵育1 h后,再用缓冲液孵育2次,最后每孔加入1 mM、pH4.0 HEPES 200 μl,立即甩出;取出芯片,风干后各点加SPA 0.5 μl,重复1次。

  1.2.3  芯片的测定  PBSⅡ?c型质谱仪经NP20标准芯片校正后,用Ciphergen ProteinChip 3.2软件采集数据,设置激光强度为225,检测灵敏度为8,测定范围2 000~50 000 Da,优化范围2 000~10 000 Da。机以每秒1 G HZ的速度从所获得的原始数据快速精确地绘制出蛋白质质谱图。其中纵坐标为峰强度(蛋白质相对含量),横坐标为蛋白质质荷比(mass to charge ratio,m/z)。

  1.2.4  统计分析

  1.2.4.1  血清诊断模型的建立与验证  分层从VSD、儿科常见病及其他CHD患儿中随机抽取60%作为训练集,其余作测试集,见表1。用Biomarker Wizard 3.2软件对训练集与测试集数据进行处理,找出有统计学意义(P<0.05)的蛋白峰,并形成Pattern文件。用Biomarker Patterns 5.0软件及训练集Pattern文件,10?fold交互验证,建立包含所有有意义预测变量的完整决策树诊断模型和包含4~6个意义较大的预测变量的简化模型。用测试集数据验证模型的可靠性和准确性。

  1.2.4.2  诊断指标的计算  ROC(receiver operating characteristic)曲线下面积取自诊断模型,诊断准确率、灵敏度、特异度、阳性预测值及阴性预测值按模型中的相关信息计算。

  1.2.4.3  病例与对照的均衡性检验及完整模型与简化模型的比较  用SPSS 13.0软件包作病例组与对照组之间性别构成和年龄(月)分布的均衡性检验(四格表检验和成组检验)及完整模型与简化模型之间预测准确率、灵敏度及特异度的比较(四格表检验),检验水准α(双侧)=0.05。

  2  结果

  2.1  病例与对照的均衡性  56例VSD患儿与108例非VSD儿(85例儿科常见病对照儿和23例其他先天性心脏病患儿)的性别构成比较(χ2=0.546,P=0.460);年龄(月)分布比较(t=1.611,P=0.109),差异均无统计学意义,说明病例组与对照组的性别、年龄均衡可比。

 

 2.2  完整模型的建立  34例VSD与66例非VSD患儿(52例儿科常见病和14例其他CHD患儿)血清蛋白质质谱组成的训练集经处理与分析,有39个蛋白质峰强度在两组之间的差异具有统计学意义(P<0.05)。以这些蛋白质峰作为预测变量,建立完整血清诊断模型。结果显示,ROC曲线下面积为0.988,预测准确率为95.00%(95/100),灵敏度为100.00%(34/34),特异度为92.42%(61/66),阳性预测值为87.18%(34/39),阴性预测值为100.00%(61/61),m/z 8 698.80、8 570.29、6 441.97、6 640.78、3 322.54和7 777.61等6个蛋白质峰在模型中的预测意义较大。

  2.3  简化模型的建立与验证  以完整模型中意义较大的6个蛋白质峰作为预测变量,构建简化血清诊断模型,ROC曲线下面积为0.948,预测准确率为94.00%(94/100),灵敏度为88.24%(30/34),特异度为96.97%(64/66),阳性预测值为93.75%(30/32),阴性预测值为94.12%(64/68)。以测试集数据验证模型,ROC曲线下面积、预测准确率、灵敏度、特异度、阳性预测值及阴性预测值分别为0.865、93.75%(60/64)、81.82%(18/22)、100.00%(42/42)、100.00%(18/18)和91.30%(42/46)。病例与对照在简化决策树模型中的分组情况见图1。

  2.4  完整模型与简化模型预测准确率、灵敏度及特异度比较  完整模型与简化模型之间预测准确率(95.00% vs 94.00%)、灵敏度(100.00% vs 88.24%)及特异度(92.42% vs 96.97%)经检验,χ2值分别为0.756、2.391和0.603,P值分别为0.756、0.122和0.437,差异均无统计学意义。

  图1  简化决策树模型中病例与对照的分布(略)

  Figure 1  Distribution of cases and controls in the model

  3  讨论
   
  VSD是最常见的CHD类型(广西VSD占CHD的41.52%[1]),尽管现有的影像学诊断方法,对VSD的识别都具有较高的灵敏度及特异度,但不便用于筛查,不能从人群中快速筛检出VSD患儿并对其早期干预。而血清中所包含的大量的、可作为疾病标志物的蛋白质或多肽[2,3],以及被视为各种疾病血清蛋白质组学研究及疾病血清学诊断技术的重要工具[4]的SELDI?TOF?MS技术的日益完善,为发展VSD的血清学诊断技术提供了条件。
   
  本研究采用病例对照研究的方法,利用SELDI?TOF?MS技术获取VSD患儿与非VSD患儿(儿科常见病患儿及其他CHD患儿)的血清蛋白质谱,并以筛选出的血清差异蛋白为预测变量,构建血清诊断模型,分析模型区分病例与对照的能力,探讨利用血清蛋白质谱诊断VSD的价值,探索发展一种简单有效的血清学诊断方法的可能性。
   
  血清诊断模型分为完整模型和简化模型,前者以所有有差异的蛋白质峰作为预测变量,评价各变量在模型中的意义,为建立简化模型打基础;后者以完整模型中意义较大的几个蛋白质峰作为预测变量,突出诊断模型的实用性。这一方面是由于生命的复杂性,单一标志往往无法区分样本人群,需要一个多标志的复杂模型[5];另一方面考虑到临床应用的可行性,模型中不可包含过多变量。从所构建模型的结果来看,完整模型各项指标中阳性预测值最低,为87.18%,灵敏度和阴性预测值均达到100.00%;简化模型中各项指标也在88.24%~96.97%之间,且完整模型与简化模型的主要诊断指标(预测准确率、灵敏度及特异度)均无统计学差异(P>0.05),简化模型可以替代完整模型。对简化模型的验证结果也比较理想,各项诊断指标在81.82%~100.00%之间,说明其准确性和可靠性高,能够较好地将VSD患儿与非VSD患儿区分开来,具有一定的发展和应用前景。
   
  为了保证所建诊断模型具有较高的质量,笔者等在研究设计、实验操作、数据处理及建模等整个过程中采取了严格而全面的质量控制。所有研究对象均经过彩色超声心动图检查;从多家选取研究对象;以儿科常见疾病和其他CHD患儿作为对照,排除疾病炎性反应的干扰[6]并避免试验准确度被过高估计[7];保持实验过程中操作的一致性;所有数据经过统一校正、去除基线噪音及标化,并弃去0~2 000 Da的数据,避免各种可能因素的干扰[8];分层随机抽样的方法抽取蛋白质质谱原始数据形成训练集和测试集,降低选择性偏倚。但由于条件所限,本研究只选择了1种较为常用的弱阳离子蛋白质芯片检测病例与对照的血清蛋白质谱,且所构建的血清诊断模型的稳定性还需进一步验证,这些不足之处有待于在后续研究中予以完善。

【】
    [1] 仇小强,覃益敏,谢晓宇,等. 1 286例先天性心脏病患儿致病因素的调查研究 [J]. 同济医科大学学报, 1999,28(5):399?401.

  [2] Liotta LA, Ferrari M, Petricoin E. Clinical Proteomice: Written in blood [J]. Nature, 2003,425(6961):905.

  [3] Thadikkaran L, Siegenthaler MA, Crettaz D, et al. Recent advances in blood?related proteomics [J]. Proteomics, 2005,5(12):3019?3034.

  [4] Bons JA, Wodzig WK, van Dieijen?Visser MP. Protein profiling as a diagnostic tool in clinical chemistry: a review [J]. Clin Chem Lab Med, 2005,43(12):1281?1290.

  [5] Seibert V, Wiesner A, Buschmann T, et al. Surface?enhanced laser desorption ionization time?of?flight mass spectrometry (SELDI TOF?MS) and ProteinChip technology in proteomics research [J]. Pathol Res Pract, 2004,200(2):83?94.

  [6] Seibert V, Ebert MP and Buschmann T. Advances in clinical cancer proteomics: SELDI?ToF?mass spectrometry and biomarker discovery [J]. Brief Funct Genomic Proteomic, 2005,4(1):16?26.

  [7] Zhou X, Obuchowski NA, Mcclish DK. Statistical methods in diagnostic medicine [M]. New York: Wiley, 2002.

  [8] Malyarenko DI, Cooke WE, Adam BL, et al. Enhancement of sensitivity and resolution of surface?enhanced laser desorption/ionization time?of?flight mass spectrometric records for serum peptides using time?series analysis techniques [J]. Clin Chem, 2005,51(1):65?74.