用QSTR模型预测苯酚类化合物大鼠经口的急性毒性

来源:岁月联盟 作者: 时间:2010-07-11

                     作者:孙也之 闫心丽 李佐静 孟繁浩 

【摘要】  对39种苯酚类化合物大鼠经口急性毒性(LD50)的定量结构?毒性效应关系(Quantitative Structure?Toxicity Relationships,QSTR)进行了研究。采用HyperChem7.5中MOPAC?AMI量子化学法了39种苯酚类化合物的13种量子化学结构参数。其中取22个化合物作为样本集对LD50进行多元逐步回归分析,得到最佳方程,该方程的相关系数R2=0.9749。应用所建立的QSTR模型验证了苯酚类化合物的LD50值。经过17个预测样本对该模型进行验证,结果表明该模型具有很好的预测能力。同时分析了苯酚类化合物的毒性机理。

【关键词】  苯酚类化合物 急性毒性 定量结构?毒性效应关系

  Abstract  Quantitative structure?toxicity relationship (QSTR) were developed to predict the toxicity of phenols in rat via oral LD50 with 13 molecular descriptors. With the HyperChem7.5 software, 13 quantum chemistry parameters for 39 phenols are calculated.The QSTR of 22 phenols is set up which combined with forward regress.The coefficient correlation which is 0.9749 is discussed with the relationships of LD50 and their structure parameters.It is shown that the QSTR model has a good stability.The calculated values with the QSTR model have a good consistent with the experimental values and it is tested that the model has a good forecasting ability with other 17 compounds.And we also analyse the toxic mechanism of the phenol compounds.

    Key words   phenols;  acute toxicity;QSTR  

  苯酚类化合物作为有机中一类重要的物质,被广泛地用作防腐剂、防锈剂、农业化学品、生物杀伤剂、染料、杀真菌剂和杀虫剂等,广泛存在于环境中并对环境、尤其是水环境造成的污染不可忽视。目前苯酚等4种酚类化合物被美国环境保护局列为优先控制的有机污染物,7种苯酚类化合物被确认为优先控制的有机污染物,因此苯酚类化合物毒性研究工作近年来成为热点。定量结构?毒性效应关系(Quantitative Structure?Toxicity Relationship,简称QSTR)研究,在化学和生物化学研究领域得到了非常广泛的应用,在环境污染物的生物活性和生物毒性评价中都发挥着重要的作用[1~3] 。
   
  有关苯酚类化合物的毒性与结构的QSTR研究,多集中在苯酚类化合物对水生物的毒性,如四膜虫[4]、斑马鱼[5]和大型蚤[6]等,未见大鼠经口急性毒性的定量结构?毒性效应得研究报道。本研究运用Hyperchem7.5软件计算了39种苯酚类化合物的13个结构参数,如LogP(疏水系数)、MR(Molar Refraction,摩尔折射率)、Polar(Polarzation energy,极化能)等。通过对苯酚类化合物及所选各种量化参数采用多元逐步回归建立了苯酚类化合物大鼠经口急性毒性(LD50)的定量结构?毒性效应的QSTR模型,经过17个预测样本对该模型进行验证,结果表明该模型具有很好的预测能力,并对苯酚类化合物的毒性机理进行了探讨。

  1  研究方法

  1.1  数据采源

    大鼠经口急性毒性(LD50,半数致死量)数据来自和国内外数据库。

  1.2  计算方法

    采用了Hyperchem7.5 AM1量子化学法,对39个苯酚类化合物进行了能量最小化及结构最优化处理。并计算了Mass(分子量)、LogP、MR、Polar、Vol(volume,体积)、SAA(Surface Area Approx,近似表面积)、SAG(Surface Area Grid,网格表面积)、Dipole(偶极矩)、TE(Total  Energy,总能量)、BE(Binding Energy,键合能)、IAE(Isolated Atomic Energy,孤立原子能)、EE(electronic Energy,能量)、CCI(Core?Core Interaction,核-核相互作用)、HoF(Heat of Formation,形成热)等13个量子化学结构参数。其中Dipole与分子极性相关,反映了极性对活性的影响;BE是反映分子键能的大小,BE值越大,分子越稳定;TE是反映分子总能的参数,TE负值越大,反应活性越高;HoF是表征分子的稳定性,HoF值越高,分子越不稳定。
   
  采用SAS 9.0统计程序分析了39个苯酚类化合物,其中22个为样本集用于模型的建立,17个为预测样本,用于模型的预测能力的检验。模型的优劣由两方面来评价:①回归分析中所有自变量显著水平取α=0.15;②用相关系数(R2)来评价各自变量的相关程度。相关系数越接近1,表明所建立的模型的相关性越好,模型的可信度就越高。
   
  化合物的毒性由两个过程组成,即毒物透过生物膜进入生物体内并与作用位点发生作用,可表示为定量结构?毒性效应相关一般模型:

    Log(毒性) = A[Log(透过)] + B[Log(反应)] + C
   
  其中透过项可以由许多参数来表示,最常用的是LogP;反应项则可以由许多不同的立体及电子结构参数来描述,例如HoF、TE、Dipole、Polar、MR等;A、B、C分别为常数。要选择哪几个量子化学参数作为最终QSTR模型中的变量参数,就需要通过研究化合物的毒性分别与这些量子化学参数之间的相关性来最后确定。

  2  结果与讨论

    由于变量LD50数值较大,我们首先对它进行取对数处理,使处理的数据处于同一数量级上,便于统计分析比较。

    在回归过程中我们采用向前消去回归法(forward)、无截距向前消去回归法(forward noint)、向后消去回归法(backware)、无截距向后消去回归法(backware noint)、逐步回归法(stepwise)以及逐步回归法(stepwise noint)等6种统计方法来对变量进行初步的筛选,详细数据见表1。表1  不同统计方法的比较(略)
   
  从表1中可以看出,在我们选取的这6种统计学方法中,无截距向前消去回归法的相关系数(0.9751)接近1,且Mallows Cp统计量接近变量的个数(5个),它的筛选效果相比于其他5种方法效果较好。在这些参数中,对模型有显著性的自变量为SAA、Polar、BE、Mass、TE、EE、MR等7个变量。

    我们对上一步初步筛选得到的自变量进行共线性检验结果见表2。通过比较P值,对自变量进行进一步的筛选,有显著性的是BE、TE、EE。表2  共线性检验结果(略)

    为了得到更准确的模型,我们把BE、TE和EE 3个参数的交叉项考虑在内,交叉项的变量设置如下:EB=EE*BE;ET=EE*TE;BT=BE*TE。再加上BE、TE和EE等共6个变量采用无截距向前回归方法对确定的变量进行模型拟合,检验结果见表3。表3  参变量参数估计分析(略)

    从表3中,通过比较P值,可以看出对模型有显著性影响的自变量包括BE、EB和BT。然后,对它们进行了预测和共线性检验,得到了新的线性模型:

    LogLD50= -3.67940*BE -0.02201*EB + 0.09316*BT,R2= 0.9749。

    从方程相关系数(R2)接近于1,变量BE和交叉项EB和BT对模型有显著性影响。我们利用回归方程进行预测和残差分析,结果表明该模型拟合较好,结果见表4。表4  预测和残差分析(略)

  3  结果与结论

    通过建模过程的分析,我们得到了如下模型:

    LogLD50= -3.67940*BE -0.02201*EB + 0.09316*BT,R2= 0.9749

    从上面的模型可以看出,BE以及交叉项EB、BT对LD50(大鼠口服半数致死量)影响甚大,LD50随着BE和交叉项EB的增加而减小,随着交叉项BT的增加而增加。而半数致死量越大,说明化合物的毒性越小。因而,此模型表明,BE和交叉项EB与苯酚类化合物的毒性呈正相关;交叉项BT与苯酚类化合物的毒性呈负相关。用17种苯酚类化合物对模型的预测能力进行验证,结果发现该模型的预测能力较好,残差较小,结果见表5。说明结构参数的交互作用确实对毒性指标值产生显著的影响,因而在考虑了交叉项后,确有交叉项经筛选进入拟合模型,并使模型的预测准确度得到提高。表5  预测样本化学参数及模型预测结果(略)
   
  4  讨论

    分析数据表明一个药物开发中主要损耗或失败的原因,很多是动物毒性引起的[7]。目前,人们已越来越认识到化合物设计早期阶段毒性预测的至关重要性,并认为机辅助毒性预测方法是在药物和农药开发过程中,降低因毒性失败和经费开支的有效途径之一。LD50是评价化合物毒性大小的最常用指标,它反映受试动物群体中大多数动物的感受性的平均水平,具有较高的重现性和稳定性。在QSTR研究中,线性回归分析是最广泛使用的一种定量方法[8],我们采用计算机应用程序来计算化合物的量化参数,并把各个参数的交叉项考虑在内,利用线性回归方法得到了苯酚类化合物的毒性预测模型(相关系数为0.9749),该模型具有较好的预测能力。
   
  需要说明的是,在计算结构参数前,如不将结构图规则化,因手绘角度的差异,会导致所得参数值出现偏差,以致难以重现。在进行几何优化时是按梯度小于0.01来进行的,结果梯度仍进入模型,并和毒性呈较强的正相关关系。说明梯度作为反映化合物结构稳定性的参数,与化合物的活性高度相关,因而对优化时的限定条件可做进一步的探讨。

【】
    1 Olexandr I, et al. Structure?toxicity relationships of nitroaromatic compounds. Molecular Diversity, 2006, 10(3): 233~245.

  2 Kunal R, Gopinath G. QSTR with extended topochemical atom (ETA) indices. VI. Acute toxicity of benzene derivatives to tadpoles (Rana japonica). J Mol Model, 2006, 12(5): 306~316.

  3 Donatas Z, et al. Progress in Toxinformatics: The Challenge of Predicting Acute Toxicity. Current Topics in Medicinal Chemistry 2003, 3(11): 1301~1314.

  4 星炯浩,张运陶. 卤代酚对水生梨形四膜虫急锐毒性的QSAR研究. 计算机与应用化学,2007,24(1): 87~90.

  5 杨霓云,等. 五氯苯酚与邻氯苯酚和2,4?二氯苯酚对斑马鱼的联合毒性. 环境研究,2006,19(6): 145~148.

  6 唐自强,冯长君. 用形状指数研究苯酚类化合物对大型蚤的急性毒性. 武汉大学学报(版),2006,52(6):685~689.

  7 Kennedy, T. Managing the drug discovery/development interface. Drug Disc Today, 1997,(2): 436~444.

  8 Davis, CS, et al. Categorical Data Analysis Using the SAS System, Second, SAS Institute and John Wiley, Cary, North Carolina, 2000.