综合主成分分析用于黄芪药材的质量评价
【摘要】 目的: 探讨综合主成分分析用于黄芪药材的质量评价的可行性。方法: 选择3种有效成分的含量为指标,对不同产地的黄芪药材建立了综合主成分评价模型。结果:提出的综合主成分评价较全面的反映了药材样本的信息,评价结果具有一定的客观性,与系统聚类法结果一致。结论: 综合主成分分析可用于中药多指标的质量评价。
【关键词】 主成分分析 综合评价指标 黄芪
Abstract Object: To explore the feasibility of comprehensive principal components analysis on quality evaluation of Radix astragali. Methods: Quality evaluation on Radix astragali which were from different localities in gansu performed by comprehensive principal components analysis with contents of three components. Results: The application shows that the propoed method can comprehensively reflect the samples.The results were objective,which showed no difference with that of hierarchical cluster. Conclusion: Comprehensive principal components analysis on quality evaluation of traditional chinese medicine was promising.
Key words principal components analysis; comprehensive assessment indexes; radix astragali
分析技术可以为中药质量控制研究提供大量的信息,如何根据这些信息对多种成分进行定性定量分析及对样品进行整体的准确评价,了多种分析测量数值的理论分析方法,它们可以应用于中药质量控制的研究中。中药研究工作者在这方面己经进行了大量有价值的研究工作,他们采用多种化学计量学的方法用于中药的鉴别和质量品质研究,其中主成分分析是化学计量学中的基础方法,目前主成分分析主要用于对中药样品的整体分析鉴别及分类,而要对中药样品质量优劣进行综合评价,目前国内还没有一个比较完善的方法。
随着现代分析技术的发展,已经能够对中药中的某些具有药理活性的组分进行定量,一般地,中药样品质量的优劣通常取决于这些具有药理活性的组分的含量。因此,对中药样品质量优劣进行综合评价实际上属于多指标评价问题,各指标权重的不确定性及某些指标间存在的相关性将给综合评价带来困难。主成分分析就可以在不损失或尽量少损失原有指标信息的情况下,将多个具有相关性的指标转换成少数几个互相独立的综合指标(即主成分)。综合主成分评价模型已广泛应用于社会学领域[1,2],使之成为一种比较有效的综合评价方法。本文尝试将综合主成分分析法应用于中药样品质量优劣的综合评价,目前,国内尚未见相关报道,希望能与同行共同探讨以丰富中药质量综合评价的方法。
1 综合主成分分析算法的原理及实现
综合主成分评价的思想是:在对样本(各个评价指标)进行变换后,可求得m个主成分方程,代入相关数据后即可求得各个样本主成分值的大小。然后前g个主成分的累计方差贡献率,根据方差贡献率的大小,确定所需要的能反映样本综合信息的前q个主成分。取前q个主成分计算综合主成分得分。根据综合主成分得分大小对各个样本进行排序。具体实现步骤如下:
假定有n个待评价样本,每个样本均测得p个有效成分的含量指标,记为X1,X2,…Xp通过测定,获得的数据矩阵X为:X=X11 X12 X1p X21 X22 X2p… … …Xn1 Xn2 Xnp
1.1 评价指标的标准化处理:为了消除由于量纲的不同可能带来的影响,往往经常采用变量标准化的方法。
Zij=Xij-xj Sj
其中Zij为Xij的标准化值,xj 、Sj 为第j个指标的均值与标准差。
1.2 计算已作标准化处理的评价指标Zij的相关系数矩阵R,R=r11 r12 r1p r21 r22 r2p… … …rp1 rp2 rpp ,其中rjk为指标Xj与指标Xk的相关系数。
1.3 计算R的特征根和特征向量,并得到相应的主成分。将R的所有特征根按降序排列,记作 λ1,λ2 …λm ,且与其相对应的特征向量记为αk =(αk1 ,αk2 … αkm)。并计算各主成分的贡献率及得分,ηq =∑q i=1λi ∑k j=1λj 为前q(q≤ k)个主成分的累计方差贡献率,通常以累计方差贡献率大于85%[2]来确定主成分的个数q。各主成分得分为:fq= α1*Z1+α2 *Z2+… αq*Zp ,其中Zi(i=1,2…p)为标准化处理后的指标。
1.4 构造综合主成分:以贡献率为权数,将所求得的q个主成分进行线性组合,即可构造出所谓的综合主成分F,其计算公式为:F=λ1*f1+λ2*f2+…λq*fq)/ ∑q i=1λi
计算各样本在综合主成分上的得分,记为Fi ( i=1,2,… ,n)。一般地,有效组分的含量越高质量越好,因此,综合主成分得分越高,相应的评价样本就越优。
2 中药黄芪药材的质量综合评价
为了全面了解甘肃黄芪药材的质量,胡芳弟等[3]采用高效液相色谱法研究了甘肃不同产区12个蒙古黄芪样品的指纹图谱,并测定了黄芪甲苷、毛蕊异黄酮及芒柄花素的含量,样品来源及测定结果见表1。据[4,5]报道黄芪皂苷及异黄酮类具有相当的药理活性,因此,可以用以上三个成分的含量作为指标来评价黄芪药材的质量优劣,本文尝试使用综合主成分分析对其进行综合评价,算法实现语言为MATLAB,程序自编。
首先对数据进行标准化处理后,各指标成分的相关系数 R(只列出下三角部分):R=1-0.54 1-0.52 0.94 1
对相关系数矩阵R进行特征值分解,求满足V*D=R*V的特征向量矩阵V与特征值矩阵D,再根据特征值计算各主成分的贡献率,编制程序计算的结果见表2。可见,当提取的主成分数为2时,累计的方差贡献率已达98.14%,基本保留了原样本的信息。按照公式,可以求出第一、第二主成分为:
Y1=-0.4837*x′1 +0.6210*x′2 +0.6167*x′3 ;
Y2=-0.8749x′1* -0.3253*x′2 -0.3587*x′3
其中,x′ 是经标准化变换得到的标准化变量。由各主成分的表达式可以看到,第一主成分的各系数相差不大,说明第一主成分能基本反映各指标的综合情况,第二主成分x′1 的系数权值较高,因此第二主成分主要反映了黄芪甲苷的含量。最后根据特征值计算由第一、第二主成分构造的综合主成分F值,并对F值进行排序,其结果也是对黄芪药材质量综合评价的结果,见表3。表1 黄芪样本含量测定结果(略)表2 特征根、特征向量(α )、各主成分的贡献率(略)表3 综合主成分评价结果(略)
3 聚类分析验证
为了验证综合主成分分析结果的可靠性及客观性,采用系统聚类法对其进行验证。对原始样本数据标准化处理后进行系统聚类分析,采用欧氏距离最短距离法进行聚类分析的结果见图1,再用综合主成分F值作为单变量用同法对原始样本进行聚类分析结果见图2。
可见两者的聚类结果基本一致,说明综合主成分较全面地表征了原始样本的信息。12个黄芪药材基本可以分为两类,即较优品与一般品:其中1、5、9号样品聚为一类,在综合主成分排序中分别占了第2、1、3位,黄芪对照药材排在第2位,质量较优,所以为较优品;在剩下的一般品中还可以分为两类,即3、7、11号样品聚为一类,在综合主成分排序中分别占了第11、10、12位,质量较差,所以为采集样本中的较差品。[3]对12个黄芪药材的指纹图谱进行了相似度评价,结果都在0.90以上,本研究的评价结果显示5、9号样品的品质最接近1号对照药材。
4 结论
综合主成分评价法是在主成分分析的基础上,在不损失或尽量少损失原有指标信息的情况下,将多个具有相关性的指标转换成一个综合指标来进行综合评价,还可以具此对多个评价指标的样本进行排序,评价其优劣。中药指纹图谱的相似性评价是中药质量控制的良好手段,但当所有的样本都具有良好的相似性的时候,再从中选出较优品就比较困难了。综合主成分评价为中药的多指标综合评价提供了新的手段,本研究的结果显示,综合主成分评价结果与系统聚类法一致,质量排序结果具有一定的客观性,值得中药研究工作者。
【参考文献】
1 朱艳科,杨辉耀. 城市化水平的综合评价. 商业研究,2002,259:64~67.
2 袁海锋,徐国盛. 主成分分析法在油气开发方案技术评价中的应用. 国土资源科技管理,2005,80:80~84.
3 胡芳弟,赵健雄,封士兰,等. 黄芪的高效液相色谱指纹图谱及主成分含量测定. 中药材,2004,27(11):831~834.
4 宋瑞霞,余静,梁连生,等. 甘肃黄芪异黄酮化合物对血管内皮细胞凋亡的影响. 兰州大学学报医学版,2007,33(11):43~47.
5 周耘,张卫东. 芒柄花素氨基醚衍生物的合成及体外促兔成骨细胞生长的作用. 中国医药杂志,2001,32(1):9~12.