政府采购中供应商的信用分析

来源:岁月联盟 作者:黄文杰 谢 颖 时间:2010-06-25

  摘要:支持向量机(SVM)是在结构风险最小化的一种新的机器学习技术,在解决小样本、非线性及高维空间问题中具有独特的优势,适用于政府采购中对供应商进行信用分析。但供应商信用属性数据构成了高维空间的稀疏分布,不利于SVM的准确建模。由于主成分分析技术具有良好的去噪音特性,能够对信用属性数据进行有效地挖掘。因此,若将两者进行有机地结合,就能有效改善SVM输入样本的特性,从而提高SVM分类的准确率。
  关键词:政府采购;信用分析;支持向量机
 

  Abstract:Support Vector Machines (SVM) based on structural risk minimization (SRM) principle is a new machine learning technique and has many advantages in solving small sample size, nonlinear and high dimensional pattern recognition. In this paper, it is applied to the credit scoring prediction of suppliers in the government procurement activities. To get better classification accuracy, PCA(Principal Component Analysis) is combined to SVM to mine the independent attributes of supplier credit.And then, SVM is trained by these independent attributes obtained. By this way, the model of PCA-SVM for credit ananlysis of suppliers in the government procurement activities is builtto evaluate the prediction accuracy of PCA-SVM,while comparing its performance with those of neural networks (NN) and traditional SVM.
  Key words:government procurement;credit analysis; support vector machines
  
   政府采购不同于一般的采购行为,它具有政策性强、规模大、资金多等特点。政府采购项目,尤其是国家重点建设项目,如北京奥体项目、南水北调工程、三峡工程等,更是集性、性、社会性于一身,对国家的社会效益、政治效益和经济效益都会产生广泛而深远的影响。因此,在政府采购中为避免国家的财税流失、保证政府投资效益,提高政府采购效率,必须规范政府采购市场,促进供应商在市场竞争中遵守国家、法规,规范经营,并将对供应商的管理提高到信用管理的高度。
  在市场经济环境下,良好的履约能力对政府采购项目按时、保质、保量地完成是十分必要的,而供应商履约能力是与其信用水平密不可分的。因此,在对供应商进行规范化管理过程中,政府部门应对供应商的信用进行公正、客观地分析。这具有很强的理论与现实意义,引发了国内外学者广泛的研究和探讨[ 1-3]。常用的信用分析方法包括层次分析法、模式识别理论和神经等。由于信用分析具有多属性和非线性等特征,这些方法在应用中都很难取得满意的效果。
  笔者尝试将数据挖掘技术与机器学习方法相结合,建立基于主成分分析——支持向量机技术的供应商信用分析模型。通过主成分分析技术进行数据挖掘,改善了信用属性数据的特性,提高了支持向量机的建模效率。
  
  一、模型的总体设计
  
  供应商信用分析效果的好坏,主要取决于信用分析中所选用的属性数据的特性以及所采用的方法解决非线性复杂问题的能力。
  当前,商业信用分析主要是通过基于财务指标的信用特征而进行的商业信用等级划分。由于财务属性数据种类繁多,且数据之间往往存在紧密的相关性。这无疑加大了信用分析建模的难度。因此,有必要在进行信用分析之前,对信用属性数据进行数据挖掘。在众多的数据挖掘技术中,主成分分析方法既能够有效去除属性数据间的相关性,又可以降低数据维数。因此,它被选作供应商信用属性数据特征挖掘的工具,以构造新的更有效的信用属性数据。
  数据挖掘后,接着面临的问题是如何有效地构建供应商的信用分析模型。由于在政府采购多采用“短名单”,这就造成了供应商的信用分析具有典型的小样本、多属性及非线性等特征。传统的信用分析方法很难进行有效地分析。神经网络技术虽然能够进行良好的经验学习[ 2],但由于其基于经验风险最小,易出现过拟合问题,从而降低了模型的泛化能力。
  20世纪90年代兴起的支持向量机(Support Vector Machines,SVM)是基于结构风险最小化原理的统计学习方法, 适用于小样本分类问题。在解决高维、非线性问题时,SVM通过非线性映射把非线性分类化为线性问题来处理。从而,显示出其显著的优越性[ 4-5]。因此,SVM技术是进行供应商信用分析建模的有效工具。
 
  笔者将PCA技术与SVM技术相结合构建政府采购中供应商的信用分析模型,建模的基本过程如图1所示。
  
  二、信用属性数据的特征挖掘
  
  主成分分析方法目前主要有两种:标准主成分分析方法和基于核的主成分分析方法。
  (一)标准主成分分析
  标准的主成分分析是一种有效的数据特征挖掘方法[ 6]。它基于数据二阶统计矩,对由一系列观测数据向量组成的向量组进行分析,通过选择样本点分布方差大的坐标轴进行投影来降低维数而使信息量损失最少。
  记供应商的信用观测属性矢量为:
  
  (二)基于核的主成分分析方法[ 7]
  基于核的主成分分析方法(Kernel Principle Component Analysis, KPCA)是一种非线性特征挖掘方法, 其基本思想是利用核函数, 通过非线性映射将输入数据映射到一个高维的特征空间中,然后在特征空间中利用标准主成分分析法来挖掘主成分作为特征向量。
  
  实践证明,PCA与KPCA都能够获得良好的特征挖掘效果[ 6][7]。虽然与PCA相比,KPCA挖掘后的道德标准均方误差更小,但是KPCA需要大量的主成分,要耗费大量的时间进行,这对于供应商信用管理信息系统的建立和维护是不利的。由于PCA完全能够满足精度要求,在本文中被采用进行信用属性数据的特征挖掘。然后,将挖掘出的新的属性样本数据用于支持向量机的信用分析建模。

  三、信用分析模型的建立
  
  在政府采购项目中能够得到供应商各种类型的信用数据十分有限,这些数据构成了信用分析输入空间的稀疏分布。此时,若利用神经进行信用分析建模,由于神经网络是以经验风险最小化进行优化,易引起过拟合问题,从而影响模型的泛化能力,并且易陷入局部极小点。
  与其相比,支持向量机分类的基本思想是通过建立一个超平面作为一个决策平面。它不但能将分类中的两类样本正确分开,而且还使分类间隔最大。在分类过程中将优化问题转化为一个凸二次规划问题,由标准的拉格朗日乘子算法解得具有较高精度的全局最优解[ 4][5] [7]。
  
  (二)非线性问题
  SVM解决非线性问题的基本思想是基于Mercer定理,通过选用适合的核函数,将样本空间映射到一个高维的特征空间,在此特征空间中求解线性问题。
  此时,目标函数变为[ 4][8]:
  
  (三)模型评估
  根据信用分析的特点,本文定义信用分析模型的评估指标如下:
  
  式中:N表示样本的总数量,ci表示第i分类被错分的样本数量。
  在两分类问题中,k=2,可以定义两类分类错误:第一类错误为将信用“好”的供应商误判为“差”;第二类错误为信用“差”的供应商误判为“好”。
  
  四、实证分析
  
  选取参加政府采购活动的32位供应商进行信用分析。其中,有9位供应商经营状况欠佳,其余的供应商经营状况正常。利用?Matlab?实现与模拟。由于在样本中存在两类样本数据,因而对供应商进行两模式的信用分类。选取的属性数据类型如下:流动比率(C1)、速动比率(C2)、负债/权益比率 (C3)、存货周转率(C4)、总资产报酬率(C5)、资产负债率(C6)、长期负债比率(C7)、销售利润率(C8)、利息保证倍数(C9)等,原属性数据样本如图2所示。?
  
  首先,利用PCA进行数据挖掘,特征值见表1。生成了三个主成分,贡献率累计为99-06%,能够完全满足信用分析的要求。相应主成分的特征向量见表2,构造的新属性数据如图3所示。
  
  通过对图2与图3的对比可以看到,新的属性数据在完全能够满足信用分析的前提下,比原属性数据更加平稳,这对于后面的支持向量机建模是非常有益的。
  采用新的属性数据进行SVM分类的训练建模,设惩罚因子C=100,选择高斯径向基函数作为核函数。分别选取26个样本作为训练样本,6个样本测试样本,采用不同的算法对供应商的信用两模式进行判断,结果如表3所示。
  
  从表3可以看出,在分类正确率方面,普通SVM模型和本文模型明显优于ANN算法,SVM与本文模型相比,本文模型的正确率高于普通的SVM。说明由于引入PCA技术对信用属性数据进行挖掘,改善了属性数据的表征能力,从而提高了模型的准确率。
  
  五、结语
  
  笔者在应用支持向量机进行供应商信用分析过程中,引入PCA进行属性数据特征挖掘,提高了支持向量机的推广能力和建模效率,为今后政府采购中供应商的信用分析提供一种可借鉴的方法。实例和分析的结果表明所建信用分析模型的质量比较高,验证了其有效性。
  
  :
  [1] Yurdakul M ustafa, Yusuf Tansel. AHP app roach in the credit evaluation of the manufacturing firms in Turkey[J].International J ou rnal of P rod uction E conom ics, 2004,88 (3) : 269 289.
  [2] 郝丽萍,胡欣悦,李丽.利用BP网络模型对商业银行信贷风险进行分析和预测[J].系统工程理论与实践, 2001,21(5): 66-69.
  [3] 齐巍巍,李友华.商业银行公司治理与信用风险管理的博弈分析[J].商业研究,2005(10):68-70.
  [4] 庞素琳,王燕鸣,罗育中.多层感知器信用评价模型及预警研究[J].数学的实践与认识,2003 ,33(9) :55 - 62.
  [5] Theodore B T and Huseyin I. Support vector machine for regression and application to financial forecasting[J].Proceedind of the IEEE-INNS-ENNS International Ioint Conference on Neural Network,2000,(6)pp:348-353.
  [6] L. J. Cao and Francis E. H. Tay. Support Vector Machine With Adaptive Parameters in Financial Time Series Forecasting[M].IEEE TRANSACTIONS ON NEURAL NETWORKS, VOL. 14, NO. 6, 2003,NOVEMBER pp: 1506-1518.
  [7] Li Aijun, Luo Siwei, Liu Yunhui, and Nan Zhihong.Combining PCA and Entropy Criterion to Build ANN's Architectures[M].Proceedings of the Third International Conference on Machine Learning and Cybernetics,Shanghai,26-29 Auguest 2004,pp:3052-3055.
  [8] Chengjun Liu.Gabor-Based Kernel PCA with Fractional Power Polynomial Models for Face Recognition[J].IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, VOL. 26:572-581, NO. 5, MAY 2004.
  [9] V. N. Vapnik.The Nature of Statistical Learning Theory. New York[M],1995.