数据挖掘在人力资源信息化管理中的应用

来源:岁月联盟 作者: 时间:2010-06-28

                    作者:董洪敏 衣龙海 辛爱莉

 [摘要] 人力资源管理系统因其能提高人力资源管理工作效率、提高管理水平、为决策提供信息支持而备受的青睐。通过对决策树方法用于发现其中有价值的数据模式,寻找其中存在的关系和规则,以期帮助企业对这一系统能够有更全面地认识,促进企业人力资源管理水平实现跨越式提升。
  [关键词] 人力资源管理 信息技术 数据挖掘 决策树分类方法
  
  一、人力资源管理信息化的史
  进入21世纪后,市场竞争加剧,企业生存压力增大,越来越多的企业认识到,企业的竞争其实质上就是人才战略的竞争。因此,企业对人力资源管理的关注达到了一个空前的程度。同时,人力资源管理在企业管理中的地位,也被提升到了战略决策支持的高度。企业人力资源管理已经经历了三个发展阶段:人事管理、人力资源管理、人力资源开发与经营。企业的人力资源管理正在经历着从事务性管理角色向战略合作伙伴的转型,借助于信息化系统,是转型的必由之路。
  随着人力资源管理思想以及信息化技术的不断发展革新,人力资源管理信息化系统也在不断的发展和完善。总体而言,我们可以将人力资源管理信息化的发展历程划分为四个阶段:基础工具阶段、信息数据存储阶段、全面业务管理阶段、战略决策支持阶段。而数据挖掘技术的产生与应用。第四代的人力资源管理信息化系统除了要继承前几代信息化系统的优点之外,还必须提供强大的数据挖掘和分析功能,并且能够将分析结果数据灵活、多样、便捷的进行展现,以真正做到对企业经营决策的有力支持。
  二、数据挖掘技术在人力资源管理系统中的应用
  数据挖掘(Data Mining),又称数据库中的知识发现 (Knowledge Discovery In Database,KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡的及有潜在应用价值的信息或模式,它是数据库研究中的一个很有应用价值的新领域,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。数据挖掘是进行数据查询,它能够找出过去数据之间的潜在联系,从而促进信息的传递。数据挖掘工具能够对将来的趋势和行为进行预测,发现其中有价值的数据模式,寻找其中存在的关系和规则,从而很好地支持人们的决策。
  数据挖掘可以结合企业信息化环境特点,对现代人力资源管理中的主要管理业务流程进行了优化和重组。本文中提出了一种基于数据挖掘的信息论的综合评价方法,该方法中利用决策树、分类器概念以及相关性分析,先对初选的数据进行筛选.再进行建树,然后进行修剪树,进而得出了综合评价模型并同时给出了相应的算法。
  决策树是一个树形的结构,内部节点上选用一个属性进行分割,每个交叉都是分割的一部分;每个叶子节点表示一个分布。决策树最基本的生成算法是贪心算法,它采用自上而下而治之的方法。开始时,所有的数据都在根节点,属性都是种类字段(如果是连续的,将其离散化),然后所有记录用所选属性递归的进行分割,属性的选择是基于一个启发式规则或者一个统计的度量。当一个节点上的数据都是属于同一个类别或者没有属性可以再由于对数据进行分割时,则停止分割并生成一个叶节点。因此,决策树的生成关键是在每个节点上分类属性的选择。在本例中选择经典的ID3算法,即利用基于熵的最高信息增益法选择属性,信息增益法的简单介绍如下:

 


  设S是有s个数据库样本的集合。假定类标号属性具有m个不同的值,定义m个不同类Ci(I=1,2,…m)。设si是类Ci中的样本数。对一个给定的样本分类所需要的期望信息由下式给出:
  
  
  其中pi是任意样本属于Ci的概率,一般用si/s估计代替pi。
  设属性A有v个不同值{a1,a2,…,ay}。可以根据属性值将S划分为v个子集{s1,s2,…,sv}:sij是子集Sj中类Ci的样本数。由A划分成子集的熵(期望信息)为:
  
  
  则以A分枝将获得的信息增益是:
  Gain(A)=I(s1,s2,…, sm)-E(A)
  在选择好数据挖掘的技术和方法后,下面就要对其建立模型,这是数据挖掘的核心环节。不同的技术方案产生的结果模型有很大不同,而且模型结果的可理解性也存在较大差异。例如,用决策树方法产生模型结果就比用神经技术的结果易于理解。另外,对结果的分析和描述(即进行知识发现)也很关键,不恰当的描述会造成误导。 通过上面的处理之后,就会得到一系列的分析结果和模式,它们是对目标问题的多侧面的描述,这时需要对它们进行验证和评价,以得到合理的完备的决策信息。可以采用的方法有直接使用原来建立模型的样本数据进行检验,或另找一批数据对其进行检验,也可以在实际运行中取出新鲜数据进行检验。
  这种方法的优越性具体体现在:
  1.决策树方法所用时间少,技术上合理,上合算,成效高,可避免决策失误与各类偏差。
  2.它是从实际出发,分析主、客观条件以及过程中可能发生的变化及结果的利弊,经过精密的和的预测后作出的决策。
  3.选优的条件是不仅有一个合理的科学标准,而且还有一个科学的选择方法,具有很高的科学性。
  三、结束语
  数据挖掘技术及其应用是目前国际上的一个研究热点,并在许多行业中得到了很好的应用,尤其是在市场营销中获得了成功,初步体现了其优越性和发展潜力。在人力资源信息管理领域,综合应用数据挖掘技术和人工智能技术,将是实现人力资源开发与经营的必经之路。
  :
  [1]邬锦雯:人力资源管理信息化.清华大学出版社, 2006.3
  [2]高翔彭正龙:浅析信息技术下的人力资源管理模式. 经济与管理, 2003.4
  [3]王预:数据挖掘的应用研究.信息导报, 2007.1