社会网络分析方法在图情领域合著关系的实证研究

来源:岁月联盟 作者:荣先乾 覃桃 时间:2014-06-25
  3.3 研究工具
  关于社会网络分析的工具很多,其中常用的有Ucinet、Pajek、NetDraw。Ucinet是由Borgatti、Ev-erett和Freeman合作开发,在社会网络分析方面的功能较为全面,包括了常用的社会网络分析方法,缺点是只能处理小型的社会网络。Pajek““由卢布尔雅那大学的VladimirBatagelj和DrejMrvar开发,主要用于社会网络分析,特点是网络可视化和处理上百万节点的大型网络。NetDrawt也是一款社会网络分析的可视化工具,不过它同样不支持大型网络的社会网络分析。
  本文的研究将主要结合Pajek和Ucinet工具进行社会网络分析。
  
  4 研究结果分析
  
  4.1 图情领域合著网络分析
  在试验采集到的数据集的基础上构建了图情领域合著网络,表2比较了图情领域合著网络静态属性统计与国外其他数据集的差异。
  在图情领域,平均每位作者发表2.71篇论文;平均每篇论文由1.57位作者合著。同国外的数据相比较,图情领域平均每个作者发文数和平均每篇文献合著作者数都相对偏低(特别是后者),这反映了目前我国图情领域整体的合著率较低,著者独立发文和导师带一个学生发文的情况比较多。而由团队合著发文的情况较少。
  图3记录了图情领域文献的作者合著数分布。图情领域的平均度为3.26,就是说平均每位作者拥有3.26位合著者。该指标同国外的数据集相比偏低,也同样反映了图情领域的合著强度偏低。
  整个图情领域的合著网络并非一个连通图,实验中取合著网络的最大连通子图分析。图情领域合著网络最大连通子图的平均路径长度为8.7,说明任意两个合著者平均通过8.7个作者发生关联,聚集系数为0.452。该连通子图拥有较小的平均路径长度和较高的聚集系数,基本符合Watss等人于1998年在Nature上提出的“小世界”现象。
  图情领域最大连通子图节点数量仅占节点总数的55%,说明图情领域的整体研究状况比较分散,还有大部分的作者游离在最大连通子图之外,与最大连通子图圈里的作者没有任何交流,该指标同样反映了图情领域的合著状况并不理想,图情领域的著者之间应该进一步加强交流与合作。
  4.2 图情领域合著网络与web合著网络的比较
  整个图情领域合著网络拥有25 712位作者,其中发文最多的作者发表了131篇论文。由于整个合著网络极其庞大,如果将整个网络与web学术网络进行比较,可行性不高。前面已经介绍,笔者根据普赖斯定律,选取了图情领域的1215位核心作者重新构建合著网络(下文称enLis网络)进行研究。同时抓取了l 215位核心作者在Coogle Scholar中的共著信息,构建了web学术网络(下文称webLis网络)。下面将对这两个网络进行比较研究。
  4.2.1 网络基本参数比较。网络密度反映了网络中节点的紧密和稀疏程度。通过Ucinet计算cnLis网络和webLis网络的密度分别为0.0061和0.0718。这说明,图情领域的核心作者在Google Scholar中的合著关系要紧密的多。原因是cnLis网络仅仅采集了图情领域核心期刊中的共著信息,而GoogleScholar却收集了范围更广的期刊以及教材中的共著信息,同时Coogle Scholar中包含了大量的重复信息,对返回信息的去重处理并不理想。
  最大连通子图占整个网络的比例在两个网络中分别是0.620和0.937。webLis网络的值更高,说明在webLis中更多的作者关联在一个大的子图中。该值的偏大和上面网络密度在两个网络中的差异性表现原因一致。
  4.2.2 网络中心性比较。点度中心性反映了作者的合著次数。cnLis网络和webLis网络的平均度分别为7.411和87.213,两个网络的最大度分别是107和1443,两者之间相差甚远。这也是因为GoogleScholar收录了更广泛的合著信息以及包括了很多的重复信息。表3列出了两个网络点度中心度排名前十的作者,同时与发文量排名前十的作者进行比较。通过比较发现,发文量排名比较靠前的,如张晓林、马海群等,在度排名中却比较靠后,这说明这些作者独立发文比较多。而在webLis的度排名中,王丽、张建、李明、王玉、王伟等作者排名非常靠前,除去这些高几率重名作者后,两个网络的点度中心度排名基本一致。
  中间中心性反映了作者对资源的控制能力。表3列出了两个网络中间中心性分布排名前十的作者。两个网络的中间中心性排名分布差异极大,观察发现,web学术网络中间中心性排名靠前的基本上也是一些高几率重名作者。如果需要使用web库近似代替学术数据库进行社会网络分析研究,必须要解决重名问题。观察cnLis网络,可以发现刘刚、邱均平、张玉峰、张晓林等作者对学术资源具有较强的控制能力。
  4.2.3 核心节点比较。分别对两个网络进行核心节点分析,找到cnLis的核心节点9个:刘家真、王世伟、蒋永福、邱均平、张晓林、王知津、孙莉、刘刚、刘莉;webLis的核心节点19个:刘家真、梁灿兴、李家清、彭靖里、周九常、包和平、马恒通、秦珂、黄晓斌、张玉峰、蒋永福、邱均平、靖继鹏、马海群、王知津、张晓林、刘磊、刘刚、王军。cnLis的核心作者基本上在webLis中都可以找到,不过webLis找到了更多的核心作者。在两个网络中都出现的核心作者有:刘家真、蒋永福、邱均平、张晓林、王知津和刘刚,这表明了这些作者在图情领域的核心地位。
  
  5 结论
  
  本文构建了整个图情领域的作者合著网络,对该网络的一些基本参数如平均每个作者发文数、平均每篇文献合著作者数、平均度、最大连通子图的直径、网络平均路径长度等参数进行了分析,并把这些参数与国外其他领域的合著网络进行了比较,发现目前国内图情领域的合著强度不大,独立发文的作者比较多,还有大部分的作者游离在最大连通子图之外。
  同时,本文对图情领域核心作者的学术合著网络和web合著网络的网络密度、中心性、和核心节点进行了比较,研究的目的是为了考察是否可以使用web合著网络近似模拟学术合著网络进行社会网络分析。比较发现,web合著网络的密度、中心度与学术合著网络相比都偏高,有些地方出入还相当大。原因是构建web合著网络的时候,没有考虑到对重复文献的消岐和作者的重名消岐,这也是笔者今后在构建web合著网络时需要进一步考虑改进的地方。

图片内容