科学史研究中的计量方法

来源:岁月联盟 作者:刘兵 时间:2010-09-01

    一、引言
在学的中,计量历史学的出现是一重要进展。相应地,在作为历史学的一个分支的史的研究中,定量化的研究也逐渐发展起来,并越来越引起科学史家们的关注。然而,在一般历史学中的计量化和科学史中对计量方法的特殊使用之间,是有着相当大的差异的。科学史中的计量方法的引入,更多地是受到科学社会学、情报学、科学学、科技政策研究,以及近来出现的“科学技术与社会”等研究领域发展的影响,并从中借鉴了相关的研究方法。
对于在科学史中应用计量方法,科学史界亦存在有相当不同的看法。本文,将着重分析在科学史中引入计量方法方面的重要进展,及应用这些计量方法时存在的问题,并尝试对科学史中的计量研究作一初步的评价。
有许多历史学家认为,20世纪以来世界历史学界所发生的三个最有影响的变化,即是马克思主义的传播、法国年鉴学派及计量历史学的兴起。有人甚至声称:“就方法论而言,当代史学的突出特征可以毫不夸张地说是所谓的‘计量革命’”。[①a]但实际上,计量史学这一术语的所指是十分宽泛的,包括的范围可从批判地使用17世纪算术家所建立的简单计数方法,到系统地使用的各种数学模型。它有时指一种史料的类型,有时指一类研究程序,有时表示这种或那种使过去概念化的方法。[②a]
略去更早期的发展不谈,到本世纪,尤其是在50和60年代以来,计量史学在欧洲,特别是美国,其发展异常迅速。它在象人口史、社会史、史和选举史等领域中甚至已成了基本的研究方法。[③a]这是很显然的。因为,在这些学科的计量研究中,可以相对直接地利用历史上遗留下来的大量关于生产、价格、资本、人口、选举等方面的数据资料。但在科学史的研究中,若要采用计量的方法,首先需要解决一个究竟对什么进行度量,也就是说对计量指标(indicator)进行选取的问题。
    二、科学史研究中对科学增长的计量
美国科学史家撒克里(A.Thackray)曾把历史上(从上世纪末到本世纪初)涉及科学史的计量研究分为5类:1,文明史中的计量;2,科学政策取向的研究中的计量;3,对天才人物研究中的计量;4,文献计量统计;5,关于科学进步的社会学研究。[①b]但在这种分类中,有些内容距科学史的研究较远。实际上,在意义上的第一项较完备的科学史计量研究,一般认为是1917年出现的。当时,动物学家科尔(F.J.Cole)和博物学家埃姆斯(N.B.Eames)在其题为“比较解剖学的历史:对文献的统计分析”的中,[②b]对1543—1860年间欧洲各国关于动物解剖学的论文进行了统计,并据此比较和分析了欧洲各国在此期间对比较解剖学的贡献,及不同时期的各种研究、论文和研究者对解剖学发展的影响。1929年,前苏联科学家雷伊诺夫(T.J.Rainoff)也用计量的方法对18—19世纪的物进行了研究,[③b]他通过对文献和物理学发现数目的统计分析,试图把科学发展的涨落和社会经济史联系起来。1938年,美国科学社会学家默顿(R.K.Merton)发表了其博士论文《十七世纪英国的科学、技术与社会》。[④b]这部著作通常被认为是科学社会学的开山之作,而它对后来科学史的研究也有着重要的影响。在此著作中,默顿受到其导师、美国科学史学科奠基者萨顿(G.Sarton)的影响,使用了内容定量分析的方法,例如,通过对《国民传记辞典》中6000多条传记材料、《会报》上约2000篇论文等数据的统计,被用来作为一种客观的检验,来查核各种关于当时当地的科学发展的情况。象这样的研究,还有其它一些。
这些早期计量研究的工作,还并不十分成熟。对于后来的发展,除了计量方法的改进之外,主要体现在对计量指标选取的明确化。就与科学史相关的研究来说,主要可分为两大类,其中,最先得到发展的是对科学增长的计量研究。
但是,关于什么指标能够代表科学的增长,仍然存在问题。其中一种方法,就是选取科学家的人数(绝对人数),或每10万居民中科学家的人数(相对人数)随时间的变化,这可以说是一种关于科学“投入”的指标。另一种方法,则是选择科学的出版物(也即科学的“产出”)作为计量的对象;这种指标可以是科学刊物的数目随时间的变化,也可以是科学论文的数目随时间的变化。在对科学增长的计量研究方面,做出了重要贡献的人物,可举美国科学史家普赖斯(D.J.de S.Price)为代表。他有关的研究从本世纪50年代开始,其结果尤其体现在他于60年代初出版的两本名著《巴比伦以来的科学》[⑤b]和《小科学,大科学》[⑥b]中。
普赖斯注意到,从1665年创刊的《伦敦皇家学会哲学会刊》这一幸存下来的最早的科学刊物算起,科学刊物的数目随时间不断增加,到19世纪初,已有约一百种,到19世纪中叶,有约一千种,而到1900年,则达约一万种之多。通过对科学刊物的积累总数随时间的变化作出曲线,普赖斯发现,除了在最初的起点附近之外,存在着一种相当精确的指数增长的。在此指数增长中,科学刊物大约每隔10—15年左右便增加一倍。由于科学刊物数目以指数方式的剧增,科学家要想阅读所有(甚或仅仅是大部分)与其研究相关的刊物或论文,就因其数量之巨大而变得困难甚至不可能,这样,在大约300种科学刊物问世之后,又出现了文摘刊物。有意思的是,普赖斯发现,各学科领域中的文摘刊物竟也随时间呈指数增加。甚至还不仅仅是科学刊物和文摘刊物,实际上,普赖斯通过统计而发现具有在时间中以指数增长的,还有如下这些指标:象载入国家人名辞典的人物数量,劳动力、人口、大学的数量、国民生产总值、著名的物理学家,重大科学发现,化学元素的数目,仪器的精密度,每千人中大学生的数目,文、理科的学士人数,科学学会成员,化合物的数目,所发现的小行星数目,关于行列式理论的文献,关于非欧几何学的文献,关于伦琴射线的文献,实验心理学文献,美国电话机的数量,美国工程师的数量,的速度,发电量,国际间电话通讯量,乃至铁的磁导率和加速器的能量等等。当然,各种指标的番翻周期从100年到1.5年各不相同。
指数增长的一个特点是,随着时间的推移,所统计的指标的积累会急剧地增大,甚至将趋近于无穷大,在投入科学的人力和财力只能是有限的情况下,这显然是荒谬的。因此,普赖斯等人还通过对一些指标(如科学家人数和科学出版物数目)的统计,提出了科学近似地是以逻辑斯蒂(logistic)曲线或所谓对称S形曲线(也称饱合指数增长曲线)增长的规律。这就是说,当统计指标以指数形式增长到一定程度后,便进入了饱合期,曲线通过一个中点反曲并以对称的增长无限趋向一有限值。
有普赖斯的工作的基础上,又有许多人以科学文献等指标用类似的方法进行了更进一步的研究,提出了科学发展的其它模型。对这些工作这里暂且不一一论及。但普赖斯的工作对科学史研究的影响是最为重大的,也已充分显示了这类计量方法的特点。他的主要目的,是要找出科学发展的某种规律,及对之作出解释,并据这些规律来预言未来的科学发展。他认为,这样的计量是一种客观的方法,例如可以用来评论科学史的分期问题,从中可以看出,第一次科学革命有一种类似先驱的作用,而革命就可能是出于编史学的方便而人为假定的了。他还认为象这些结果与历史学家们关于科学相对活跃和不活跃的时期的直觉相一致。[①c]当然,讲到预言,这已超出了历史研究的范围,何况就连专门的预测学中各种依据过去发展趋势来推断未来的方法,在目前也还都有很大或然性。仅就对过去的历史的研究而言,象普赖斯这种的计量研究也遇到了许多科学史家的批评和质疑。批评的焦点,是集中在象他这种选取表征科学的发展的计量指标的方法背后所隐藏的有问题的若干假定上。这里主要对以科学家数目和科学文献数目作为计量指标来做些分析。
科学,是一个难以确切定义的概念,在此背景下,科学的发展本身就更是一个难以明确表达的概念了。科学文献的数目和科学家的人数确实从特定的侧面反映了科学发展的“规模”,但又绝不等同于普遍意义上的科学发展,而且目前并没有一个科学增长的定义能在所有的情况下优于其它关于科学增长的定义。[②c]以科学家人数作为统计指标来表征科学发展,就引入了对科学家定义的假定。关于什么样的人应被分类为科学家,这里又有不同的标准。例如,他们可以是自称为科学家的人,可以是在科学机构中任职的人,可以是发表过科学文献的人,也可以是其名字在科学文献中出现过的人,如此等等。但应用任何一种判据又都会有相应的问题,例如,以在科学机构中任职为判据,便会把业余从事科学研究的人排除在外;以发表科学论文为判据,则将把在出现科学刊物之前的那些不可能公开正式地将其成果以论文的形式发表的科学家排除在外,亦会把在不鼓励发表科学论文的工业部门从事技术科学(当然也与纯科学的发展有关)的研究者排除在外。何况,科学家角色的特点在历史的演变中也是在不断变化的。
另一方面,科学的发展在某种意义上也可以说是科学知识的发展。如果说对科学家人数的计量问题主要体现在对科学家的分类上,那么,对科学知识的计量单位的定义要更困难得多。而在普赖斯的这种计量方法中所隐含的假定则是:对科学知识的所有贡献皆载于文献之中,科学知识的发展等同于科学文献的绝对数目,或可进一步讲,把对科学知识的计量单位定义为科学文献,假定每一篇科学论文对科学发展的贡献是等量的,同时,通过每篇文献的简单加和可对总贡献进行。其实,就连普赖斯本人也意识到了这个问题:“谁敢把爱因斯坦关于相对论的一篇论文与物理学博士约翰·多依关于下巴苏陀兰森林中各种木材的弹性模量的一百篇论文划等号?”[①d]这里涉及的,是本身就难以定量度量的科学论文的“质量”的问题。再者,普赖斯的计量方法也假定了可以明确地区分“科学论文”和“非科学论文”,而这在历史研究的实践中有时又是难以做到的。因而,这种计量研究所反映的,充其量只能是对学科知识生产的比例的一种非常粗略的度量而已。
作为另一种可替代的度量科学增长的方法,是对“科学事件”的计量研究。“科学事件”可以不限于科学文献的范围。有许多人采用过这种方法。实际上普赖斯在其对科学发展指数增长规律的研究中,也曾采用过这种计量指标。象以所发现的化学元素的数目作计量指标为例,其问题是,这样做必然要采用现代的(因而也是辉格式的)元素概念和标准,而在历史上,对元素的认识和发现的境况则要远为复杂。可以引起我们注意的,还有十多年前几位学者在作中西科学比较研究时,曾初步利用统计中西方科技成果的定量化方法来绘制中西方科技水平累加增长曲线。[②d]为了体现各成果的不同等级(也即对科学技术发展的不同贡献和对社会的不同影响),他们采取了加权打分的方法,例如:牛顿的《自然哲学数学原理》打1000分,哈维发现血液循环打500分,林奈的《自然体系》打100分,康德的星云说和张衡的候风地动仪打50分,盖·吕萨克气体膨胀定律打10分,确定哈雷慧星周期打5分,制取铅白实验打1分,等等。他们当然也意识到,计分标难允免带有主观性,但同时认为这样做不会妨害宏观分析与统计规律的展示。但这种容许主观因素进入的退让,则是与追求“客观”的计量研究的初衷相悖了。更苛刻一点讲,这种计量指标亦假定了科学发现是可定位于特定时间和地点的分立事件,而没有把科学发现看作是一过程,同时,自然也要带入评判某一发现为科学发现的现代标准,而历史上一项科学发现在当时是否真的做出,是只有在当时特定的与境(context)中才好评判的。
美国科学社会学家克兰在其科学社会学名著《无形学院》一书中,还曾提出另一种特殊的度量科学发展的指标。[①e]她提议,在某一研究领域里,出版物中首次提出的新的自变量或因变量,代表着一新的假设形式或对从前假设的修正或革新。因此,某一研究领域的进展,可以通过对每年在此领域的研究文献中发现的新变量的个数的计数来度量。显然,这种方法同样存在问题。例如,一个新变量的引入,可能是重要的进展,也可能对该领域的发展并不重要;要精确地定义一个新变量,有时相当困难,在理论的发展中,不同的符号可能代表同一变量,在不同的理论或理论体系中,同一变量的意义也会有很大的变化(如在牛顿的力学和爱因斯坦的相对论中的“质量”这一变量);再者,象在生物学和地质学等对数学和公式的利用相对薄弱的学科中,这种计量方法也不具有普适性。
    三、科学史研究中对科学交流的计量
与对科学增长的计量研究相对应,另一类在科学史中得到较多应用的计量研究方法,是对科学交流的计量。这种方法主要体现为对科学出版物中引文的计量,它们与60年代美国的《科学引文索引》(Science Citation Index,简写为SCI)的出版密切相关。
1961年,在美国科学情报社(Institute for Scientific Information)的加菲尔德(E.Garfield)的主持下,第一期《科学引文索引》正式问世。它包括了1959—1960年间出版的著作数据。从1963年起,《科学引文索引》开始定期出版。目前,它已成为世界上最详尽的关于科学文献引文的索引和具有引文分析功能的出版物。它具有5种相互联系的检索方式,包括引文索引、专利引文索引、来源索引、机构索引和轮排主题索引。

由于目前在共同体的研究准则中,对前有工作的引证已成为一种规范。因此,对科学之间的引证关系体现了各分立的科学研究工作之间的联系,对这种联系的计量研究,也就是对科学交流的一种研究。自《科学引文索引》问世以来,对科学引文的计量研究迅速,现已成为科学文献计量学研究中的主要部分,它除了在科技政策等领域中的重要作用之外,亦被广泛地应用于象科学社会学等领域,并成为科学史计量研究的一种新方法。
其实,早在1955年,加菲尔德便在《科学》杂志上发表文章,[②e]表述他创立这一工具的设想。其中,除了作为一种对科学文献的主观控制的新方法之外,他尤其提出,当人们试图评价某一特定工作的重要性和对文献的影响时,这种工具对研究将有着特殊重要的用途。同对科学文献数目的简单计数等计量研究相比,引文数据显然对科学的“质量”反映了更多的内容。当然,被引证次数多的论文其影响和重要性一般是更大的,这种判据目前在一些科技政策方面的研究中仍被应用。但加菲尔德也认识到,在特定的时期内,若只以此作为标准,那么,象李森科之类的人就会被当成最伟大的科学家。因此,只是对那些能谨慎地评价数据的历史学家,这种数据才会最有重要性。而只按被引证次数或发表论文的数目来划分等级,是决不会达到一种客观的关于论文的“重要性”的判据的。至于就他本人来说,对历史研究中引文数据的特殊兴趣,则是集中在用机来构造“历史图”的作用上。[①f]
1964年,加菲尔德等人便利用1961年的《科学引文索引》进行了一次尝试性的科学史研究。[②f]正如他们所讲的那样:“这项研究的进行是要考察和检验用来撰写科学史的新的方法论……引文技术确实为学者提供了一种新的工作方法,我们相信,这种工作方法可能对未来的编史学有重大的影响。”他们认为,引文索引是一种对历史学家有用的、有启发性的工具。在他们的假定中,认为科学史是事件的编年序列,其中每一发现都依赖于更早些的发现,科学史家的任务,就是要描述事件,并为在事件之间的联系提供看法,而这些事件对于未经训练的观察者则似乎是彼此独立的。他们以美国科普作家阿西莫夫(I.Asimov)的一本关于DNA的历史的著作《遗传密码》作为出发点,找出其中描述的发展所涉及的特定论文,并构造了一个为阿西莫夫所描述的40个里程碑式的事件(它们对应于引文网络图中的“结点”)构成的拓朴网络图;然后,再利用《科学引文索引》中的相应数构造了另一个类似的拓朴网络图,并将二者相比较。结果,在他们认为是由历史学家所作的“常规或传统的主观分析”与体现了事件间的引文关联的“客观的引文或文献目录的分析”之间,也即在这两个网络图之间,展现出了高度的一致性。他们的结论是:“对于探索历史的相关性,引文模式提供了一种有效的、有价值的手段”。
在引文分析方面更进一步的发展,是1973年由斯莫尔(H.Small)等人引入的共引(co-citation)分析[③f]所谓共引,是指作者A同时引用了作者B和作者C的工作,这表明,在作者A看来,作者B和作者C的贡献是相关的。而一对出版物为其他人共引的次数,则被定义为共引强度。通过这种计量的分析,可以在给定的文献群体中对文献间的联系进行历史的、动态的研究,并辨识出特定时期某一专业领域的“核心”贡献。例如,斯莫尔就曾在1973年用此方法对粒子物理领域进行过研究。当然,由于这种方法对《科学引文索引》这种工具的不可缺少的依赖,显然限制了它对更早期的科学史研究的应用。
随着引文分析方法的发展,已有若干的科学史研究应用了这些计量方法。但是,对于在科学史中利用引文分析的方法,也有许多批评。问题主要也是集中在其背后的假定方面。首先,作为对“智力债务的偿还”,引文成为标准的科学规范之一,但问题是这一规范是否真正为所有的科学家所接受和实践中所遵守?在实际中,引文动机是多种多样的,并非所有的引文都是按规范的标准来引用的,有时甚至与科学的交流毫无关系。例如,引文有时会是“装饰性”的,即为了加重论文的分量,引用了许多对所研究的工作并无实际重要性的文献,而这种情况在科学论文中是相当普遍的;有时,引文又是出于同事间人际关系的考虑,或是为维护某一学派的利益,或是迫于某种压力。1975年,有人通过对《物评论》上30篇论文的研究发现,其中约三分之一的文献是多余的,约五分之二的参考文献是敷衍性的。另一方面还有不引用的问题。现代科学建筑在早期科学的经典结果之上,许多被认为是“不言而喻”的知识,通常是不被体现在引文中的。由于对优先权的考虑或意识形态的考虑,也可能导致不引某些本应引用的文献。至于在科学界实际存在的或多或少的有意剽窃中,就更不会引用那些构成剽窃基础的出版物了。科学社会学家加斯顿(J.Gaston)在研究物理学中对优先权的竞争时,约50%被访谈的物理学家认为,在他们自己的工作应被引用时而未被引用。其中有一物理学家甚至指出,通常出现的情况是,那些发表文章不多的人将不提你的工作,因为使他们的文章发表的唯一方式,就是不提先前已做了同样工作的文章。
除了科学家在引文时有各种不规范之外,引文分析方法所强调的,是一种科学研究中“正式的”交流,是对科学的本质的一种“合理化”的看法。而有人则指出,在实际的科学工作中,更重要的是不通过发表文献的“非正式”交流,因为科学家们要在很大程度上依赖于非正式的信息交流网络,才能跟上科学共同体当前的科研活动。[①g]引文分析方法背后的假定中这些问题,使这种方法在科学史研究中的应用面临着严重的挑战。虽然引文分析作为一种相对独立的计量方法对科学史研究具有“启发性”的作用,但由于科学交流中存在的复杂性,仅仅依靠引文分析的技巧,是难以展现科学发展的完整图象的。
    四、小结
不论是在一般历史学中还是科学史中,引入计量研究的最初目的,是为了要使研究更加“科学”、“精确”和“客观”。正如加菲尔德等人所讲的:“历史学家在描述科学的进步时,局限于他们自己的经验、记忆和可用文献的恰当性。他们的主观判断预先决定了事件发展的历史图象。”[②g]但是,那些为追求客观性而使用计量方法进行研究的历史学家需要意识到:在进行这样的研究时,“他已建构了他自己的‘事实’,他的研究的客观性不仅依赖于他阐述和加工这些事实时对正确方法的使用,而且依赖于这些事实对其假设的相关性。”[③g]如前所述,在科学史研究对计量方法的应用中,正是由于其背后各种假设的不恰当,导致了计量研究与所追求的客观性的背离。
在对科学增长的计量研究中,对计量指标的选取,实际上涉及到科学等学科中对科学的本质、科学的增长和科学家的理解及定义等等相关的问题。在目前的各种理论中,对于这些概念的探讨仍可说是众说纷纭。传统的科学史研究利用描述和叙事的方法,给出的虽然表面上是带有一定“主观”色彩的科学发展图象,但它们与这些基本概念难以精确表述的背景却是相容的。而利用有争议的指标来进行的表面上“客观”的计量研究,则也许并未反映出人们希望要了解的内容。至于科学史中对科学交流的计量研究(主要是通过引文分析方法),其背后假定中存在的问题,同样地是与科学哲学和科学社会学等学科对科学活动之研究的不完善相关的。这些困难和问题的存在,也就导致了科学的发展是否能以定量的方式来进行计量研究的争论。
与一般历史学一样,科学史是一门人文学科。60年代初,美国历史学家施莱辛格(A.Schlesinger,Jr)在与计量史学家的争论中曾断言:“作为一个人文主义者,我的回答是,所有重要的问题之所以重要,正是由于它们不能用计量的方法来回答。”[①h]当然,这样的观点是过于极端了。实际上,在科学史中对计量方法的引进和应用的确是一种对传统研究方法的扩展和进步,并具有启发性。但另一方面,我们也必须注意到计量方法在应用于科学史的研究时所存在的诸多问题,以及所得的结果与应用者的初衷之差距。总之,“在任何情况下科学计量都不能单独成立。若它要有任何历史价值的话,那么它必须被看作是对传统史学方法的一种补充,偶尔地也是一种修正。”在具有这种意识的情况下,“若在与其它方法的结合中谨慎地利用科学计量,它就可起重要的作用,尤其是在对现代科学的研究中。”[②h]

 


①a 杰弗里·巴勒克拉夫,《当代史学主要趋势》,杨豫译,上海译文出版社,1987年,第131页。
②a F.Furet,Quantitative History,in Historical Studies Today,eds.by F.Gilbert et al,W.W.Notron Company,pp.45-61.
③a 王小宽,《国外计量史学的兴起与发展》,《史学理论》,1987年第4期,第123—133页。
①b A.Thackray,Measurement in the Historiography of Science,in Toward a Metric of Science,Y.Elkana,et al,eds.A Wiley-Interscience Pubication,1987,pp.11-30.
②b F.J.Cole and N.G.Eames,The history of Comparative Anatomy:Astatistical Analysis of the Literature,Science Progress,11(1917),578-596.
③b T.J.Rainoff,Wave-like Fluctuations of Creative Productivity in the Development of West-European Physics in the 18th and 19th Centrry,Isis.(1929),287-319.
④b 默顿,《十七世纪英国的科学、技术与社会》,范岱年等译,四川人民出版社,1986年。 
⑤b D.J.de S.Price,Science Since Babylon,Yale University Press,1961.
⑥b 普赖斯,《小科学,大科学》,宋剑耕等译,世界科学社,1982年。
①c D.J.de S.Price,The Analytical (Quantitative) Theory of Science and Its Implications for the Nature of Scientific Discovery,in On Scientific Discovery,M.D.Grmek,et al,eds,D.Reidel Publishing Company,1980,pp.179-189.
②c G.H.Gilbert,Measuring the Growth of Science:A Review of Indicators of Scientific Growth,Scientometrics,1(1978),9-34.
①d 普赖斯,《小科学,大科学》,宋剑耕等译,世界科学社,1982年,第34页。
②d 金观涛等,“文化背景与科学技术结构的演变”,《科学传统与文化》,科学院《辩证法通讯》杂志社编,陕西科学技术出版社,1983年,第1—81页。
①e 克兰,《无形学院》,刘jùn@①jùn@①等译,华夏出版社,1988年,第16页。
②e G.Garfield,Citation Indexes for Science,Science,122(1955),108-111.
①f E.Garfield,Citation Indexes in Sociological and Historical Research.American Documentation,14(1963).289-291.
②f E.Garfield,et al.The Use of Citation Data in Writing the History of Science.Institute for Scientific Information Inc.1964.
③f 参见丁学东编著,《文献计量学基础》,北京大学出版社,第357页。
①g D.Edge,Quantitative Measures of Communication in Science:A Critical Review,History of Science,17(1979),102-134.
②g E.Garfield,et al,The Use of Citation Data in Writing the History of Science,Institute for Scientific Information Inc.1964.p.1.
③g F.Furet,Quanritative History,in Historical Studies Today,.des. by F.Gilbert et al,W.W.Notron Company,pp,45-61.
①h 参见王小宽:《国外计量史学的兴起与发展》,《史学理论》,1987年第4期,第123—133页。
②h H.Kragh,An Introduction to the Historiography of Science.Cambridge University Press,1987,P,196.
字库未存字注释:

图片内容