经典秩和比法详解

来源:岁月联盟 作者:陶庄 时间:2010-07-12

【摘要】  目的:使面向医疗卫生领域的一线工作者清晰地了解秩和比(RSR)法,并将其应用于实践。方法:利用2003年SARS疫情报告卡,使用秩和比(RSR)法对几个省的缺漏项进行综合评价。结果:通过8步分析,完整的示范了秩和比(RSR)法的使用方法。结论:秩和比(RSR)法简便、易用,是一个可以满足基层卫生统计工作实践的统计方法。

【关键词】  秩和比法; 综合评价; 编秩

 1  背景

  秩和比(RSR)法是由我国著名卫生统计学家田凤调先生创立的一种综合评价方法,它最大的优点就是较其它方法易于理解、易于操作,特别适合广大基层卫生工作者。可以说,田先生的方法解决了我国卫生工作中综合评价方面的主要矛盾,这就是我国广大基层卫生工作者急需进行综合评价工作和普遍缺乏相应卫生统计学知识及人才的矛盾。然而,在应用RSR法的实践中存在各种问题,主要就是依葫芦画瓢,虽然也做出结果,但并不完全理解其中的含义,最后造成对整个方法和结果的理解偏差。另外,在RSR法中有些内容我们还可以用比较成熟的统计理论改良,而这些理论又是被大多数只有初级卫生统计学知识的人所熟知的,两者结合,有利于对RSR法的理解。本研究通过一个工作中的实例,力图完整的阐述RSR法的用法、意义及其注意事项。

  2  材料和方法

  这里,我们将使用RSR法对2003年SARS流行期间,各省传染病疫情报告卡的缺漏项情况进行评估。实战中,只选择了4个重要指标进行此评估。为了较方便的说明问题,我们只选择了问题较严重的9个省进行示例(由于仅为方法示例,故此处隐去各省和指标名称)。其中的数字是该指标缺失的比例(%),当为“-”时表示该比例趋向于0。见表1。

  表1  9省SARS病例报告缺漏项比例情况统计表(略)

  下面,我们将对该资料进行经典的RSR法分析并加以逐步的解释,并对其内在的含义加以讨论。

  3  分析过程和结果

  3?1  评价指标的选择对于任何综合评价来说,评价指标的选择都是至关重要的,在RSR法中也是如此。选择评价指标的原则主要有:① 尽量能够全面反映整个事物,尽量选择代表性强的指标。② 在RSR法中将评估指标的区分能力分为优、偏优、稍优,不分几等,在实战中我们应尽量使用区分能力分为优等(分高低优)的指标,尽量不用不分的指标。③ 使指标间的相关性尽可能不强,如果指标间具有较强的相关性,会给最后的分析结果带来偏移。在不违反第①、②条原则的情况下,应不纳入评价系统。如果选择的指标具有较强的相关性,而实际工作中又不宜将其摒弃,就应该对这些指标加权(体现在秩次上,后述)。指标权系数Wi的确定应该从专业和相关大小等诸方面来考虑,一般来说,Wi的取值应在0~1之间,并且有ΣWi=1。一般来说是不用给被评价单位加权的,但在某些特别的情形下,如被评价单位的级别不同,则应该为其加权。对评价指标和权系数的确定方法很多,实际工作中可以酌情选用。

  3?2  编秩在RSR法中,按各评价指标分别对被评价单位进行编秩,情况越好,秩次应编得越高。如甲的秩次为2,而乙的秩次为1,说明对甲的评价要高于乙。当有相同值存在时,应使用平均秩次。对于评价指标,从评价方向来说,分为高、低指标,前者是取值越大越好,后者反之。所以在遇到低指标时,应该反向编秩。从区分能力来说,又可分为优、偏优、稍优、不分,与方向组合就称高(低)优、偏高(低)优、稍高(低)优等,在一般情况下建议只选择高(低)优指标进行评价。这里为了示例,列举了所有情况,见表2。

  表2  9省SARS病例报告缺漏项比例情况统计表(略)

  注: * 原始数据其实都为高优指标,此处由于进行示例,故使用非高优的编秩方法。编秩的方法为:① 高优指标从1编到9(低优反向编);② 偏高优先从1编到9,然后其秩次加上秩次的中位数(即1到9的中位数,这里是5,下同),再除以2,其通式为(R+Rm)/2;③ 稍高优先从1编到9,然后其秩次加上秩次的中位数,再除以2(此时为偏高优秩次),然后其秩次再加上秩次的中位数,再除以2,其通式为(R+3Rm)/4。另外,由于某些指标的性质不是单调的,超过太多或低于太多都不好,此时就应该设其拐点为标准值,可以用原指标值与标准值的比进行编秩。注意,通过转换原指标值与标准值的分子分母位置,保持该比值小于或等于0(高优情况下)。

  3?3  RSR值的RSRj=∑m     i=1Ri     n×m ,  j=1,2,…,n(1)RSRj为秩和比,Ri为每一个被评价单位、每一个评价指标的秩,n是被评价单位数,m为指标数。公式(1)是经典的RSR计算公式,此时的秩次没有被加权,或者说它们的权重是相等的,即指标的权重都等于1/m,而被评价单位的权重都是1/n。当秩次被加权时,秩和比就要用公式(2)来计算,其中Wi,W?j分别是指标和单位的权重。见表3。RSRj=W?j ∑m     i=1WiRi,  j=1,2,…,n(2)对一个较简单的评价来说,此时已基本完成了初步的分析。从RSR栏可看出,乙省和庚省的RSR值最大,可认为缺漏项问题最严重;而丁省和丙省RSR值最小,可认为缺漏项问题最轻。如果我们不仅想得到直观的印象,还希望知道更为详细的信息,就需要依以下步骤进行。在经典的RSR法分析中,接下来要进行RSR分布的确定,分档等工作,此处笔者将打乱这个步骤。

  表3  9省SARS病例报告缺漏项比例情况统计表(略)

  3?4  RSR的区间估计在3?3中,我们对各被评价单位的RSR进行了点估计,由于误差,我们还要进行RSR的区间估计。由于RSR为0~1,可以认为是一个百分数,根据一般的分寸,我们可对RSR进行平方根反正弦变换,当RSR为1时,以(1-1/4n)代替。变换后,替代值y为0~90(按角度),此时我们认为y近似正态分布。变换公式为:y=sin-1RSR 变换(此时算出的是弧度值,需乘以180/π以变为角度值)。此时,sy=820.7     N, 此处的N是格子数,本例即为36。此时y的区间即为:y±usy。本例中n为36,故使用上式进行变换,其中sy=4.7746,在计算y的区间后再逆推出RSR的区间即可。如表4,图1,2。

  表4  RSR的区间估计表(略)

  3?5  各组RSR值的比较虽然表3中的RSR值各不相同,但不能因此就说明它们的不同是有显著性的,应该进行假设检验。为了方便,我们其实是对RSR的平方根反正弦变换值y进行检验。如果只有两组被评价单位,我们可以直接使用y的95%的可信区间来检验。如当仅有乙和丁省进行评价,得数据如表4,则可看出,丁的均值在乙的95%的可信区间外,此时可认为两省的RSR有显著性差异,此时相当于进行了一次u和t检验。但如果像本例这样,为多单位评价,那么还使用这个方法,就会大大增加犯第一类错误的概率,所以此时应使用q检验、LSD?t检验或Dunnett?t检验(用于几个组与一个对照组的比较)。如LSD?t检验的公式为:t=A-B     2MS误差/n 公式中的MS误差可用sy=820.7     N来替代,N为评价指标数。本例使用LSD?t检验,甲省和乙省的t值为3?1989,υ=36(总格子数)-9(被评价单位数)=27,查表得t0?05,27=2.052,t>t0?05,27,P<0.05,所以,甲乙两省的RSR值是有显著差异的。依此类推,可以进行任两个感兴趣的省份RSR间的显著性差异的检验。

  图1  各省y值及其95%可信区间(略)

  图2  各省RSR值及其95%可信区间(略)

  3?6  RSR值的分布由于RSR法的非参数性,所以求RSR值的确切分布是困难的。在RSR法中是通过将RSR值的累积频率与概率单位进行对应,是RSR值的分布转化为正态分布而进行的。本例见表5。

  表5  RSR值的分布(略)

  注: * 按RSR值从小到大排序;** 此处以(1-1/4n)×100估算。以RSR为应变量,概率单位Y为自变量进行线性回归,得RR=-0.1248+0.1290Y,P=0.0001,R2=0?90,在经典的RSR法分析中,认为R2>0.90较好,笔者认为过于严格,此时的RSR值已经有较好的正态性,可以接受。

  3?7  被评价单位的分档在经典的RSR法分析中,分档是紧接着分布进行的,此时,可按照概率单位Y进行分档,如本例可分为3?、4?、5?、6?四档。

  表6  被评价单位的分档(略)

  当然,我们还可以采用更为普遍的分档方法,如离差法和百分位法分档。前者是利用RSR的正态性,将RSR按、±s、±2s分档;而后者可以直接RSR的百分位数,按P5,P20、P50、P80、P95分档。这两种方法由于运用较广,此处不再冗述。

  3?8  一致性检验作为一种综合评价方法,我们在评价的最后总是要进行一致性检验,来判断评价指标(或评价者)对被评价单位的评判是否一致。其零假设H0:评价不一致(即各指标对被评价单位的判断是独立的);备择假设H1:评价一致(即各指标对被评价单位的判断是不独立的,有相关的)。当接受H1时,我们认为各评价指标评判方向是一致的,即如果甲省A指标秩次高,则其它指标秩次也相应较高,否则说明,各被评价单位在不同的评价指标上的表现是不一样的。一致性检验的方法主要使用等级相关的概念和方法,在RSR法中使用的是Kendall W和谐(协同)系数检验。其公式为:W=12n∑n     i=1RSR2i-1     n∑n     i=1RSRi2     n2-1其中n为被评价单位,RSRi为各单位RSR值,m(n-1)W→x2(n-1)。本例W=0.25,m(n-1)W=8,查表得P>0.25,接受H0,故认为各省缺漏项的情况是不一样的,某省可能A项缺漏较多,可是B项则缺漏较少。应当指出的是原公式中使用的是秩和(Ri),而此处使用的是秩和比,其推导公式可见[2]。

  4  讨论

  RSR法像灰色模型一样,都是由人自己创造的统计方法。由于立足于本国的实际情况,而更易于为国人,特别是广大基层工作者所接受。当今中国技术应用的最大问题,并不是无法最快跟踪世界上最先进的科技知识的问题,而是我们已有的知识(包括一些较基础较“老旧”的知识)不能充分应用于实践的问题。相当多的科技工作者一味求新求洋,而忽略了对已有的科技知识在全国基层的推广和应用,从而造成了知识与生产力脱节,最终浪费了宝贵的资源。我国的基层卫生防疫部门专业统计人员少,但日常工作非常复杂和烦琐。对于上级统计部门来说,要提高统计质量,一方面固然应该多创造机会对基层工作人员进行培训,而另一方面则应多研究一些简明的统计方法应用于实际,以解燃眉之急。RSR法的优点很多:简便、易用,而且可以和许多其它统计方法联合应用,虽然完整地运用该法需要8步,但在现场工作中一般只需前面3、4步即可。所以,我们认为RSR法是一个可以满足中国基层卫生统计工作实践的统计方法。可能有的人会问:为什么要计算秩和比,作为相对大小,它和秩和不是一样意义的么?其实,计算秩和比的优点有二:一是可以较直观的看出大小,越靠近1评价越高,否则越低;二是可以对RSR值使用平方根反正弦变换以进行区间估计,进而进行分布、分档、比较等进一步的分析工作。作为非参数的综合评价方法,RSR法也存在着其它综合评价方法的痼疾,即只能在本次评价内使用RSR值,而不能和别的评价相互比较。这点缺陷应是所有研究非参数综合评价方法的工作者需要研究的课题。对被评价单位的两两比较问题,经典的RSR法只研究了两组的情况,本研究提出使用方差分析中两两比较的检验方法,能较好的解决这一问题。在经典的RSR法中,我们一般可以对RSR的分布进行近似的估计,但是在有些场合,RSR值不呈正态分布,所以,对RSR的分布还应进一步研究。另一方面,由于有时RSR值不呈正态分布,那么使用概率单位法进行分档就不恰当,此时可使用本研究提出的百分位法直接进行分档,也可取得容易理解的结果。关于RSR法的计算机实现问题,一些统计学家已经有所研究,有兴趣的读者可参见文献[6]。

  5  结论

  总之,秩和比(RSR)法简便、易用,且对分布、检验等问题都进行了解释,而且可以和许多其它的统计方法联合应用。所以,RSR法是一个可以满足中国基层卫生统计工作实践的统计方法。当然,作为一个统计学方法,RSR法也要在实践中经受考验,并不断完善自身,只有这样,RSR法才真正可以在高速的统计学方法中占据一席之地。

【文献】
    1 杨树勤,主编?中国医学百科全书·医学统计学?上海:上海科技出版社,1985?

  2 田凤调?秩和比法及其应用?北京:中国统计出版社,1993?

  3 田凤调,陈育德,主编?实用卫生统计学?北京:人民卫生出版社,1994?

  4 吴喜之,主编?非参数统计?北京:中国统计出版社,1999?

  5 倪宗瓒,主编?卫生统计学?第4版?北京:人民卫生出版社,2000?

  6 陈冠民,陈华,余松林?秩和比综合评价的SAS计算程序?中国统计,2001,8(1):59~60?

  7 孙振球,主编?医学统计学?北京:人民卫生出版社,2002?

  8 田凤调?秩和比法的应用?北京:人民卫生出版社,2002?