基于博弈论的制度有效性分析

来源:岁月联盟 作者:张文健 时间:2010-06-25
  关键字:制度  有效性  违规  博弈 
  论文摘要:制度可看作 由管理者和被管理者参与的博弈规则,规则不同博弈参与者的策略选择依据就不同,导致的收益和成本也就不同,最终决定了制度是否被遵守。通过构建两阶段动态博弈模型,并用逆向归纳法来对该动态博弈分析可得出制度遵守的均衡解,继而得到提高制度有效性的建议。  
  在管理中,制度是管理活动的基本依据和规程,对被管理者的行为起着约束作用,制度是否有效对于管理活动的成败有着重要的意义。制度有效性指的是制度的实施效率,即制度被主体认同、遵循的程度。就目前来看,由于缺乏对制度设计的理论与方法的深入探讨,很多制度存在缺陷,不合理的制度设计导致了在制度执行过程 中出现大量违规行为,有的制度存在事实上的虚置,制度如何能被遵循已经成为当前一个亟待研究的问题。因此本文对制度的实施效率展开研究。博弈论作为一种分析工具 ,主要研究在利益相互影响的局势中,局中人如何选择自己的策略才能使自身的收益最大化时的均衡问题。将其用在制度的有效性分析中,有利于找出违规行为发生的原因,从而得到制度设计的启示和建议。  
  一、 制度中的人性假设  
  任何制度的设计都是建立在对人的行为的假设的基础上的,每一个制度研究者,都必须首先研究人性。人性如何定位,是进行制度设计的前提。  
  长期以来,我国很多制度都是建立在道德人假设的前提下。在假定人是道德人的前提下,对制度的要求是很低的,更大的是对人的品德的期待,主要靠的是人的自律。但是现实中所发生的诸如官员腐败、偷税漏税、制假售假等大量不良行为使我们不得不看到寄希望于人的品德对人的行为的约束,是不现实的。对于制度设计者来说,制度设计就是要为人性设置一条防范的底线,即当人们想干坏事的时候,因为有制度底线的防范而不能得逞,因此在设计制度时应全面考虑人可能的行为,尤其是人可能的坏的行为。托克维尔在美国的民情时就说过,美国的民情之一就是对官员的不信任 ,因为他们最接近权力 ,也更有可能是无赖。事实上,英美国家的人性预设是 “人是无赖”,就是说一有机会他便会占便宜 ,一有权力,他便有可能腐败。  
  在本文中作者把制度 中的人预设为理性的追求自身效用最大化的人。这里的效用最大化既包括财富最大化例如对金钱物质的追求,也包括非财富最大化例如对名誉、地位等的追求。所谓 “理性”,是指能充分理解自身利益所在,并能采取正确对策使自身效用最大化。  
  基于以上假设 ,在管理活动中,由于被管理者是理性的追求效用最大化的人,所以会利用各种条件和机会使自己的效用最大化,甚至不惜损人利己,当被管理者发现违反制度将得到比遵守制度更多的收益时,往往就会选择违反制度。  
  二、博弈视角下的制度有效性分析  
  所谓博弈,是指一些个人、队组或其他组织,面对一定的环境条件,在一定规则下,同时或先后,一次或多次 ,从各 自允许选择的行为或策略中进行选择并加以实施,从中各 自取得相应结果的过程。  在管理活动中,作为被管理者最为关心的是如何使自身利益最大化,作为管理者关心的是管理 目标能否实现。在一定制度下,被管理者依据制度规则考虑各方面的收益和成本来决定是违反制度还是遵守制度 ,而管理者根据被管理者的行为并综合考虑其 自身各方面的利益得失做出是否查处的策略选择,这是一个行为互动和理性决策的过程。因此可以把管理活动看作是在一定制度下,由管理者和被管理者进行的博弈,制度实质上就是对博弈参与者的行为具有约束功能的博弈规则。  
  作为博弈参与者进行博弈的规则,制度能够通过对博弈参与者的违规行为施加惩罚和成本的方式达到对其行为进行规范和约束的目的,制度约束不同,博弈参与者的策略选择依据就不同,导致的收益和成本也就不同,最终决定了制度是否被遵守。所以制度是否有效,很大程度上取决于制度设计。在某种意义上,正是由于我们现行的某些制度尚存在着种种缺陷,才导致了被管理者违规行为的层出不穷。  
  本文将通过构建博弈模型来详细分析违规行为发生的原因。 
  一个完整的博弈关系至少应包括三个要素,即局中人、策略与支付。博弈活动可以按照不同的特点划分成不同的类型。其中,按局中人之间能否达成有约束力的协议分为合作博弈和非合作博弈。按博弈的时间或行动次序,可以分为静态博弈和动态博弈,按照局中人拥有的信息结构可分为完全信息博弈和非完全信息博弈。在以管理制度为博弈规则的博弈中,局中人分别为管理者与被管理者。由前面的人性假设可知,在管理活动中,管理者和被管理者将遵循个人行为理性的原则,在既定的博弈规则——制度下,双方都把个人效用最大化作为自己行为和策略选择的出发点,因此以管理制度为规则的博弈主要是指非合作博弈。 
  为了分析方便,我们假设被管理者在制度实施过程中有“遵守制度”和“违反制度”两种策略选择,管理者也有“查处”和 “不查处”两种策略选择双方在行为前对对方的策略选择、行为信息和收益结果等都有清楚的了解 ,属于完全信息动态博弈。 假设被管理者遵守制度的收益为 B ;违反制度的收益为 Bw>(Bw>Bz);违反制度的成本为co,主要指违反制度受到的惩罚,包括经济和名誉的损失。 
  在管理者采取“查处”策略的情况下,被管理者的违规行为被查处成功的概率为P。 
  当被管理者遵守制度时,管理者得到的收益为 Mz;当被管理者违反制度时,管理者在管理活动中的收益为 Mw(Mw<Mz)。 
  管理者在查处违规行为的过程中所花费的各种成本计为 (主要表现为花费在查处方面的人力、物力和财力等)。 
  如果不查处违规行为,对管理者造成的潜在损失为 (主要表现为制度威信的下降从而造成日后其他被管理者可能违规行为所带来的损失)。
  
  图中所示的博弈模型是一个两阶段完美信息博弈。用逆向归纳法来对该动态博弈分析求解:针对被管理者在第一阶段“违反”的策略,在第二阶段管理者有两种策略选择:查处与不查处。其选择的依据就是衡量在“查处”和“不查处”情况下的收益情况,也就是比较 Mw—C 与 Mw—C:的大小。此时,若 Mw—C >Mw—Cz,即 C <C:,则管理者选择 “查处”的策略。若 Mw—C <Mw—C ,即C。>C:则此时管理者最佳策略选择是“不查处”。 当Mw—C-<.Mw—Cz,即管理者选择“不查处”策略时,则被管理者在第一阶段会选择 “违反”策略。因为明显地,Bw>Bz并且被管理者知道,如果自己选择 “违反”策略,在第二阶段管理者会选择“不查处”。这时均衡结果为:违反,不查处。此时,制度不被遵守,是无效的。
  当Mw—C。>Mw—C:,即管理者选择 “查处策略时,此时被管理者的策略选择就要取决于Bz与 Bw—Co X P二者大小的比较了。如果 Bw—Co X p>B ,则被管理者在第一阶段仍会选择“违反”策略。这时均衡结果为 :违反,查处。在这种均衡状态下,每个参与人都相信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的策略,这种出于各 自理性考虑所进行的策略选择最终使制度双方陷人了类似 “囚徒困境的状态,造成资源和财富的浪费。如果 Bw—Co XP<13z则在第一阶段被管理者会选择 “遵守”策略,其均衡结果是被管理者在第一阶段选择遵守制度结束博弈。这个均衡结果正是我们想要的也即制度被遵循,是有效的。 
  三、对制度设计的启示 
  上述博弈模型及求解过程为制度设计提供了许多有益启示。笔者认为,在制度设计时,可采取以下方法来提高制度的有效性: 
  (一)增大违规行为的成本。通过以上对违规行为的分析,不难发现,被管理者违反制度的主要原因,在于其违反制度所获得的收益大于其遵守制度所获得的收益,因此可通过增加违规行为成本的方式来限制违规行为的发生,即加大惩罚强度,一般来说,惩罚强度越大,被管理者越倾向于遵守制度。另外,基于制度中人的行为假设,被管理者不仅有追求物质利益的倾向也有追求荣誉、情感等的倾向,所以在设置奖惩时内容不能过于单一,例如不要仅用金钱物质作为奖惩手段。并且对于不同的人群来说,奖惩的内容也不应相同。     (二)提高违规行为的查处概率。从以上模型可看出,提高查处概率 ,可降低的值 ,而要提高违规行为的查处成功的概率,可采取多种措施,例如加大查处力度,举报,增强对违规行为的侦破能力等。其中通过构建行为测度来提高违规行为的可观测性是提高查处成功概率的有效手段之一。违规行为的可观测性越好,则查处成功概率就越高。如果处于制度中的人的行为是不可观测的,那么就会加大查处难度,降低查处成功的概率。为了提高某种行为的可观测性,在制度设计时可以为这个行为构造一种测度。例如,在工厂的考勤制度中,“上班迟到”是违规行为,但是在工人很多的情况下,“迟到”往往成为一个难以观察的行为,即使安排专人负责记录每人的上班时间,也往往有人在月底 “不认帐”,造成“讲不清”的现象。由于不能成功查实“迟到”行为,就不能对之进行惩处。为此,管理者采取“早上进厂时由工人自己在挂牌箱挂牌,过时间锁挂牌箱”的办法,这样就使每天迟到者无法把自己的牌子挂上,从而使“上班迟到”行为的可观测性大为提高。在现实中,这种管理者为改善被管理者行为的可观测性而构造的“测度”是很常见的。又如,在商店中实行“开票付款”,就是为了观测售货员在卖货收款时是否有私吞钱款的行为。  
  (三)增强违规行为查处威胁的可信性。所谓可信性是指动态博弈中先行为的博弈方是否该相信后行为的博弈方会采取对自己有利的或不利的行为。根据有利还是不利,可以把 “可信性”分为“可信性许诺”和“可信性威胁”。制度实施过程中,被管理者是否相信管理者会对其违规行为进行查处是决定被管理者是否遵守制度的重要因素。目前很多制度都针对违规行为明确提出了惩罚措施,惩罚不可谓不严厉,但是仍有人明知故犯 ,有以下几方面的原因:①不易规避的的惩罚,有的制度规则过于苛刻,大多数人都无法遵守,如果要查处就得处罚很多人,打击面太宽,常言道:法不责众,作为理性的人,被管理者也都明白这一点,因此这种制度可信性威胁就很低,甚至构不成可信性威胁。②惩罚的措施不具体,制度条文空泛。制度表述含糊会给制度的执行造成困难。例如在公务员制度中有如下规定:杜绝公款大吃大喝,但是,何种行为属于大吃大喝呢,笼统的陈述实际上没有给出任何有用的信息,因此对被管理者也构不成可信性威胁。③不重视制度的执行。有的制度设计得很好,但违规行为发生后,管理者出于人情等各方面的原因,不做惩处,长此以往制度的可信性威胁就降低了。所以,要想使制度对违规行为具有可信性威胁必须满足以下条件:首先,制度应是可行的,人性化的,惩罚措施也应是合理的,是可以规避的。其次,制度中的条文应是具体的,对于哪些违规行为以及要受到什 么样的惩 罚均应详细指出。这样才会对被管理者产生威慑。另外 ,再好的制度设计也得靠认真执行,特别是对 “特殊人物”违规行为的查处,往往可起到杀一儆百的作用,从而大大提高制度威胁的可信性。  
  (四)对被管理者的违规行为进行预测。知己知彼方能百战不殆,通过对影响违规行为的主客观条件的分析,来预测可能发生的违规行为,这样在制度设计时就有针对性,从而更有效地防范违规行为的发生。被管理者违规行为的发生既有其主观动机,也有其客观条件。作为被管理者其违规的主观动机类似 :都是实现自身效用最大化。客观条件既可以是被管理者本身具备的,例如智力、体力,也可以是管理者赋予的,例如权力。对于官员来说,之所以出现贪污、受贿等违规行为正是由于手中握有权力这个客观条件的存在而造成的。客观条件不同造成了违规行为的千差万别。比如,对于员工来说,可能的违规行为有:迟到早退、出工不出力、浪费、偷工具与材料;对公司采购人员来说,可能的违规行为有:在采购时吃回扣或报假账;对于财会人员可能的违规行为有:造假 (包括造假账、不如实反映情况);对于企业负责人,可能的违规行为有:短期行为、化企业财产为个人的、工程发包时收受贿赂 ,等等。在设计制度时,针对被管理者所具备的客观条件,结合被管理者主观动机 ,对被管理者可能的违规行为进行预测,有助于管理者针对不同的违规行为制定惩罚措施,做到有的放矢,同时也有助于提高违规行为查处成功的概率。  
  (五)建立制度遵循的激励机制。通过对遵守制度者实施奖励来增加被管理者遵守制度的收益,从而促使被管理者不愿违反制度。适时地给予合作方回报是巩固合作的有效途径,仅依靠惩罚使制度得以实施的不是好制度,应建立倡导人们遵守制度的激励机制,使制度被自觉自愿地执行。在制度实施过程中,博弈的各方都期望自己的利益最大化,但 自己的利益函数不仅取决于自己行动方案的选择,而且取决于博弈另一方行动方案的选择。所以,管理者在制定制度时,不仅要考虑自己的利益,而且必须考虑被管理者的利益。当被管理者利益与管理者利益发生冲突时,不是牺牲被管理者的利益,而是通过设计一种激励机制,使被管理者与管理者利益趋于一致。有些制度过于倾向于管理者的利益而忽略了被管理者的利益,导致被管理者只能采取违反制度的方式为 自己谋取利益,这是违规行为发生的一个很重要的原因。管理者在设计制度时,应坚持“人性化”、“以人为本”的原则,并且管理者与被管理者应进行交流,了解被管理者的需求,充分的交流可以使非合作博弈向合作博弈转化,也是设计有效制度的必要条件。  
  (六)通过多次博弈使制度不断完善。从上述分析可知,通过调整博弈规则可使博弈双方的博弈结果达到有效均衡,因此我们可以把制度不断完善的过程理解为制度双方多次博弈并不断调整博弈规则使博弈达到有效均衡的过程。制度完善的过程也是制度逐渐接近“纳什均衡”的过程。“纳什均衡”是制度的理想状态,即:给定别人遵守制度的情况下,没有人有积极性偏离制度规定的自己的行为规则。换句话说,如果一个制度不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个制度。任何制度都不是一次性完善的,特别是在市场不断,新的事物不断涌现的现实生活中,想要一劳永逸地制定达到“纳什均衡”状态的制度是不可能的,需经过反复博弈,不断调整制度,使之向纳什均衡逐渐逼近,博弈的次数越多,完善的程度越高。  
  :  
  [1]张运成.玛莎栽倒的美国政经解读 [J].世界知识,2004(10).  
  [2]谢识予.经济博弈论[M].上海:复旦大学出版社,1997.  
  [3]孙绍荣.管理原理探索[M].北京:技术出版社.1999:96—105.  
  [4]张维迎博弈论与信息经济学[M].上海:上海人民出版社。1996.  
  [5]张文健,孙绍荣.浅谈机会主义行为预测与制度设计[J].技术经济,20o6,25(2).