盗版现象的博弈分析及其启示.

来源:岁月联盟 作者:潘淑清 时间:2010-06-25

    摘要 屡禁不止的盗版现象,严重破坏了市场秩序,危害正版市场的发育和,损害合法经营,妨碍文化市场的发展和创新。本文欲从博弈论的视角,通过构造博弈模型对盗版现象的机理进行深入剖析,旨在为政府部门抑制盗版现象提供理论指导。

  关键词 盗版 博弈 激励悖论
  
  博弈论能够成功地解释许多别的理论解释不了的社会、经济现象,可以成功解析经济中许多低效率现象的根源,找出导致低效率的制度根源,从而帮助政府制订、修改政策,完善政府行为以提高经济效率。
  盗版一直是明文禁止的。但事与愿违,盗版现象仍旧“野火烧不尽,春风吹又生”。为什么盗版者“盗版”屡禁不止?盗版现象之所以有着如此强大的生命力,原因纵然很多,本文运用博弈理论,通过构造博弈模型对此做一个较为深刻的剖析。旨在为政府部门抑制盗版现象提供理论指导。
  
  一、“执法部门-盗版者”博弈模型的建立
  
  本文首先构造下面 “执法部门-盗版者”博弈模型。
  在“执法部门-盗版者”博弈中,博弈方有两个:执法部门和盗版者。执法部门的策略集为“检查、不检查”,盗版者的策略为“盗版、不盗版”。当执法部门“检查”时,如果盗版者“盗版”,可能会被执法部门“逮住”而遭受处罚,对盗版者而言具有负效用,记为得益“-P”。这一得益到时候可能表现被处于罚款,严重者甚至会被行政处罚等等。而政府执法部门“检查”会帮助提高政府执法部门威信,假设不考虑执法部门能得到的一些心理上的满足,它并没有其他更实际的效用,因此它的得益是零,当执法部门“不检查”时,如果盗版者“不盗版”,则执法部门本来拿一份国家工资就该履行一份职责,盗版者本就不应盗版,两者都是应该的,两者都没有什么特别的得益,当然也都没什么损失,即得益都是零。“检查”是费时费力的,因此如果盗版者“不盗版”时,执法部门也“不检查”,省时省力而效果又达到了,所以执法部门能得到一份正的效益,记为S,但此时盗版者什么得益也不会有。而如果执法部门“不检查”,盗版者选择“盗版”,则执法部门一定程度“失察”,统计任务的完成,效果的实现都得打折扣,对他来讲有一定程度的负效用,记为得益“-D”;此时盗版者盗版成功,可以利用盗版达到政绩,有一定程度的正效用,记为得益“V”。最后可得得益矩阵如图所示。
  
  这是一个严格竞争博弈,博弈双方只有竞争而没有合作的可能。这是因为:若执法部门的策略是“检查”,则盗版者的策略是“盗版”;若盗版者的策略是“不盗版”,则执法部门的策略是“不检查”;若执法部门的策略是“不检查”,则盗版者的策略是“盗版”;若盗版者的策略是“盗版”,则执法部门的策略又是“检查”,如此循环往复……,根本没有协调的时候。在这种情况下,盗版者“盗版”与“不盗版”,执法部门“检查”与“不检查”,事先都决不会告诉对方,一定会遵循保密性原则。这样,对于在“盗版”和“不盗版”之间选择的盗版者而言,执法部门可能实施的“检查”策略会倾向于把他们逼到老实上报的;而对于在“检查”和“不检查”之间做选择的执法部门而言,盗版者可能实施的“盗版”策略也倾向于使他们最后选择“检查”。
  严格竞争博弈一定存在纳什均衡(“纳什均衡”是指博弈中的博弈方在策略选取时达到的这么一种状态:假设每一个博弈方都是理性人,已经选取了某策略的任一博弈方都不愿单独改变其策略,否则都只能是使得他的当前得益减少)解,但却不可能是纯策略(“纯策略”是指以绝对的态度在众策略中进行取舍,选取某一策略则一定不取其他策略)的,而是混合策略(“混合策略”跟“纯策略”相反,是指以相对的态度在众策略中进行取舍,选取任一策略都是以一定概率进行的,但总概率必须等于1)的。因此用划线法、箭头法的严格下策消去思想是不可能得到纳什均衡解的,它没有严格下策。必须引进混合策略的思想,找出其解。
  
  二、博弈模型的求解及分析
  
  在没有纯策略纳什均衡解的情况下,盗版者采用的混合策略必须使得执法部门无论是“检查”还是“不检查”,其期望收益都是一样的,惟其如此,盗版者才会失去改变策略的冲动。执法部门采用的混合策略也必须使得盗版者无论是“盗版”还是“不盗版”,其期望收益都是一样的,也惟其如此,执法部门才会失去改变策略的冲动。只有当双方都没有改变策略的冲动时,博弈才能达到一个双方都不愿打破的均衡局面,这时双方的策略集合便是本博弈的纳什均衡解。既如此,假设盗版者盗版的概率为p(不盗版的概率为1-p),执法部门不检查的概率为q(检查的概率为1-q),从而必定有如下两式成立:
  
  下面通过图形对此作进一步分析。
  
  图1 盗版者的混合策略
  
  图2 执法部门的混合策略
  

  先讨论盗版者选择“盗版”与“不盗版”两种策略的概率的确定。
  图1中横轴表示盗版者选择“盗版”的策略的概率pt,它分布在0到1之间,“不盗版”的概率则等于1-pt;纵轴反映对应于盗版者“盗版”的不同概率,执法部门选择“不检查”策略的期望得益。设执法部门的得益为R,则R与pt之间存在如下的线性关系:R=pt*(-D)+(1-pt)*S=S-(S+D)*pt。
  图中从S到-D连线的纵坐标就是在横坐标对应的盗版者“盗版”概率下,执法部门选择“不检查”的期望得益。容易说明该线与横轴的交点Pt*就是盗版者选择“盗版”概率的最佳水平,选择“不盗版”的最佳概率则为1-Pt*。首先,S到-D连线上每一点的纵坐标,就是在盗版者选择该点横坐标表示的“盗版”概率时,执法部门选择“不检查”策略的期望得益S(1-pt)+(-D)pt。假设盗版者的“盗版”概率大于Pt*,此时执法部门“不检查”的期望得益小于0,因此他肯定百分之百选择“检查”,从而盗版者逃一次被抓一次有赔无赚,因此对盗版者来说大于Pt*的“盗版”概率是不可取的。反过来,如果盗版者“盗版”的概率小于Pt*,则执法部门“不检查”的期望得益大于0,因此执法部门天天不检查是合算的,此时即使盗版者提高一些“盗版”的概率(即盗版更频繁一些),只要不大于Pt*,执法部门都会选择“不检查”,因此盗版者不用害怕会被抓住。由于盗版者在保证不被抓住的前提下,“盗版”概率越大收获就越大,因此他会使“盗版”的概率趋向于Pt*,均衡点是盗版者以概率Pt*和1-Pt*分别选择“盗版”和“不盗版”。此时执法部门“不检查”与“检查”的期望得益都等于0,选择纯策略“不检查”和“检查”,或混合策略的期望得益都是相同的。不过,事实上为了让盗版者也没有可乘之机,执法部门也必须选择特定概率分布的混合策略。
  执法部门采取“不检查”与“检查”的混合策略概率分布,也可以用同样的方法来确定。结论是图2中的Pg*和1-Pg*是执法部门的最佳概率选择。
  在盗版者和执法部门的博弈中,盗版者分别以概率Pt*和1-Pt*随机选择“盗版”与“不盗版”,执法部门分别以概率Pg*和1-Pg*随机选择“不检查”与“检查”时,双方都不能通过改变策略或概率改善自己的期望得益,因此构成混合策略纳什均衡,这也是该博弈惟一的纳什均衡。
  
  三、“激励的悖论”及其启示
  
  盗版者与执法部门之间的混合策略博弈,还可以揭示一种“激励的悖论”。
  首先考察为了抑制盗版现象而加重对盗版者的惩罚时会出现的结果。对盗版者的惩罚加重会使得P增大。在图2中,这相当于-P向下移动到-P′,如果执法部门混合策略中的概率分布不变,此时盗版者“盗版”的期望得益变为负值,因此盗版者会停止“盗版”。但是在长期中,盗版者减少“盗版”会使执法部门更多地选择“不检查”,最终执法部门会将“不检查”的概率提高到Pg*′,达到新的均衡,而此时盗版者“盗版”的期望得益又恢复到0,他会重新选择混合策略。由于盗版者的混合策略概率分布是由图1决定的,并不受P值的影响,因此加重对盗版者的惩罚在长期中并不能抑制盗版,最多只能抑制短期的盗版发生率,它的主要作用是使得执法部门可以更多地懒得检查。当然如果将执法部门可以轻轻松松完成工作也看作增加了社会福利,那么加重对盗版者的惩罚还是有意义的。
 同样地,可以再讨论加重对失职或者说执法力度不严的执法部门的处罚会出现什么结果。加重对执法部门的处罚意味着D增大到D′。此时,如果盗版者“盗版”的概率不变,那么执法部门“不检查”的期望得益变为负值,执法部门肯定会选择“检查”。执法部门“检查”盗版者只能减少盗版的概率,直到将Pt*下降到Pt*′,此时执法部门又会恢复混合策略,达到新的混合策略均衡。这就是说,加重对执法部门的处罚在短期中的效果是使执法部门真正尽职,但在长期中并不能使执法部门更尽职,执法部门的勤勉程度并不是由D决定的。加重处罚失职执法部门在长期中的真正作用,恰恰是会降低盗版发生的概率。
  这样,盗版者和执法部门博弈的最后结果是:在其它条件不变的前提下,盗版者之所以盗版,是因为对失职执法部门的处罚不够;执法部门之所以不检查,则是因为对盗版者盗版处罚太甚。要使盗版者不盗版,得加强对执法力度不严的执法部门的处罚;要使执法部门少检查,则要加重对盗版者盗版的处罚。此博弈所揭示出的政策目标和政策结果之间的这种罚A抑B、罚B扬A的“意外”错位关系,常被称为“激励的悖论”。这个悖论对于制定各项政策,进行管理体制改革都是极有启发意义的,它说明客观事物利害之间存在的普遍联系。要恰当而正确地处理一件事情决不能使用头痛医头、脚痛医脚的形而上学的做法,必须把问题看作一个系统,进行全面诊断才能真正解决它。
  政府加重对不法分子的惩罚在短期内虽然能抑制不法行为,但在长期会使执法者增加不打击行为,不法现象不会改善。但加重对执法者惩处力度的做法短期内会使执法者真正尽职,长期却可起到抑制不法行为的作用。因此,严惩扰乱社会秩序的违法分子固然必不可少,但加强对监管者的监管力度却能使监管更有效。政府下决心要整顿经济秩序促进市场“理性”,在奖惩制度的设计上,监管监管者与监管违规操纵者并举,才是最好的选择。此模型还可帮助我们理解为何政府再三强调要加强监管、惩治腐败,而经济生活中的股市黑幕、基金丑闻、权力寻租、工程腐败等扰乱正常经济秩序的活动仍屡禁不止,政府政策收效甚微。一个重要的原因是政府设计的策略机制是否真的构成“可信的威胁或承诺”,政府的相关法规及监管配套政策的方向是否正确,措施力度是否恰当构成博弈“可置信”的机制保障。由此看来,在奖惩制度的具体设计上,单一的处罚手段(如加重对盗版者的惩罚等)不能从根本上解决盗版的问题,必须二者并举,才是最好的解决这一问题的举措。
  
  
  1.Robert Gibbons.A Primer in Theory.Harvester Wheat-sheaf,1992
  2.Roy Garder.Gamers for Business and Economics.John Wiley &Sons, Inc.,1995
  3.张维迎著.博弈论与信息经济学.上海三联书社、上海人民出版社,1996