企业创新竞争的期权博弈行为分析
[内容摘要]本文在不确定环境中,探讨专利权体制下实物期权与创新竞争的相互关系,建立模型刻画了两个对称在合作与非合作情况下进行创新投资的最佳策略。企业间的竞争并不一定损害延迟期权的价值,相反,企业对引发专利竞争的畏惧使竞争的影响内在化,进一步提高了延迟的价值,推迟了投资时间。
[关键词]创新竞争;实物期权;非合作博弈;投资延迟
Abstract: This paper considers the tension between real options and R&D competition with uncertainty under a winner-takes-all patent system. It models the optimal rules for two symmetric firms for their cooperative and non-cooperative investment. It has shown that competition between firms does not necessarily undermine the option to delay. Instead the fear of sparking a patent race may internalize the effect of competition, further raising the value of delay and increasing the time before any investment takes place. Our analysis has important implications for empirical and policy studies of R&D investment.
?Key words: R&D competition; real options; non-cooperative game; investment delay.
一、模型描述
两个风险中性的企业,i=1,2,拥有竞争性创新投资机会。竞争是直接进行的:两个企业努力争取同样的专利权,一方创新成功会消除另一方的所有可能收益。企业都面临技术和不确定性。假定投资是不可逆的,以θi∈{0,1}分别代表企业未投资和已投资的可能状态,已投资的企业有所发明的概率服从泊松分布,发明成功被授予的专利权的价值π是一个外生随机变量,遵循如下几何布朗运动:dπt=μπtdt σπtdW (1)
其中,μ∈[0,r)是衡量π的预期增长率的漂移率参数,?①无风险利率r为常数,参数σ>0是瞬态标准差或波动率,dW是标准维纳过程的增量,且dW~N(0,dt)。
企业i投入金额Ki>0开始创新活动,从投资时开始,发明按照泊松分布随机出现,每个企业发明的概率相互独立。风险率hi>0为常数,因此,风险率与创新持续的时间及投资的企业数量无关。本文重点研究hi=h,Ki=K(0=1,2)的对称情况。所有的参数值和企业行为都是共同知识,因而这是一个完全信息博弈。假设专利的初始价值π0非常小,立即投资的期望收益为负,即每个企业都不会立即投资。
博弈过程如下:在每个企业都没有行动时,随机过程按照(1)式。如果企业i在π<t的任意时刻都没有投资,则它的行为集是Ait={投资,不投资};如果企业i在π<t的某一时刻投资,则Ait为空集{不行动}。因此,每个企业面临的控制问题仅仅是选择作出“停止”行为(此处亦即投资)的时间。[1](743-763)企业投资之后不能再有所行动,也不再对博弈结果产生影响。任一企业发明成功使博弈结束。
企业i的一种策略是根据之前的博弈Ht筹划行为集Ait如下:σit∶Ht→Ait。当t≥0时,之前的博弈包括两个部分:随机状态变量π的样本轨迹和两个企业在时刻t之前的行为。在投资不可逆的情况下,时刻t博弈仍在进行概括了时刻t之前的博弈行为(即θi=0,??i)。然而,状态变量之前的情况就复杂得多,因为它有多种可能的轨迹,任何一种轨迹都能够达到它的当前值。
假设企业采用马尔科夫策略:行为仅是当前状态的函数,且策略形式不随时间变化。由于π遵循马尔科夫过程,马尔科夫策略将所有与收益有关的因素纳入博弈,如果一方采用马尔科夫策略,那么对手的最佳反应也是马尔科夫策略。因此,即使策略由过去的状态决定,马尔科夫均衡仍然是一种均衡状态,虽然可能同时存在其他非马尔科夫均衡。[2](541-557)参与方的策略是一个停止准则,确定了企业投资时随机变量π的临界值。
二、单个企业的最佳投资时机选择分析
没有竞争的单个企业的最佳投资准则可以通过解决如下随机最佳停止问题:
其中,Et表示在t时刻的信息条件下的期望值,T是作出投资的未来停止时间。这个问题按如下方式解决:首先,通过解有关的Bellman方程得到连续停止意义上的企业价值表达式。在连续时间条件下,企业拥有投资的期权,类似于一个看涨期权;在停止意义上,投资的不可逆性使得企业价值仅仅是项目的期望价值。然后,加上价值匹配和平滑相连条件?②就可得到投资临界点即最佳停止点πU。单个企业的价值函数由下式给出:
三、合作博弈均衡分析
我们考虑两个企业(或研究单位)合作计划投资的两种情况。?③为不失一般性,首先我们假设一个企业在临界点π1投资,另一个企业在第二个临界点π2>π1时投资。这种投资方式下,两个企业的联合价值为:
在临界点代入价值匹配和平滑相连条件即可得到π1、π2的最优值及期权价值A0和A1:
由函数法则可以证明,在区间[0,π2]上,方程(8)有唯一根π1∈(0,π2)。
结论1.合作的最优状态是唯一定义的相继投资模式,一个研究单位在π1投资,另一个单位只能随后在π2投资,其中两个临界点分别满足(8)式和(6)式。
当两个企业难以就非对称投资模式达成协议,或难以支付保证金而只能在一个临界点同时投资时,就得到合作的次最优状态——最优联合投资。两个企业联合投资与投资成本为2K、风险率为2h的单个企业问题相同。以πC表示最优联合投资的临界点,则有:
在这种情况下单个企业的价值为(由两个研究单位组成的联合价值为这一价值的两倍):?
比较(9)式和(4)式可以明显看出πC>πU,因此,两个企业联合投资严格晚于单个企业独自行动时的投资。这是因为风险率增加间接导致贴现率增大。由于创新的成本和风险率都是双倍的,因此对创新效率没有直接影响。将πC与无约束条件下的最优点相比,可以证明约束条件下的最优投资点介于无约束条件下的两个临界点之间。
结论2.最优合作投资计划和约束条件下的最优联合投资准则的临界点排序为π1<πC<π2。
四、非合作博弈均衡分析
为不失一般性,我们首先假设一个企业(先动者)的投资严格先于对手企业(跟随者)。在动态环境中停止时间博弈通常是倒推分析,因此我们先考虑跟随者的最优化问题。
(一)跟随者的投资问题
假设先动者已经作出投资,在这种条件下跟随者面临着对手会率先有所创新的可能性。由于风险率是独立的,不论跟随者是否已经投资,这种可能性都是一样的。因此,跟随者的投资问题就相当于单个企业以扩大的贴现率r h投资的问题。根据文章第三部分的分析,以r h替换所有的r即可解决这一决策问题,得到跟随者的临界点:πF=
将πF与前面推出的临界点相比,容易看出πF<πC。然而,πF与πU却无法进行一般意义上的比较,因为先动者的风险率对跟随者会产生两种相反的影响。一方面,降低了跟随者投资的期望价值,使πF增大,导致与单个企业相比,跟随者的行动更晚;[3](1653-1679)另一方面,对手创新的威胁降低了跟随者延迟期权的价值,通过β1影响期权价值乘数,使其小于单个企业的相应乘数,导致πF减小,趋向于加速它的投资。
(二)先动者的收益
假定跟随者将来按照最优方式行动。先动者一旦投资就不能再作出其他决策,它的收益由项目预期价值给出,然而,将来跟随者在点πF的投资却可能降低这个收益。因此,先动者的价值函数包括两个不同的部分:跟随者投资前的价值和跟随者投资后的价值。跟随者投资后,先动者(或跟随者)的价值由期望NPV(π)得到,其定义与(5)式中的定义相同。跟随者投资前,先动者的价值函数由两部分组成:项目的预期价值和一个类似于期权的部分,这一部分预计了跟随者的投资对先动者期望收益的负面影响。在点πF代入价值匹配条件,这个类似于期权的部分中就出现一个常数项。在这种情况下,由于先动者不存在最优状态,因而没有平滑相连条件。求解这一问题可推出先动者的价值函数:
(三)博弈求解
非合作均衡的形式取决于先动者的价值VL与两个企业都延迟到最佳联合投资点时的价值VC的相对大小,即两种投资模式以哪一种出现取决于这两个价值函数在区间(0,πF)上是否相交。?④如果VL总是大于VC,则抢先的动机极强,联合投资不能成为均衡状态,唯一可能的结果是率先行动者——跟随者均衡,两个企业的投资都严格早于最佳联合投资时间。另一方面,如果VL总是小于VC,则将维持联合投资的结果。
在先动者投资点πL,两个企业的期望收益一定是相等的。这源于Fudenberg和Tirole的租金均等法则:如果双方的期望收益不等,则一方将会有违规动机,由此产生的结果将不会是均衡状态。[4](383-401)通过率先投资,先动者获得暂时垄断该研究的优势,并且更有可能有所发明,但它赢得的专利对跟随者的期望价值也会更高。因此,整个博弈过程中首先有所发明的可能性与所获专利的可能价值之间存在一个平衡点。在点πL两种作用平衡,两个企业的期望收益相等。
由前提条件可知,随着π从π0开始增加,将会达到VL首次超过VC的点(在图1中以A标出),在此处,每个企业各自都有违反联合投资战略而率先行动的动机,但由于VL>VF,如果一个企业将在A点率先行动,那么它的收益将严格大于对手企业。引理2告诉我们,在区间(πL,πF)内任一点,先动者的收益严格大于跟随者的收益,在πL之前每个企业都希望对方率先行动,且πL是唯一的。因此,存在一个唯一的均衡结构,其中一个企业(先动者)在首先达到点πL时投资,另一个企业(跟随者)稍后在点πF投资。由于两个企业的地位可以互换,因此存在两个这种形式的均衡。
我们考虑VC总是大于VL保持联合投资均衡的情况。在点πC处,即使对手会立即跟随行动,投资也是占优策略,因此在大于πC的区域不会有均衡临界点。为排除联合投资中企业的单方违规动机,必须首先确定联合投资的最低点πS。?⑤
其中,VJ(π,πJ)是两个企业在任意点πJ联合投资(但不一定是最优)的情况下,企业投资前的价值函数。这个函数定义在区间(0,πJ)上,由点πJ的价值条件可以推出:VJ(π,πJ)=BJπβ0?(16)
其中,
结论4.如果VC(π)≥VL(π)? π∈(0,πC),则存在两种形式的均衡。第一种是命题3所描述的先动者——跟随者均衡,和前面一样,这种形式有两个均衡点。第二种是联合投资均衡,即两个企业在同一个临界点πJ∈[πS,πC]投资,这一区间上的均衡临界点构成一个闭连集(见图2)。
在区间(πL,πF)上有VL>VF,企业都担心对方会抢先行动,结果得到先动者——跟随者的非对称均衡结构。而由前提条件可知,在区间(0,πC)上的任意点企业都不存在单方面违背联合投资的动机。当π≥πC时,即使对手将会立即跟随行动,投资也是绝对占优的。因此,两个企业都在点πC投资的联合投资结果是一种均衡。由πS的定义可知,对于任一联合投资点πJ∈[πS,πC],企业单方面违规都是无利可图的,因此,任一联合投资点都是一个均衡点。又因为VJ(π)≥VL(π)?π∈(0,πJ],即企业在任一点联合投资的收益不少于抢先行动所得的收益,故非合作博弈中联合投资优于率先投资。Fudenberg和Tirole(1985)认为,如果一个均衡点帕累托占优于所有其他均衡点,那么这个均衡点就是最合理的预期结果。[4](383-401)由πC的推导过程可知,若按照帕累托方式将联合投资均衡的相应临界点排序,则πC帕累托占优于所有其它点。
结论5.按照帕累托标准,第二种情况中出现的多种均衡状态可以归结为一个唯一结果,即两个企业都在首次达到π?C时投资的联合投资均衡。
结论6.运用函数法则可以得到,非合作与合作情况下各投资临界点的大小关系为:(1)πL<π1<πC<π2;(2)πL<πF<πC<π2;(3)π1与πF无法比较。
具体情况中的均衡是先后投资还是同时投资取决于参数值,可按如下数学方式判断:当且仅当指定的先动者(与这一模型中的企业不同,它知道对方不会抢先行动,因此能够放心地选择最佳投资点)选择充当先动者角色时,才会有单方面违背联合投资的动机。利用价值匹配和平滑相连条件可推出指定先动者的投资点πD和它的期权价值BDπβ0?。πD的隐函数表达式为:
(β1-β0)BLπβ1??D (β0-1)hπD[]r h-μ[SX)]-β0K=0[JY](17)?得到πD的值之后,就可以解出期权价值常数BD,通过将其与BC比较,就能确定均衡投资模式。如果BD>BC,第一种情况成立,得到先动者——跟随者均衡结果;反之,如果BD≤BC,就得到第二种情况,即两个企业在点πC联合投资的帕累托占优均衡。
五、结 论
比较合作与非合作情况下的解,很容易看出非合作行为的低效率。当非合作行为产生先动者——跟随者均衡时,企业抢先行动和暗中行动的动机缩短了投资期权的持有时间,两个企业都过早投资。虽然先动者获得了暂时垄断研究的先动优势,但这种优势随后就会被跟随者的投资所消除,两个企业收益相同,且低于其他结果下的收益。联合投资对两个企业都更为有利。虽然这不是合作的最佳效果,合作博弈中最佳相继投资模式占优于同时投资——但在难以就非对称投资准则达成协议并且合作需要支付保证金的前提下,可以认为它是能够实现的最佳企业联合。
值得注意的是,当出现同时投资均衡时,非合作行为延迟了首次投资的时间——非合作的投资临界点πC大于合作投资的第一个临界点π1。这一结论与竞争削弱延迟能力的普遍推断产生矛盾。企业由于担心引发专利竞争而采取延迟战略,这种投资延迟是由企业间的战略互动造成的,而不仅仅是不确定性的一般期权效应。
具体情况中出现的均衡状态形式取决于两种对立力量之间的平衡,即延迟的期权价值和抢先行动的期望收益。随着延迟期权价值增加或提早投资的先动效应降低,更容易出现同时投资均衡。数学分析表明,其他条件不变,随着波动率σ增加,风险率h降低,或净贴现率r增加,同时投资就成为均衡结果。?⑥☆
?
注 释:?
①实物期权模型中通常有约束条件μ<r,以保证拥有期权的机会成本严格为正。若其他条件不变,漂移项为负将鼓励提早投资以提高专利价值显著下降之前获得专利权的可能性,抵消了模型中的期权效应。为避免出现这样的结果,我们假设μ非负。由于模型关心的是不确定性的影响,而不是预期走势,因此这一假设不影响分析结论。
②平滑相连条件要求价值函数满足在临界点的一阶导数相等。
③这暗含假设企业需支付保证金以保证不会有违规动机,或者两个企业是由同一个集团公司控制的独立的研究单位。
④由于π≥πF时,VL(π)=NPV(π)-K,而π<πC时,VC(π)>NPV(π)-K,故在区间[πF,πC]上两个价值函数不相交。
⑤不一定存在确定的πS值,这取决于VL和VC的相对大小。
⑥从期权方面考虑,净贴现率的增加降低了在将来某一时间支付的投资成本或敲定价格的当前价值,提高了期权价值。
主要:?
[1]Dutta, P.K. and Rustichini, A. A Theory of Stopping Time Games with Applications to Product Innovations and Asset Sales [J]. Economic Theory,1993,(3).
[2]Dixit, A.K. Irreversible Investment with Price Ceilings [J]. Journal of Political Economy,1991,(99).
[3]Grenadier, S.R. The Strategic Exercise of Options: Development Cascades and Overbuilding in Real Estate Markets [J].Journal of Finance,1996,(51).
[4]Fudenberg, D. and Tirole, J. Preemption and Rent Equalisation in the Adoption of New Technology [J]. Review of Economic Studies,1985,(52).











