四、制度内生演化:从非合作博弈到合作博弈
在本文中,博弈不再是静态而是收益情况处于不断变化之中、进而演化为制度的变革。囚徒困境博弈是一个经典的非合作博弈,而在本文的演绎中,囚徒困境可以转化为合作博弈,其根本原因在于动态收益。这种机制可以描述为:在一定条件下,社会收益更高的策略选择由于收益情况的动态演化或者说存量因素的累积,原来的非占优策略变成后来的占优策略,形成新的博弈格局和均衡。
(一) 初始条件:囚徒困境。
制度的目标指向社会收益的极大化,但它的形式可能表现为组织协调或者市场协调。若个人选择的策略均衡是社会收益极大化,则市场协调是有效,否则以组织协调为有效。
囚徒困境博弈是2*2博弈中较经典的例子,经常用于讨论分析个体理性与集体理性相悖的情形,所以本文设定初始条件为囚徒困境经典式博弈。初始博弈形式不同并不影响本文结论的有效性。
首先,考虑一个更具体的囚徒困境博弈模型:
参与方 | 参与者1 | ||
参与者2 | 策略 | S1 | S2 |
s1 | 7,7 | 8,2 | |
s2 | 2,8 | 3,3 |
图4 一个囚徒困境博弈的收益矩阵
同样,这些参数设置也不会影响后面的分析和结论的有效性。图4反映了参与者不同策略选择下的收益情况,但仍缺乏一个社会收益情况的表达,在此,设定社会收益函数为边沁主义福利函数即:
F=∑Fi
这样,可以看到不同策略选择下的社会收益情况:F(S1,s1)=∑Fi=14;F(S2,s2)=∑Fi=6;……。显然,社会福利极大化的策略是(S1,s1),但在个人理性下均衡策略是(S2,s2)。
在囚徒困境博弈中,个体选择的均衡结果是帕累托非效率,因而有必要引入组织协调的方式。然而,由于该博弈处于不断演化的过程中,在收益递增生产函数条件下,非合作博弈转变成了合作博弈。个体选择的均衡结果是希克斯最优也是帕累托最优,组织协调不再是必要的协调方式,市场协调更加有效。
(二)博弈过程。
首先,将图4囚徒困境博弈各值代入到图2中,就变为:
参与方 | 参与者1 | ||
参与者2 | 策略 | S1 | S2 |
s1 | 14+f(14,K) | 10+f(10,K) | |
s2 | 10+f(10,K) | 6+f(6,K) |
图5 囚徒困境博弈的总收益矩阵
然后,将相关值代入到图3中,得到:
参与方 | 参与者1 | ||
参与者2 | 策略 | S1 | S2 |
s1 | (1/2)Y11,(1/2)Y11 | (4/5)Y21,(1/5)Y21 | |
s2 | (1/5)Y12,(4/5)Y12 | (1/2)Y22,(1/2)Y22 |
图6 囚徒困境博弈的动态收益矩阵
其中,Y11、Y12、Y21和Y22取值如图5。由于Y11>Y22,均衡策略(S2,s2)中集体收益和任一参与者的收益都低于(S1,s1)。
这里,博弈者无论是个体收益还是集体收益都处于动态变化之中,因此需要对Y11、Y12、Y21和Y22的取值变动情况及其比较关系进行界定,Y11= 6+f(6,K)、Y12= Y21=10+f(10,K)、Y22=14+f(14,K),K为累计项。本文将证明在博弈初始状态是非合作博弈情况下,终极状态将演变为合作博弈形式。由于K为累计项,随着时间铺开,该项数值可增至无穷大,此时Y11、Y12、 Y21和Y22的极限取值之间的比较关系将决定博弈的终极形式。回到比例投入-收益递增生产函数:
Y=f(A,K)=
资本存量K的积累速度取决于策略选择A(产出全部转化为投资):
该生产函数为分段函数,有利于直观分析博弈形式的变化。首先,当K=0时,该博弈就是初始条件的囚徒困境博弈。其次,当K=6时,产出受限于资本存量,Y11=Y12=Y21=Y22,该博弈仍为囚徒困境博弈:
参与方 | 参与者1 | ||
参与者2 | 策略 | S1 | S2 |
s1 | 7+(1/2)63/2,7+(1/2)63/2 | 8+(4/5)63/2,2+(1/5))63/2 | |
s2 | 2+(1/5))63/2,8+(4/5)63/2 | 3+(1/2)63/2,3+(1/2)63/2 |
图7 K=6时收益矩阵
再次,当K=10时,Y12、Y21和Y22取值一致,且Y12=Y21=Y22>Y11,该博弈变成了多重均衡博弈,包括两个纯策略均衡和一个混合策略均衡:
参与方 | 参与者1 | ||
参与者2 | 策略 | S1 | S2 |
s1 | 7+(1/2)103/2,7+(1/2)103/2 | 8+(4/5)103/2,2+(1/5)103/2 | |
s2 | 2+(1/5))103/2,8+(4/5)103/2 | 3+(1/2)63/2,3+(1/2)63/2 |
图8 K=10时收益矩阵
最后,当K=14时,Y12>Y21=Y22>Y11,该博弈变成了合作博弈,唯一的均衡是(S1,s1),个体选择的均衡是集体收益的最优:
参与方 | 参与者1 | ||
参与者2 | 策略 | S1 | S2 |
s1 | 7+(1/2)143/2,7+(1/2)143/2 | 8+(4/5)103/2,2+(1/5)103/2 | |
s2 | 2+(1/5))103/2,8+(4/5)103/2 | 3+(1/2)63/2,3+(1/2)63/2 |
图9 K=14时收益矩阵
从分析中可以看出,驱动博弈形式转化的直接原因是资本存量K。
从囚徒困境博弈向多重均衡博弈转化的条件是K>((5/2)63/2+5)2/3,而多重均衡向合作博弈转化的条件是K>((8/5)103/2+2)2/3。博弈形式之间相互转化的原因是收益递增和累积性因素变化——当然,本文所定义的收益递增性有别于新古典经济学。在本文看来,在生产初期阶段或者投入比例失衡时,边际收益会出现一种递增现象。
(三)关于以上结论和条件的讨论
边际收益递减在经济学中扮演着如同“第五公设”的角色,它不是收益递增的必要条件,作为常识也不符合很多经济现象。本文在放松边际收益递减假设基础上,但并未完全否定边际收益递减,而是认为都对应一定条件——在收益递增范围内,边际收益递增是一种可能现象;超过了现实客观条件则是边际收益递减。先有收益递增后有收益递减(郭熙保,2006;何志星,2010),而收益递增并不局限规模、边际收益递增也是一种可能性。边际收益递增是收益递增的充分条件、边际收益递减是收益递减的必要条件。制度变迁的边际收益先递增后递减结论(黄少安,2000)与本文的前提假设非常相似,不过是本文以生产过程为对象,而前者以制度变迁为对象。
边际收益递增和边际收益递减并不是静态不变的,而是随着累积性因素变化或者说存量的累积,收益递增的范围愈来愈宽,推动合作行为的收益逐步攀升。这一点就如同专业化经济现象——在技术无进步的情况下,专业化分工在较低程度是有效率的,单纯的分工细化会导致专业化不经济;随着技术进步,专业化经济越来越显著,分工越细越有效率;这个过程内生于专业化分工的进程。在制度内生演化进程中,随着生产性资本的累积,生产行为的边际收益逐步递增,最后是内生为合作行为的产生,导致原来由制度约束才能产生的合作行为演化为自发的合作行为。同样,这一过程也是内生于收益的动态增长之中,就是制度内生演化的具体路径。