2005年度诺贝尔经济学奖得主
罗伯特·奥曼与托马斯·谢林对经济学的贡献
(摘自王振中、李仁贵主编《挑战诺贝尔奖的经济学大师们》,中国经济出版社2001年版)
罗伯特·奥曼
罗伯特·奥曼(Robert J. Aumann)不仅是一名杰出的科学家,他也是博弈论中理性问题研究的思想家之一。奥曼的研究有着非同寻常的广度与深度,从基本概念确立到理论研究工具与研究方法的创新,以及理论体系的形成,直至它们在不同领域的应用,奥曼往往独辟蹊径,既富有创新、又精确严谨,而且学科的跨度也相当大。其研究工作既包括复杂高深的(数学)技术分析,也覆盖着数学上是微不足道的、但理论意义却很深远的思想探索。应该说,几乎奥曼的所有工作都极具洞察力,直接触及到问题的本质。
在过去的几十年中,博弈论已取得了很大的发展,尤其在经济学中,它越来越占据着核心的地位,大有重新改写(微观)经济学之势。这其中,奥曼的贡献功不可没。其早期那些开先河的研究工作一直影响、促进着这个学科的发展。今天,我们几乎在博弈论中的任何领域都可以发现奥曼的足迹。奥曼的绝大多数研究工作都与经济学理论中的核心问题密切相关,其真知灼见往往给经济学(尤其博弈论)的研究开辟着新领域。
一、 完全竞争的经济模型
完全竞争经济模型是对现实的一个高度抽象,它描述了这样一种情形:有许多参与人,每一个参与人的影响(对价格)可以忽略不记。因而,这种经济形态对任何单个行为人的行动都不敏感,只对总体行为有反应。
那么,什么是对完全竞争经济模型化的正确方法?奥曼认为:只要参与人的人数是有限的,单个个体对经济的影响,在数学上就不能忽略不计。在直观上,一个适用于完全竞争经济概念的数学模型必须包含无限多个参与人。因此,奥曼把参与人闭连续集的概念引入到这个经济模型来,很显然,这时每个个体在模型中的影响的确可忽略不记。
把闭连续集的思想引入经济学理论,曾一度对这门学科的发展起到至关重要的作用,使得经济学更具有科学的特征,经济分析也更加准确、严谨。
这个基本模型被明确设定以后,下一个问题就是:完全竞争将导致什么结果?古典经济学的分析是,存在着所有商品的价格,这些价格对于每个个体而言,被认为是给定的(主要指的是他的决策对这些价格没有影响),为了保证这种经济状态的稳定,这些价格一定就是总需求等于总供给时所有个体参与人的价格。这被称作是瓦尔拉竞争均衡。它是否存在、以及在市场中如何用交易人的闭连续集来很好地定义,已由奥曼在1966年就解决了,而且与以往有限个体的市场情形不同的是,在这里凸性假设是不必要的。
还有一种分析是这样:即考虑行为人以组成某类群体(被称作联盟)的方式进行交易,该联盟可以使交易后所有行为人都受益。这就产生核的概念——一个博弈论解的概念,它是比著名埃奇沃思的契约曲线更为一般化的概念:核由这样的资源配置所组成,即不存在任何能使这些资源配置得以改善的行为人联盟。这个概念的确不同寻常,因为:“完全竞争均衡的定义假设交易人认可由市场所决定的价格,而且他们的交易与这些价格相一致;而核则不考虑价格机制的作用,仅关心行为人之间的直接交易。”(Aumann,1964)奥曼的研究表明,在带有交易人闭连续集竞争市场中,核与竞争的资源配置集(即竞争均衡)恰好相吻合。通过引入能准确表达完全竞争思想的闭连续集的模型,奥曼成功地把这个等价命题精确化,其结论一直是经济学理论的基本原则之一。
接着奥曼把他的研究转向了完全市场背景中的其它概念上。在主流经济学中,一个传统的思想就是“边际价值”或“边际贡献”,这种思想被值(value)的概念所描述刻画,其最早的工作是由夏普利(Shapley)在1953年作出的。夏普利值是关于博弈局中行为人效用的一个预先测度,其中,它所度量的是每个行为人获得的平均期望值。
尽管竞争均衡或核的定义可以直接由行为人闭连续集产生,但这对值却行不通。从20世纪60年代后期起,奥曼与夏普利开始合作。1974年,出版了他们的著作《非原子博弈的值》。他们得出了一些重要的观点与结论。其中:“对角原理”阐述的是,在多人博弈中,每个行为人必需考虑联盟行动,联盟的达成会对所有行为人更大联盟的形成起到“样板”的作用。与核或竞争均衡不同,值解(the value solution)的概念几乎可以应用到所有的互动结构中去。例如,在多党政治决策的情形中,核解是空集,但是,值解却能被较好地定义并能产生很有意义的结论。
1975年,奥曼的研究又转回到完全竞争经济中,这次得出了另外一个等价结果,它比核的等价结果更令人称奇,因为根据值的定义,它不考虑稳定与均衡,奥曼认为(1987):“或许在博弈论与经济理论之间最引人注目的现象就是,竞争市场经济的(价格)均衡与对应博弈解的非唯一性之间的关系......知觉上,这一等价原理是说,市场的价格制度来自于在完全竞争经济中发挥作用的基本力量,不管我们对这些力量发挥作用的方式作什么假设”。
这些分析完全竞争经济所获得的基本认识与结论,使对一些基本经济问题的研究超出了完全竞争的范围。我们随便就能提几个奥曼最著名、最具影响的理论贡献:带有一个或多个行为人的交易人闭连续集的垄断与寡头竞争模型(1973);公共经济学——经济行为与政治决策过程的互动税收模型,如投票等(1977,1983);固定价格模型(1986)等。
二、重复博弈理论
行为人之间长期互动的性质告诉我们,博弈的不同阶段是相互依赖的,这就使得理性行为人的决策不仅受其过去经历的影响,其决策还要受未来可能的影响。我们生活中许多有趣的行为模式,如奖励,惩罚,传送与泄露信息等都可以看作是多阶段动态博弈。动态博弈中最重要的是重复博弈,即每个阶段的博弈结构是相同的。该理论能得以系统地发展,奥曼起着举足轻重的作用。重复博弈领域最早的结果出现在50年代,但确切出自何人之手却无从得知,这就是著名的“无名氏定理”(the Folk Theorem,)。它讲述的是重复博弈战略均衡支付与一次性博弈中可行的个体理性支付是相一致的。也就是说,只要行为人有足够的耐心,任何满足个体理性的可行支付都可以通过一个特定的子博弈精练均衡达到。这个结果可以说是把多阶段博弈的非合作行为与一次性博弈的合作行为联系了起来。然而,奥曼认为它本身并没有多少新东西。
奥曼考虑更特殊的合作行为的核(解)。在1959年,他定义了“强均衡”概念——指行为人群体不可能通过单方面改变策略而全都获益,并且给出了重复博弈的强均衡是与一次性博弈的核解(准确地说,是β—核)相一致的结论。值得注意的是,这使得奥曼去定义和研究“一般的”合作博弈——即效用不可转移的博弈,在此之前,人们仅仅研究的单边支付博弈——即每一联盟可任意地按固定的数量对其成员进行划分。
另一种试图减少无名氏定理解集合的分析方法是由德国数学家泽尔腾以“精练”思想给出的,他后来与纳什、豪尔绍尼一起获得诺贝尔经济学奖。他大致是讲,一个行为人不应该使用非理性的战略,否则的话,也会伤害他自己。奥曼和夏普利在1976年证明:实际情况并非如此,在重复博弈中,均衡的结果与完美均衡的结果是一致的。与此同时,罗宾斯坦(Rubinstein)也独立地给出了同样结论。
重复博弈的另一种类型是非完全信息重复博弈。与完全信息不同的是,这里,行为人大概不会拥有被重复着的一次性博弈所具有的一些相关信息。在这种情况下,博弈重复的重要性在于能使得行为人从其他行为人的行为中,获取并了解到信息。从60年代中期,奥曼与他的合作者及学生一起,建立并发展了非完全信息的重复博弈理论。1966年,他们向美国军事有关部门提交的那份开创性的报告中,奥曼与Michael Maschler建立了非完全信息的重复博弈模型。他们认为,以前所说博弈中信息的复杂性实际上是可以通过一种简明、优雅的方法予以解决。他们证明到:在最简单的双人零和博弈中,一个行为人比另一个得到的信息多,这个行为人所获取(或披漏)信息的数量可以被准确地决定,有时完全披漏或一点也不漏;有时披漏一点。这种方法接着被扩展到更一般的模型中,不仅是零和博弈、还有非零和博弈,并提出了一些新的、更深刻的概念。例如,在1968年,奥曼、Maschler和Stearms提出了“共同操纵博彩”的概念,在一个博彩中,没有那个行为人会单方面地改变不同结果的概率;在非零和博弈的框架中,这个概念被证明是最贴切的。
自从这项开拓性研究工作以后,重复博弈理论的研究有了更大的进展。奥曼把它称作是“一个跨越其它相关领域的视野开阔、思想敏锐和内容深刻的文献”。它对非完全信息讨价还价博弈的本质有着更深刻的了解和认识,并且已被广泛地应用到经济理论中去,如寡头、代理理论、保险以及其它领域。
在奥曼所提出的重复博弈模型中,要特别说明的一点是:他把重复当作是一个一般讨价还价过程的一种范式。行为人间的长期互动行为,出于沟通、传送信息等目的,也可以使用单个的一次性行动,这类行动对总支付的影响可以忽略不计。在此,又看到了奥曼的“统一分析方法”。通常人们使用不同的模型外生地讨论行为人之间的讨价还价与沟通交流,与此不同的是,现在奥曼只需一个简单的标准讨价还价模型,就可以把沟通、交流等行为内生化。
三、 博弈论的基础问题
为了构建和完善博弈论基本概念的基础,奥曼一直在做着不懈的努力。他成功并富有创造性地解决了许多这类问题。其早期的工作推理简明、优美,内容准确,思想深刻,往往触及问题的本质。
在多人互动的框架中,博弈论(或许也是经济学的基本问题)存在着一个基本问题:“什么是理性”?经过多年的分析研究,奥曼发展并提炼出了一个关于这个问题的统一观点,其基本思想可简述如下,即:“给定一个行为人拥有的信息,如果他最大化他的效用,那么他就是理性的”。因此,一个理性的行为人总会选择一个他最偏爱的行动;当然,“最”是相对于他所拥有的知识而言的,这些知识主要是该行为人关于环境及其他行为人的信息。出人意料的是,这个看起来似乎简单明了的陈述却可以从不同的角度去理解,而且可导致一些是相互矛盾的结论。实际上,什么是行为人的信息?关于其他人他能知道什么?关于他自己的理性他知道什么?这都是容易产生歧义的问题。奥曼为解决这些问题做了大量很有影响的工作,其中一些已为这类模型建立起了标准的研究范式。
首先,知识与信息问题。很明显,一个人的行为依赖于他知道什么。接下去,依赖于他知道其他行为人知道他知道什么......。这个过程无限地不断进行下去,每个人知道,每个人知道每个人知道......。人的理性要计算无限遥远的将来收益,在某个阶段,是不大可能完成如此无限的任务。奥曼在1976年的一篇论文中,为了能准确地理解认识这种情况,他把共同知识的概念作了形式化的处理。奥曼论证到,假设两个有着同样先验信念的行为人,如果他们关于某一特定事件(基于不同的私人信息)的后验信念是共同知识,那么,这些后验信念一定是一致同意的。这篇文章产生了巨大的影响。一方面,它导致了今天我们熟知的“互动认识论”的整体发展,这是一门研究在多人格局中知识的正式概念的学科;另一方面,它带来了许多应用,从经济模型到计算机科学。例如,在经济模型中,Milgrom和Stokeyde的结论是,只要人们有同样的先验概率并且他们的行动也是相互了解的,那么,拥有不同信息的人们之间是不可能达成交易的。
其次,关于“贝叶斯理性”的假设,它意味着每个行为人根据他的概率来最大化其效用。这是单人决策理论中的标准形式。然而,在多人的框架内,它的含义又是什么?奥曼1985年给出的结论是,它与相关均衡的概念正好相吻合。相关均衡的概念是奥曼1974年给出的,它是在某种情况下,行为人可以使用他所拥有的一些不确定事件的私人信息(信号)时的一个非合作均衡解,而且这些信号应该是高度相关的;如果它们是随机独立(不相关)的,就可实现传统的纳什均衡解。把相关均衡的概念引入到经济学以及其它领域,这已经导致了关于不同沟通过程和一般机制理论中更进一步的重要研究。
在近期的工作中(Aumann,1995),奥曼解决了这样一个基本问题,“为达到某个纳什战略均衡,博弈所需理性和理性知识的限度是什么?”奥曼的回答与通常的观点相左:理性的共同知识并非必需。严格的理性是关于决策人行为的一个很强要求和一个复杂假设。这就导致人们放松原假设,去考虑构建有限理性的模型。在互动的情形中,奥曼论证了一点点非理性怎样可以被长久地维持,它足以在重复博弈中的某种情况下合作地产生,这是奥曼与席尔瓦1989年给出的结论,该结论解决了著名的“逆向推理悖论”(如蜈蚣博弈)。
尽管我们已经了解了奥曼对非合作博弈理论的贡献,其实,他对合作博弈理论的影响也极其深远。
一般认为,冯·诺意曼和摩根斯坦1944年的那本著作《博弈理论与经济行为》奠定了合作博弈理论的基础。通过给每个行为人的联盟赋予一个数值,他们定义了一种联盟博弈的形式。对此一种标准的解释是:决不能只把这个数当作由该联盟内成员自己可任意分割的总收益。其假设是:存在着交换媒介(“货币”),它可以在行为人之间自由地流动转移,并且每个人的效用与它是线性相关的。这些博弈通常被称作是“单边支付”博弈,或可转移效用博弈,简记为TU博弈。
奥曼把传统的TU博弈理论推广到一般的、非转移效用的(简记为NTU)情形中去。他是通过重复博弈来完成这项工作的,而且还把它扩展到许多TU博弈所不适用的应用领域中去。奥曼先给NTU联盟博弈的形式下了一个恰当定义,接着,他又给出了相应合作解的概念。
多年来,奥曼在TU与NTU两个方面发展并极大地丰富了合作博弈理论。一方面,他研究了不同模型中合作解的概念。我们已经在完全经济的模型中分析过这样一个给人印象深刻的结论:即合作博弈解的概念与竞争均衡的概念是等价的。在许多其它的应用分析研究中,我们特别要提及奥曼与Maschler1985年的论文——“犹太教法典毁灭问题的博弈理论分析”。这是一个有趣(还有些出人意料)的分析,在此,奥曼得出了联盟博弈核仁(nucleolus)概念。讲得通俗一些,它表明派生问题的解(以一种合适的方法从初始问题所定义出来的)应该与初始问题的解是一样的。这完全与奥曼和Maschler在1964年所提出的概念相关,并产生了新的解概念:讨价还价集、联盟博弈的内核(the kernel)以及联盟博弈的核仁等。
另一方面,奥曼对合作博弈理论的基础也做出了贡献。例如,他对NTU-值解概念的公理化处理。这个解最早由夏普利在1967年给出的,后经奥曼和其他人的进一步研究与应用,它(由不动点的过程)被构造性地定义。与传统的纳什讨价还价解和夏普利值解(应为TU值解)不同的是,NTU-值解缺乏公理性的基础。在1985年一篇论文中,奥曼成功地给出了一个描述NTU-值解的公理化集。应该说,这篇论文开辟了一个新的领域,并在许多新的研究方向上产生了新的分支。
四、其它的贡献
在值集函数领域,奥曼也有许多重要的贡献,如:奥曼可测选择定理、值集函数的积分等。它们绝大多数都是用不同的博弈理论和经济模型所研究解决的,特别是在这些模型的演进和分析中发展出的行为人闭连续集和一些数学理论也成为其分析工具。奥曼所给出的结果往往都是基础性的,并在经济学、数学和运筹学等许多学科领域内得以应用,比如:一般均衡分析,最优配置,非线性系统,控制论,测度理论以及不动点定理,等等。
在解决了复杂的技术难题的同时,奥曼还把库恩关于有限完美记忆博弈中行为战略与混合战略等价的著名结论,推广到无限完美记忆的博弈中去。在合作博弈中,行为人可以把他们自己组成联盟。奥曼对这类博弈做了研究(与Jacques Dreze合作,1975),并对联盟的形成给出了模型的解释(与Myerson合作,1988)。
(作者:李军林 郑志)
托马斯·谢林
托马斯·谢林(Thomas C. Schelling)在社会经济行为分析这一“非数理博弈论”领域作出了独有的探索。在其中,行为者的行为是建立于其它参与者对其行为所作出的预期的基础上;并且行为者还须考虑这一事实:行为者本身对其它人的反应也作为其它人的期望而影响其行为。谢林建立了一个理念框架以描述相互期望困境。谢林的这一工作使原本不相关的理论领域有了结合的共同基础,包括:供不应求市场的分析、军事和外交战略、谈判、团队工作和通信问题。谢林的社会关系理论及各方面的应用源于其对理论和实践的利益良好的综合。他有这样一种特殊的天赋:对于这样一种社会或经济形势——其中涉及的参与者有着一致或相反的利益,谢林对其本质有着深刻的洞察力,并能用生动而具体的措辞描述这种形势。谢林将他们的理论洞见及实践应用阐述于一系列有影响力的文章和专题著作之中。
作为一个教师,他开授的经典课程“战略与冲突研究”充满了一系列丰富生动的实例说明,该课程激发了一代又一代的经济学学生。他还使其理论被广泛地接受,许多面向大众的行文生动而富于煽动性的文章接受了他的理论。
——美国经济学联合会杰出资深会员颂词
我在研究生院读书时谈判问题就引起了我的兴趣,1948-1953年间在欧洲和华盛顿参与外援谈判,后来作为一名对谈判感兴趣的国际经济学家进入耶鲁大学。几年内转向最诱人的军事战略和军备控制等应用领域,在兰德公司工作过一段时间,当选过各种军工技术和军备控制咨询委员会成员。1959年加盟哈佛大学,在经济学系和国际事务中心跨系供职研究,20世纪60年代专门从事国家安全战略和国防经济学的教学和研究。
出于对谈判的同一兴趣,后还对犯罪、抗议和恐怖主义进行了研究。虽然从1970年起不再与政府有什么联系,但我还是关注核扩散问题,因而有几年能源政策研究的经历。由于对种族和其它社会分工感兴趣,又在建立种族隔离和取消种族隔离的模型上作了些研究,于是有《微观动机与宏观行为》著作的出版。出于对谈判的同一兴趣,我还涉足死亡的社会安排、温室气体在大气层集中所致全球气候变化前景等如此迥然不同的领域。最后,由于始终对人们管理自己的行为这方面的问题有好奇心,20世纪70年代我开始研究种种使人上瘾的行为,到20世纪80年代初,我决定把“克己”作为我全神贯注研究的一个理论问题,而吸烟作为应用研究的一个问题。
——托马斯·谢林自我点评
传统的主流经济学沿着完全信息理论和数学表达的两条基本途径发展到今天,不可避免地陷入了理论推演的结论严重偏离现实的困境。而一直被视为非主流经济学家的的托马斯·谢林不但早已运用其非数理博弈理论(nonmathmatical game theory)避开了这一障碍,并且将该理论非常熟练而又令人信服地运用到了政治学、社会学、心理学及国际关系等不同领域之中,从而形成了社会科学的经典理论。谢林因此被看作非数理博弈理论领域的先驱。
一、非数理博弈理论的创立
谢林的非数理博弈理论是建立在对新古典经济理论分析方法突破的基础之上的,与主流的数理博弈理论在研究方法和侧重点上有很大不同,它完善和发展了现代博弈论。
谢林最初致力于传统经济学的研究,而在他写于1958年的教科书《国际经济学》中,则吸呐了诸如外国援助谈判与成本分摊协定这样的课题,并以一种传统经济学家从未设想过的方式对其展开论述。这时,谢林已经开始偏离传统经济学方向。在他此后的文章和著作中再没有回归方程,货币与流动性等术语也很少出现,谢林的研究领域从经济学延伸到整个人类社会。但是,谢林从未否认经济学传统,也没有建立一套替代的理论体系。他实际上运用标准的新古典理性假定去探索被其他经济学家忽略的人类行为。谢林在研究过程中被一些理性行为理论不能充分解释的案例所吸引,当标准的新古典模型不能提供足够的解释时,谢林才力图将其扩展使其可以考察现实世界的行为,并采用独特的新的分析方法。可见,他对主流新古典经济学的不认同在于他认为后者没有提供理解经济现实的足够工具,于是,他重新论述了消费需求理论和博弈理论以使其能解释人们的实际行为。谢林在此基础上开创了与主流博弈理论不同的非数理博弈理论。
主流的数理博弈论是现代经济学的基本范式,几乎所有的现代经济理论都是在博弈论的框架内进行的。在博弈论的发展过程中,以纳什、豪尔绍尼、泽尔腾为代表的经济学家坚持采用数学语言和公理性的方法来进行研究,而谢林则沿着另一条途径对博弈论的建立和发展作出了重要贡献。在谢林看来,在双方或多方相互影响的情势之下,博弈是不可能通过建立模型来表述进而加以研究的。因为决策主体的期望和行为无法通过纯粹的逻辑和数学推导而得。混合动机的博弈的决定因素与其说是数学的,不如说是经验的,即参与人在选择博弈战略时,不仅有数学上的考虑,也有创造声誉,沿袭传统,建立自信,显示大度等许多非数学因素。基于这样更接近现实的观察,谢林开创了非数学博弈理论这一新的领域。他运用优美的语言和小模型,而非严格的逻辑论证,将他的理论通过众多的实际应用分析表述出来。
二、非数理博弈理论的主要内容
非数理博弈理论分析的是这样一种状态下的社会和经济行为,即每个参与人的行为取决于他是如何预期其他每个人将如何应对他的行为;并且其他每个人对该人将如何应对他们行为的预期也同样地影响到其他每个人的行为。谢林建构了一套概念框架来描述这种相互预期的困境,并籍此将各种零散的理论统一在一起。谢林在他的主要著作和文章中先后提出的三
个重要理论共同构成其非数理博弈理论的主要内容。
(一)讨价还价和冲突管理理论
1960年,谢林发表了他最著名的代表作《冲突的策略》。在这本书中,他对讨价还价和冲突管理理论作了具体分析。谢林所说的讨价还价(bargaining)实际上是一个非零和博弈。在效率曲线上,博弈者的利益是对立的,没有帕累托改进的余地(即任何一个人的趋利变动都会损害另一个人的利益)。但这种对立只是一种逻辑上的可能,在效率曲线上的所有点中,必然有一点,在此点上博弈者的利益是一致的。他们避免两败俱伤的共同想法,体现为他们在效率曲线上找到一个合适的点,以解决彼此的冲突。
讨价还价和冲突管理理论涉及到一系列默契协调(tacit coordination)的问题,不论这种协调是由于共同利益还是由于一部分不一致的利益。谢林正是从这些初步的实验出发去探寻在充分交流的背景之下,公开的讨价还价是怎样达成协议的。首先,他认为这种协定的达成类似于“双方期望的协调”问题,即如果任何一方都推测这个结果双方都可能接受,那么协定就可以达成了。其次,谢林认为这种期望由许多因素共同塑造:包括历史的、美学的、法律的、道德的,以及文化的因素,当然也包括纳什等人所强调的数学因素。具体而言,通过讨价还价现象的观察得到的结论就是一个博弈者避免两败俱伤的努力如何影响对手类似的行为。该结论涉及以下要点:
1.约束。约束减少一个人未来行动的自由。受约束的博弈者可以说明自己不能再作退步,而让另一方作让步。
2.游戏规则。由于约束不够灵活,博弈者可以建立一个相应的游戏规则。通过此规则,受约束的一方可以对另一方的多种行为做出反应。威胁和承诺是基本的游戏规则。
3.可信度。约束、威胁与承诺要有可信度,规则必须是固定的和不可逆转的;对规则的采纳要让对方知道。谢林认为提高可信度的方法包括利用一些看似非理性的行为。这些方法在正规模型中往往限定一个很小的策略选择范围。谢林则从相反的思路去应用约束。他的分析具有开阔的视野和丰富的细节,相对于以前的研究显得更为中肯,也更有说服力。
4.结果。特定的结果最终会在效率曲线上出现,这种结果对双方都应是有吸引力的。当任何一方知道另一方对此结果会予以注意时,他们就会选择这一点,而放弃任何有可能失败的进一步努力。这种可能的结果成为“聚焦点”(focal point )。它的产生可能由于历史的、文化的或纯粹的偶然因素。因此,平分利润可以成为讨价还价模型的一个“聚焦点”而为双方接受,虽然双方实力悬殊;荒野中河上的一座小桥可能成为旅行者相遇的逻辑地点,虽然小桥可能离一方更远,有点“不公平”,而且有许多其它的公路交汇点离双方都近一些。这些因素都与正规的决策模型毫无关系,但正规的模型也许会因此遗漏解决问题的精髓之处。的确,许多有效的讨价还价建立在双方都满意的“聚焦点”之上,而这种“聚焦点”是因为有先例或某种原则而形成的。
在现代博弈理论中,大都离不开数学的严格论证。而谢林通过简单模型得到的重要结论则更容易为大众所接受。例如:他的关于可信度的分析抓住了“子博弈完美”(subgame perfectness)的精髓,这种博弈要求在进行下几轮博弈中,博弈者都不偏离均衡的轨道。谢林证实了可信度作为使博弈在博弈者的主导策略失败之后沿均衡轨道继续下去的机制。我们现在知道这个过程在完全充分信息下的有限博弈当中的确能产生“子博弈完美均衡”。此例说明了谢林的一个独特之处:他非正规的工作却能发展为后来被广泛运用的概念,这些概念后来被他人在严格的数学论证中涉及。
谢林的讨价还价与冲突管理理论开辟了决策领域的新天地。随着1944年冯·诺伊曼与摩根斯顿的经典之作的出版,非零和博弈在之后的十年里影响甚小。谢林以一种任何读者都能接受的方式运用该理论。他关于讨价还价和冲突管理的理论将承诺与威胁、保密与显露等概念表述无遗。他准确地将对社会科学家来说意义相对小一些的零和博弈与常数和博弈作为博弈论中的特例,而混合动机的变量和博弈不仅包括冲突而且包含双方的共同利益,它对社会科学的重要性要比纯粹的冲突博弈大得多。他也指责传统的博弈理论家在处理混合动机的情势时,过多地以零和博弈方式思考。谢林认为混合动机的博弈与完全合作的博弈之间的相似性,比前者与完全冲突的博弈之间的相似性要大一些,而这一点由于习惯性思维的影响,经常被人忽略。谢林正是在认识到数理博弈理论不足的基础上来创建其非数理博弈理论的。
(二)相互依存的选择和行为理论
谢林在他1978年发表的重要著作《微观动机与宏观行为》阐述了相互依存的选择和行为理论。这一理论归类、分析单个人的决定最终导致出乎人们意料的集体行为的现象。这一点与市场经济有许多不同。这种人们所不情愿的集体行为不仅源于人们的决定对外部资源瓶颈的敏感,还源于人们的决定往往是对其他人的行为作出的反应。人们可以选择坐成一团,或在房间里分散而坐;但喜欢前者的人有时发现自己处于后者的情形,他们作此决定无疑受了大家的影响。一些后来者喜欢效仿先来者,即使先来者并不喜欢自己的行为方式。许多引人入胜的事情具有让人模仿的魅力,无论它是琐碎还是严肃。
为了进一步说明相互依存的选择和行为理论,谢林提出了一个重要论题:“关键多数理论”(critical mass)。在社会决策过程中,有许多强制力(compelling force )能让决策汇于一点形成共识。这些强制力包括文化的、习惯的因素。一旦社会形成一个特定的惯例,比如语言、风俗及其他方面,它就很难改变,即使每个人都知道选择的惯例不是最好的。尽管“关键多数理论”的中心逻辑在该书中没有明确的阐述,但事实上很简单。它的一个必要条件是:在一特定群体之中,喜欢某种行动的比例是实际采纳这种行动比例的增函数。它的充分条件是:实际采纳的部分比例较大的话,喜欢此行动的比例要大于实际采纳的比例;实际采纳的比例较小的话,喜欢此行动的比例要小于实际采纳的比例。
谢林的相互依存的选择和行为理论还分析了不同群体相互作用的问题和“多人囚徒困境”(MPD)。不同群体的相互作用涉及“关键多数理论”和人们的心理偏好;而“多人囚徒困境”则是一种双重选择情势,其中各人的非合作行为超过了各人的合作战略,导致了全体都不愿意看到的结果。在此基础上,谢林对合作均衡与非合作均衡作了整体论述。
(三)自我控制理论
谢林在1984年发表的著作《选择与结果》收集了作者从1965年至1984年20年间所写的五篇论文。在这部著作尤其是在他1980-1984年所写的几篇相互关联的文章中,他全面阐述了他的自我控制理论。这一理论的提出表明谢林从关注多个参与者之间的博弈转向“自我博弈”,即“以自己为对手”的博弈。谢林试图通过这一理论来回答什么是理性、人是如何控制自己行为的。
谢林发现在日常生活中,人们喜欢自我欺骗以使自己做应该做的事情,或者避免去做一些不该做的事情。这种抑制自己的偏好,对自己的行为施加控制的现象,谢林称为预期的自我控制(anticipatory self-command)。谢林认为:人们在不同的偏好之中,理性地选择一些偏好而抑制另一些偏好的现象,在人们的决策过程中是不可忽略的,因此不能将其从消费者行为理论中剔除。如果我们认为消费者在所有时间,即使是短期都具有一致的价值取向和偏好,那么我们会忽略许多重要的下意识的行为。
谢林强调自我控制和偏好改变的目的是为了将消费行为理论突破乔治·斯蒂格勒与加里·贝克尔所发展的狭窄范围。谢林认为人们有时好像不是具有唯一身份、价值观、记忆和感觉的单一个体,而往往存在“双重人格”。他把自我控制问题引用到双重人格的斗争之中。双重人格对某一特定的事物具有不同的偏好,而无法决定哪一个人格去支配行动以使总体效用最大。谢林建议自我控制的理论应成为经济学的一部分。他指出:普通人有时不是一个单一的理性主体;我们更像许多人格的小集合,而并非单一消费者。如果我们承认双重人格的思想,每次只有一个人格主导行为,那么理性选择将会被类似于“集体选择”的概念所代替。
一个完全的消费者行为模型应该涉及预期的自我控制的分析。谢林进一步描述不同的人格如何决定由谁主导其行为——将决定权移交给别人;安排奖励与惩罚;通过承诺或契约,或者建立一个轮换机制。在所有的论文当中,谢林从未轻视新古典的消费需求理论。他的目的无非是唤起人们对后者所忽视的普通行为的注意,并呼吁经济学家将其融入他们的模型之中。
上述三个理论构成谢林非数理博弈理论的三个方面,而它们之间又是相互贯通的,人们之间的相互影响及个人的自我控制程度会影响双方的要价及决策分析能力。无论是分析多个群体还是单个对象时,谢林都并不认为所谓的理性是客观存在的。因此,可以说谢林正是在放弃传统经济学的抽象假设和理性概念、关注现实人行为的基础上创立非数理博弈理论的。
三、非数理博弈理论的运用
人类社会纷繁复杂的社会和经济行为为非数理博弈理论提供了丰富的素材,反过来,谢林又将非数理博弈理论广泛地用于研究核决策和军事控制、组织犯罪与敲诈、成瘾行为和自我控制、种族隔离、全球气候变暖、能源政策、环境保护、外援和人类生命的价值等等一系列政治、经济和文化、伦理问题。从本质上说,谢林是在一个比大多数博弈分析更广阔的天地里运用博弈论。
谢林最有影响的一个贡献,在于将非数理博弈理论运用于国际关系领域。其《冲突的策略》运用博弈理论分析国家之间的讨价还价。书中阐述的原则也可以用于研究其他的冲突情势,只要有可能存在对双方都不利的结果及一方实现其目标的能力依赖于另一方作出的决定。
谢林得到了一个惊人的结论:在讨价还价当中,弱者常常是强者,塞翁失马,焉知非福。将自己固定在特殊的谈判地位是有利的。当任何一方都认为对方不会做进一步让步时,协议就达成了。一方让步是因为他知道对方不会让步了。谈判的实力在于让对方相信你不会再让步了。谢林描述了把自己固定在有利的谈判地位的三个策略:不可逆转的约束、威胁和承诺。
谢林花了较多的精力来关注冷战时期的美、苏冲突。谢林认为毁灭要比建立容易得多。毁灭双方的力量正是谈判的力量,开发这种力量的是外交。 在谈判中,必然有一些共同利益,即使它仅仅是防止两败俱伤。既然美国与苏联谁都不愿卷入核战争,因为就是获胜者也会遭到严重的创伤,那么使用武力的威胁就可以阻止苏联的行为。核武器增加了将威胁变为现实的成本,所以美国需要让对方相信自己的威胁。设置一个可信的威胁往往成为解决问题的关键,但威胁很难令人完全相信。威胁的效力取决于对方对我们是否真的采取行动的预期。对未来行为的预期取决于过去的行为。如果以前的威胁没有付诸实施,对方没有理由相信现在的威胁将会变为现实。
谢林在《冲突的策略》中指出:偶然事件不会引发战争,只有决定才会导致战争。如果一方相信另一方会发动突然袭击,一场双方都不情愿的战争就会爆发。突然袭击具有巨大的优势。发动突然袭击的原因在于对方无反击的能力。因此,防止突然袭击的首要目标是军事安全而非人员安全。防止突然袭击需要可信的第二次还击能力。
在其1960年出版的著作《武器与影响》中,谢林运用非数理博弈理论对军备控制进行了经典的研究。军备控制在双方防止战争爆发,减少军备竞赛的成本与风险,以及减少战争爆发时的波及范围与破坏程度方面存在共同利益时,是可能的。武器的发展不断地增加突然袭击的优势,所以最好的核武器分布是双方都有还击的能力,或者任何一方都缺乏一次性摧毁对方还手之力的能力。和平的基础在于二次还击的能力。
除了对军事问题的关注外,谢林关心非常规课题的另一个例子是对有组织的犯罪(organized crime)的研究。谢林认为,敲诈和买卖非法商品的行为被经济学家忽略了。既然经济规则不仅适用于合法的公司、企业,也适用于地下经济,谢林就企图从组织学的角度分析有组织的犯罪形成的原因。其结论是法律对犯罪行为的打击力度与犯罪是否有组织密切相关。当法律的打击力度达到某一点时,组织犯罪就会盛行。低于这一点,组织犯罪就无利可图。
谢林运用非数理博弈理论的另一个重大成果是建立了“有界的邻里关系模型”。谢林运用该模型分析了非组织的个人动机如何转变为集体行为并以此说明种族隔离是个人选择的自然结果。个人不同的动机和感觉能导致个人和社会都不愿意看到的种族隔离行为。如果白人和黑人都想避免成为“少数人的身份”(minoring status),那么完全的种族隔离才是唯一稳定的均衡点。
谢林总结道:在黑人、白人混居的社会里,例如美国,完全的种族隔离是唯一的均衡。该模型假定了一个关于邻居关系及其边界的定义。人们要么在邻居关系之中,要么在其边界之外。每个人都关心邻居关系的种族比例,而不关心其具体安排。每人都有一个黑人和白人比例的容忍极限,一旦极限达到,他们就会迁移;如果最初状态是一半白人和一半黑人混居的均衡的话,那么黑人——白人比例的微小变动将导致一场迁移运动,最终的稳定均衡是黑人与白人的完全分离。
因此,谢林认为,当人们的行为受他人行为的影响,或人们关心他人的行为时,人的自我服务的行为将导致大家都满意的结果的假定是不存在的。种族隔离就是一个典型的例子。
此外,谢林还运用非数理博弈理论考察了全球共同事务中的一些问题,例如温室效应。全球变暖效应对发达国家的影响是微不足道的,而发展中国家的农业经济却深受其害。发达国家没有限制二氧化碳排放的动机,而发展中国家又承担不起治理温室效应的成本。于是在任何情况下,所有国家都会竞相地毫无节制地排放二氧化碳。而且对发展中国家来说,人口的高速增长相对于二氧化碳的排放来说,问题要严重得多。
四、评价
在半个多世纪的时间里,谢林运用非数理博弈理论分析了从孩子们的游戏到核大国之间对抗的许多事情。他以博弈者的眼光观察世界,自由地游弋于日常现象与深奥真理之间。他的作品通过机智、清晰的论述和出其不意的结论征服读者。其作品具有最具价值的经济理论常有的品质:相关性和可接受性。由于谢林更关注传统经济学还没有解释或不能解释的课题,所以,他常常会发展一些原创的概念和论题来充实他的非数理博弈理论。这种对世界具有广泛适用性的原创性的洞察成为一条贯穿其作品和理论的主线。
谢林研究的大部分问题都在传统经济学的范围之外。也许其他经济学家很少追随谢林的原因在于他的工作需要勇敢的探索。当传统经济学家研究有代表性的消费者与产品时,谢林却在关注特定的群体。他将市场留给别人去研究,自己却思考日常生活中的琐碎现象,通过一系列实验性案例来评估理论、构建理论。谢林扩展经济学领域的努力和他对主流经济学的技术上的不认同不是源于他对主流经济学的不满,而在相当程度上是源于他的好奇,源于他自己思想的指引。
(作者:朱小梅 田贤亮)