你好,欢迎来到经管之家 [登录] [注册]

设为首页 | 经管之家首页 | 收藏本站

[南方周末]博弈论使他们获得2005年诺贝尔经济学奖

发布时间: 来源:人大经济论坛
南方周末 何德旭 王朝阳 应寅锋      瑞典皇家科学院10月10日在斯德哥尔摩宣布,将2005年的诺贝尔经济学奖授予以色列希伯莱大学的罗伯特·奥曼(Robert J.Aumann)和美国马里兰大学的托马斯·谢林(Thomas C.Schelling),以表彰他们“通过博弈论分析,促进了人们对冲突和合作的理解”。为此,他们将获得1000万瑞典克朗(约合130万美元)的奖金        他们为何获奖      为什么一些个人、组织和国家在成功合作的同时又有一些个人、组织和国家在承受着来自冲突的折磨?长期以来,社会学家和经济学家都在试图理解、阐释冲突和合作的最根本动因。20世纪中期博弈论的出现提供了一种非常新颖、非常独特的分析视角,使得研究人员能够运用精确的数学工具来分析这一问题。   一般认为,博弈论始于1944年。数学家约翰·冯·诺伊曼(John von Neumann)和经济学家奥斯卡·摩根斯坦(Oskar Morgenstern)合作出版了《博弈论与经济行为》一书,概括了经济主体的典型行为特征,提出了策略型与广义型(扩展型)等基本的博弈模型、解的概念和分析方法,奠定了博弈论大厦的基石,也标志着经济博弈论的创立。1994年诺贝尔经济学奖获得者纳什(John Nash)、泽尔腾(Reinhard Selten)、海萨尼(John Harsanyi)在非合作博弈方面的贡献进一步增加了博弈论的适用范围和预测能力。   奥曼和谢林这两位学者的工作又进一步发展了非合作博弈理论,并开始涉及社会学领域中的一些主要问题。他们分别从两个不同的角度———奥曼从数学的角度、谢林从经济学的角度,都感到从博弈论入手有可能重新塑造关于人类交互作用的分析范式。最重要的是,谢林指出,许多人们所熟知的社会交互作用可以从非合作博弈的角度来加以理解;奥曼也发现一些长期的社会交互作用可以利用正式的非合作博弈理论来进行深入分析。   在20世纪50年代后期核武器军备竞赛的背景下,谢林的著作《冲突的战略》(The Strategy of Conflict)将博弈论作为统一的分析框架应用于社会科学问题,他认为:一个政党可以通过公开恶化自身的选择权来巩固自己的地位;报复能力远比抵抗进攻能力来的有用;不确定性的报复比确定条件下的报复更有效率、而且更加可靠。这些已经被事实证明是解决冲突、避免战争的非常中肯的创见。   奥曼发现,在很多现实情况中,长期合作关系的维系远比一次简单的际遇来得容易,因此短期博弈理论往往具有很多限制性。为此,他首先提出了完整详尽的无限期重复博弈理论,并严格论证了何种结果能够在长时期的关系中得到维持。无限期博弈理论阐明了众多机构存在的理由,比如商业协会、组织犯罪、工资谈判以及国际贸易协议等,并且奥曼所提出的一些真知灼见也有助于解释价格战或贸易战等经济冲突,以及为什么一些团体组织能够非常成功地管理公共资源。   尽管他们关于冲突和合作的作品在1950年代末期出现后就得到了普遍承认,但奥曼和谢林的洞察力仍过了很长时间才得以充分展示。这种延迟一方面反映了他们所作贡献的新奇创意,另一方面也反映了他们后来各项工作的困难与艰辛。终于(特别是在最近25年),博弈论发展成为经济学和其他许多社会科学领域中一种被普遍接受的分析工具和语言。奥曼和谢林所创建的博弈理论或者说交互决策理论为解决合作或冲突这一古老问题提供了最优路径。人们看到,当前关于冲突和合作的经济分析几乎无一例外地都是在奥曼和谢林研究成果的基础上开展的。          如何评价他们的理论      谢林本人曾说过:“如果你要研究某个理论或者发展某个概念,如果你认为这个理论或概念将促进人们对现实世界的理解,那么就请发明一些浅显易懂的概念。”正是按照这种思想,他发明了许多原创的概念来充实其博弈理论。   谢林的博弈理论建立在对新古典经济理论分析方法突破的基础之上,与主流的博弈理论在研究方法和侧重点上都有很大的不同,从而完善、丰富和发展了现代博弈论。   在《冲突的战略》一书中,谢林首次定义并阐明了威慑、强制性威胁与承诺、战略移动等概念。尽管当时谢林并没有刻意强调正式建立模型问题,但是他的很多观点后来随着博弈论的新发展而定形,而他所定义的概念也成为博弈理论中最基本的概念,比如,完美均衡概念中的不可置信威胁就源自谢林的可行均衡概念。   人类社会纷繁芜杂的社会和经济活动为博弈论提供了非常丰富的研究素材,近半个世纪以来,谢林运用他所发展起来的博弈理论对核决策与军事控制、组织犯罪与敲诈、成瘾行为与自我控制、种族隔离、环境保护等现象做出了深刻、富有前瞻性和洞察力的分析。   他卓有成效的工作促进了博弈论的新发展并且加速了这一理论在社会科学领域的运用,特别是他对战略承诺的研究为许多现象(比如公司的竞争性战略、政治决策权的授权等)给出了解释。1988年美国经济学联合会将其评为“杰出资深会员”时,其评语为“谢林关于社会关系的理论以及他对该理论多方面的应用源于他富有成效地将理论与实践相结合。他有着异于常人的天赋,这使得他能切实涉及到有着相同或不同利益的参与人的社会和经济状况的本质,并能具体而生动地把这种本质描述出来”。本届诺贝尔评奖委员对他的评价是:“谢林,这位自称‘周游不定的经济学家’,被证明是一位非常杰出、具有开创性的探险者。”   在博弈论的发展过程中,奥曼同样发挥了至关重要的作用。他在关于战略互动的许多方面发展应用了统一分析方法,涉及到诸多迥然不同的学科,比如经济学、政治学、生物学、物理学、计算科学以及统计学等。   对于许多截然不同的问题,比如威慑手段、完全竞争、需求大于供给、征税、投票,奥曼并没有采用各种不同的研究手段,而是发展运用了统一的分析方法。奥曼关于博弈论的研究有着非同寻常的广度和深度,从基本概念的确立到理论工具和研究方法的创新,以及理论体系的形成,甚至博弈论在不同领域的应用,奥曼往往独辟蹊径,在富有创新的同时又能够精确严谨。尤其值得一提的是,奥曼的大部分研究都与经济理论的中心问题联系密切,一方面,这些问题为他的研究工作提供了刺激和动力;另一方面,他的研究成果又给经济学带来了新的见解和独到的视角。   奥曼在博弈论上的研究成果提高了人们对合作前提的认识和理解,比如,为什么当存在许多行为人时合作会变得更加困难,什么时候行为人之间的合作不太可能发生,什么时候交往可能会中断,什么时候别人的行为不能被清晰地观察到等等。在过去的20多年里,博弈论取得了很大的发展,尤其是在经济学中越来越占有比较核心的地位。应该说,奥曼在这其中自然是功不可没,他在早期的那些开创性研究工作一直影响并促进着博弈论的发展。直到今天,在博弈论研究的许多领域中,人们仍可以发现奥曼的身影和足迹。         奥曼的获奖理论及其他贡献      在奥曼的诸多贡献之中,关于长期合作(long-term cooperation)的研究对整个社会科学无疑具有最深刻的影响和冲击。如前所述,在社会和经济生活中,有许多交互作用从本质上来说都是长期的,甚至有一些是无限期的。比如说,一个国家有机会获得收益的同时往往要以邻国的付出为代价;一家竞争性企业在对每日每月的产量和价格作出决策时,要考虑到其竞争对手过去的行为;农民则有可能合作起来管理某些共同的资源(如牧场、水资源等)。因此,研究长期、周期性的交互作用无疑是一件非常有意义的事情。   对博弈当事人之间长期互动的性质进行考察后可以发现,博弈的不同阶段是相互依赖的,其结果是理性博弈当事人的决策不仅受到其过去经历的影响,而且还要受未来潜在可能性的影响。现实生活中的许多行为模式,比如奖励、惩罚、传送与泄漏信息等都可以被看作是多阶段动态博弈。在动态博弈理论中,最重要的是重复博弈,即同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。作为动态博弈中的重要内容,重复博弈既可以是完全信息的重复博弈,也可以是不完全信息的重复博弈。奥曼对重复博弈的贡献在于促进了博弈理论系统性的发展。   在重复博弈领域中,关于完全信息博弈的最早结果出现在1950年代,但确切出自何人之手却无从得知,这就是所谓的“佚名定理”(the FolkTheorem)。该定理认为,重复博弈的策略均衡结局与一次性博弈中的可行的个体理性结局恰好相一致,这个结局可被视为把多阶段非合作行为与一次性博弈的合作行为联系在一起。或者可以说,只要行为人有足够的耐心,任何满足个体理性的可行支付都可以通过一个特定的子博弈精炼均衡达到。然而,虽然所有可行的个体理性结局确实代表了合作博弈的解观点,但是它不能够提供相关信息,并且是相当模糊的。奥曼认为该理论本身没有多少新东西,他指出,完全信息的重复博弈论与人们之间相互作用的基本形式的演化是相关的。   奥曼还考察了许多具体的合作行为,分析了更特殊的合作行为的解(核),并于1959年定义了“强均衡”概念,即没有任何行为人群体可以通过单方面改变它们的决策来获益的情形。他指出,重复博弈的“强均衡”与一次性博弈的核是相互一致的。这使得奥曼开始去定义和研究经济理论中极为重要的“一般”合作博弈,即非转移效用(non-transferable utility)博弈。他的研究拓展了该领域的研究空间,因为在此之前,仅有“单边支付”博弈被研究,即每一联盟可以任意地按照固定的数量对其成员进行划分。   重复博弈的另一种类型是非完全信息重复博弈。与完全信息不同的是,在非完全信息条件下,行为人不会拥有被重复着的一次性博弈所具有的相关信息。在这种情况下,博弈进行重复的关键在于行为人能从其他行为人的活动中获取和了解信息。从1960年代中期开始,奥曼与其合作者及其学生一起,发展了不完全信息的重复博弈论。   1966年,在给美国武器控制和裁军机构提交的开创性报告中,奥曼和马希勒(Michael Maschler)建立了不完全信息的重复博弈模型。他们指出,以前所说的博弈中信息使用的复杂性实际上可以以一种简明优雅的方式来加以解决。他们的证明结果表明,在最简单的一个重复的两人零和博弈中,其中一个参与者比另一个拥有更多的信息(即所谓的单边不完全信息),拥有更多信息的参与者所使用(或披露)的信息数量是被精确地决定的;有时是完全披露或根本没有披露;有时则是部分披露。这种分析方法接着被扩展至更一般的模型,包括零和博弈与非零和博弈,并由此产生了许多新颖、深刻的观点和概念。   例如,奥曼、马希勒和斯特恩斯在1968年引入了一个“联合控制博彩”(jointly controlled lottery)的概念,即在一个博彩中,没有参与者可以单方面地改变彩票不同结果的可能性。在非零和博弈领域,这个概念被证明是非常贴切的。在这项开创性的研究工作之后,奥曼在重复博弈上的研究获得了丰硕成果,并把它称之为“一个跨越其他相关领域的视野开阔、思想敏锐和内容深刻的文献”。事实上,奥曼关于不完全信息博弈的许多重要观点现在已经被应用于经济理论中,诸如寡头垄断、委托代理理论、保险等领域。   除了在长期合作领域的建树外,奥曼在其他方面的研究成果和贡献同样也非常显著。比如他在共同知识(common knowledge)、完全竞争的经济模型、值集函数等领域的研究就是证明。博弈当事人对对方战略集、信息和偏好的了解对于他们在博弈过程中策略的选择无疑是非常重要的,由此自然而然的一个问题是,怎样的认识假设意味着理性行为人能达到均衡。长期以来,博弈论研究者对这一基本问题保持沉默,经济学家在进行均衡分析时对此也没作过多考虑。   奥曼通过研究,建立了所谓的“交互认识论”(interactive epistemology)。在1976年的论文“同意分歧”(Agreeing to disagree)中,他把共同知识的概念引入到博弈论中,这一概念最初由李维斯(Lewis)在1969年提出。对一个事件来说,如果所有博弈当事人对该事件都有了解,如果所有当事人都知道其他当事人也知道这一事件,如果所有当事人都知道所有当事人都知道这一事件,那么该事件就是共同知识。奥曼的这篇论文产生了巨大反响,它一方面导致了今天人们所熟知的“交互认识论”的发展,另一方面也在经济模型和计算科学等许多领域产生了广泛应用,比如用于分析多重处理器网络的分布环境等。   完全竞争的经济模型假设市场上存在着许多参与者(居民和厂商),并且每个参与者的影响都是微不足道的。对此,奥曼认为:只要仅存在有限多的参与者,个别参与者对经济的影响在数学上就不能被忽视。因此,适合于完全竞争的直观概念的数学模型必须包括无限多的参与者。奥曼把参与人闭连续集的概念引入到这一经济模型中,从而对微观经济学的发展起到了很重要的作用,使得经济学对现实问题的分析更加准确严谨。另外,奥曼在值集函数(即值为点集而非单独一点的函数)领域也作出了许多重要的贡献,如奥曼可衡量选择定理、值集函数积分结果等。这些结论往往都是基础性的,在经济学、数学和运筹学等许多学科领域内都有着广阔的应用前景,比如一般均衡分析、最优配置、非线性规划、控制论、测度理论和不动点定理等等。      谢林的获奖理论及其他贡献      谢林最初也曾致力于传统经济学的研究,但自从他在1958年编写的教科书《国际经济学》中采纳了外国援助谈判、成本分摊协定这样的理论之后,就开始偏离传统经济学的研究范式。一般来说,主流的博弈论大都是以数学语言和公理性的方法来进行研究,而谢林则通过一条截然不同的途径对博弈论的建立和发展作出了巨大贡献。在把注意力从零和博弈上转移开来之后,他开始强调这样一个事实,即几乎所有的多人决策问题都是冲突和共同利益的混合体,并且两种利害关系之间的相互作用可以通过非合作博弈理论来进行分析。谢林指出,“混合动机博弈的决定因素与其说是数学的,不如说是经验的。”也就是说,当博弈当事人在选择战略时,不仅要从数学上进行考虑,而且还会考虑到许多非数学因素,比如声誉创造、传统的沿袭、建立自信、显示大度等等。正是基于这种更接近于现实的分析,谢林开创了关于博弈论分析的一片新天地。   1960年,谢林发表了其经典著作《冲突的战略》,在这本书中,他开始把关于博弈论的洞察力作为一个统一的分析框架来研究社会科学问题,并对讨价还价和冲突管理理论作了非常细致的分析。讨价还价理论是谢林早期的主要贡献所在,他的一篇名为《讨价还价漫话》(An essay on bargaining)的论文首先发表在1956年的《美国经济评论》上,之后又收编入《冲突的战略》的第二章。他所说的讨价还价是广义的,即除了明确协商之外的所有活动。比如在两个国家或买卖双方之间的谈判活动,甚至当两辆装满炸药的卡车在一条并不宽敞的公路上相遇时也存在着“讨价还价”。从博弈论的角度来看,讨价还价是一个非零和博弈。   在效率曲线上,博弈当事人的利益是对立的,不存在帕雷托改进的可能。也就是说,任何一个人效用的增加都会损害另外一个人的利益。但谢林指出,这种所谓的对立只是一种逻辑上的可能性,在效率曲线上必然存在一点,使得博弈当事人的利益是一致的。博弈者都希望避免两败俱伤,这种“双赢”的共同想法就体现为,在效率曲线上找到一个合适的点来解决彼此之间的冲突。   讨价还价和冲突管理涉及到一系列默契协调(tacit coordination)的问题,这种协调可能是由于双方彼此的共同利益,也可能是来源于一部分不一致的利益。从这一基本的问题出发,谢林开始探索在充分交流的条件下,公开的讨价还价是怎样达成协议的。他认为这种协定与“双方期望的协调”相类似,即如果双方都推测这个结果能够为对方所接受,那么协议就可以达成了。而要达成这种协定,需要通过许多因素来共同作用,比如法律的、道德的、文化的因素,当然这其中也少不了传统经济学所强调的数学因素。   通过对讨价还价现象进行分析,谢林得出一个惊人的结论:“在讨价还价的过程中,势弱的一方通常会成为强者。”对此也可以这样理解,即将自己固定在特殊的谈判地位是有利的,当任何一方认为对方不会作出进一步的让步时,协议就达成了。一方之所以会让步,是因为他知道对方不会让步了。因此可以认为,谈判的实力就在于让对方相信你不会再让步了。为此,谢林还进一步描述了能够把自己锁定在有利地位的三个战略,即不可逆转的约束、威胁和承诺。   上述理论的一个经典应用是在国际关系领域。在《冲突的战略》中,谢林运用博弈论分析了国家之间的讨价还价行为。他指出:“偶然事件不会引发战争,只有决定才会导致战争的爆发。”如果一国认为另一国会突然发动袭击,那么一场双方都不情愿的战争就有可能爆发。突然袭击的优势和动机在于对方缺乏反击的能力,因此,防止突然袭击的首要目标是军事安全而不是人员安全。进一步说,防止突然袭击需要可信的二次还击能力。   正是由于这方面的贡献,谢林也被认为是对国防经济学的发展起了极大的促进作用。哈特利与桑德勒在《国防经济学手册》第4页中写道:“1960年,以三本当代经典著作的问世为标志,国防经济学正式创立。与此同时,人们对国防经济学研究产生了浓厚的兴趣。这三本著作是:查尔斯·希奇(Charles J.Hitch)和罗兰·麦基恩(Roland Mckean)的《核时代的国防经济学》;刘易斯·理查森(Lewis F.Richardson)的《军备与不安全》(Arms and Insecurity);托马斯·谢林的《冲突的战略》。”   在《冲突的战略》出版之后45年的时间里,谢林继续开展了一系列新颖而有效的研究。比如,他在相互依存和自我控制两方面的研究就值得一提。在其1978年发表的著作《微观动机与宏观行为》中,谢林阐述了相互依存的选择和行为理论,并提出了“关键多数理论”(critical mass)。   在社会决策过程中,来自于文化、习惯等方面的许多强制力(compelling force)能让决策汇集于一点形成共识。一旦社会上形成一个特定的惯例(如语言、习俗等),那么就很难改变,即使每个人都知道这种惯例不是最优的。利用“有界邻里关系模型”(bounded neighborhood model),谢林还分析了非组织的个人动机是如何转变为集体行为的,并以此说明了种族隔离是个人选择的自然结果。比如说,如果白人和黑人都希望避免成为“少数人”(minority),那么只有完全隔离才是惟一稳定的均衡点。   在关于自我控制(self-command)的研究上,谢林观察到,人们事实上作了许多本来并不愿意做的事情,比如酗酒、吸烟、缺乏锻炼、低储蓄等。   针对这些问题,谢林发表了一系列文章,包括1980年的“自制在个人内心的斗争”(The intimate contest for self-command),1983年的“道德规范、法律以及自制”(Ethics,law,and the exercise of self-command),1984年发表于《美国经济评论》的“实践、政策以及理性选择理论中的自制”(Self-command in practice,in policy,and in a theory of rational choice),还有1992年的论文“吸毒成瘾:关于抽烟的体验”(Addictive drugs:The cigarette experience)等。谢林认为,在许多情况下,人们好像并不是具有惟一身份、价值观、记忆和感觉的单个个体,而是往往会存在“双重自我”(double-self)。双重自我对某一特定的事物具有不同的偏好,因而无法决定哪一个自我去支配行动并使总体效用最大。这一理论的提出反映了谢林开始从多方博弈转向自我博弈,即以自己为对手的博弈。   (作者单位:中国社科院财贸经济研究所)        罗伯特·奥曼      奥曼1930年6月出生于德国的法兰克福,拥有以色列和美国双重国籍,是一名在以色列、美国乃至世界各地享有极高学术声誉的著名经济学家。   1950年毕业于纽约大学并获得数学学士学位,1952年和1955年在麻省理工学院分别获得数学硕士学位和数学博士学位。自1956年开始在以色列希伯莱大学数学系任教,1966年至1968年担任数学研究院院长,1966年,当选为经济计量协会会员,1968年晋升为教授。   目前他仍担任耶路撒冷希伯莱大学数学研究院教授、纽约州立大学斯坦尼分校经济系和决策科学院教授以及以色列数学俱乐部主席、美国经济联合会荣誉会员等职务。   他还是多家世界知名的专业杂志社的编辑,如《国际博弈论杂志》、《数理经济学杂志》、《经济学理论杂志》、《经济计量学》、《运筹学数学》等。   罗伯特·奥曼作为一名杰出的经济学家,在决策制定理论方面取得了杰出的成就,对博弈论和其他一些相关经济理论的形成和发展起到了重要乃至不可或缺的作用。   他曾于1983年获得以色列技术机构颁发的科学技术哈维奖,1994年获得了以色列颁发的经济学奖,并被波恩大学、鲁汶天主教大学和芝加哥大学授予荣誉博士学位。   其主要著作有用希伯莱语写的《博弈论》(合著)、《博弈论演说集》(合著)、《博弈论与经济学运用手册》(合编)、《重复博弈与不完全信息》(合著)等等。      托马斯·谢林      谢林1921年出生于美国加利福尼亚州的奥克兰市,是美国著名学者、经济学家,也是有限战争理论的奠基人之一,还是外交事务、国家安全、核战略以及军备控制方面的研究专家。   1944年获伯克利加利福尼亚大学文学学士学位,1948年获得哈佛大学文学硕士学位,1951年在哈佛大学获哲学博士学位。从1948年到1953年,他先后为马歇尔计划、白宫和总统行政办公室工作,1953到1958年任耶鲁大学经济学教授,1958年被聘为哈佛大学经济学教授,1969年到哈佛大学肯尼迪研究生院兼职,是该院知名的政治经济学教授。1978年,他从哈佛大学辗转来到马里兰学院研究公共事务。1992年当选为美国经济学联合会会长。   他是政治经济学领域著名的“弗兰克·赛德曼奖”的获得者;凭借对预防核战争的相关行为的研究,他成为“国家自然科学奖”的获得者;1988年美国经济学联合会将其评为“杰出资深会员”。他曾为美国军备控制与裁军署、国务院、国防部、参谋长联席会议、耶鲁大学和兰德公司等机构工作或担任顾问,并作为经济学家为美国政府工作过。他发表了涉及许多领域的研究成果,包括军事战略和军备控制、能源和环境政策、气候变化、恐怖主义、团体犯罪、外交援助和国际贸易、冲突和讨价还价理论、种族隔离和种族融合、军事计划、健康政策、烟草制品和毒品走私政策以及与公共事务和公共政策相关的伦理学问题等。   其主要著作有《国民收入行为》、《国防经济学》、《冲突的战略》、《战略与军备控制》(合著)和《军备及其影响》等等。
经管之家“学道会”小程序
  • 扫码加入“考研学习笔记群”
推荐阅读
经济学相关文章
标签云
经管之家精彩文章推荐