书摘1
第2章 独裁者、最后通牒与信任博弈
1982年,古斯(Güth)、斯科密特伯格(Schmittberger)和施瓦茨(Schwarze)公开了一些足以让经济学家惊讶的以经验为依据的研究发现。他们研究了一种被称为“最后通牒”的博弈。在该博弈中,参与者的一方(称为“提议者”)提出一种分配方案,在两者之间以某种方式划分一定数量的奖金(将提议者的行为定义为出价——译者),而对方有权接受或不接受该方案。如果对方(称为“回应者”)接受该方案,则二者各获得由方案所决定的金额。如果回应者拒绝该方案,则他们都将一无所获。该博弈已很难更加简化了。如果回应者最大化其收益,则他会接受任何分配方案。如果提议者也最大化其收益,并且预期到对方也是最大化者,他将决定分给对方一个最小金额。
在实验中,平均来看提议者会决定将总奖金的40%分给对方(许多提议者决定分出50%),而有50%的回应者拒绝仅获得总额的20%左右。该实验结果与参与者最大化其收益的假定不符。任何你可以想到的解释方法(诸如较低的总额)都被进行了小心的检验,却发现都不能够完全解释这个结果。
由于最后通牒博弈的均衡值很容易得到(回应者的行动只是对分配方案的抉择),因此该博弈相较于另一种对策略思考所进行的深度检验(参见Marwell and Schmitt,1968)而言,无疑是一种更为明了的衡量社会性偏好的方式。以货币方式衡量社会性效用非常重要,因为许多现象(如公平、信任)主要在私人谈判和公共政策中出现。但是许多刻薄者(尤其是经济学家)认为公平只不过是那些得到棍子较短一端的人为了获取更多利益而使用的一个华丽的词汇,而人们通常不会牺牲许多利益来惩治不公或奖励公平。正如乔治·斯蒂格勒(George Stigler,1981,176页)所写的:“(当)广义上的自私与道德价值发生冲突时,在许多时候,实际是大多数时候,关于自私的理论……最终将胜出。”
最后通牒博弈是检验斯蒂格勒所言是否正确的一种方法。一个回应者如果拒绝了从10美元中分得2美元的方案,即她用2美元的价格来表明她不愿受到的不公对待的程度(“消极合作”)。
在最后通牒博弈中所凸显出的这种对不公平的情感反应可以在许多事例上得到印证。一位评论家从政治史中找出了一个引人注目的例子。在1787年于费城召开的联邦会议上,来自最初的13个州的代表们讨论了在西部土地并入版图后该如何对待这些新加入州的问题。莫里斯(Morris)州长认为,这些后加入的州应被视为次等州,这样它们的得票数将不会超过最初加入联邦的13个州。乔治·麦逊(George Mason)认为设立次等州的做法类似于给某人以不公平的待遇,因此西部各州可能会断然拒绝。他说道:“这些(新的西部的)州具有与我们相同的自尊和情感,如果它们不是在各个方面与其他的州处于一个平等的基点上,那么它们或者拒绝加入联邦,或者在加入后又会很快脱离出去。”(Farrand,1966,578~579页)。麦逊的主张(认为西部各州可能会拒绝不公平的待遇,以及对公平待遇的道德上的呼吁)最终赢得了所有代表的支持。(如果麦逊没有这样做,那么我现在可能正在大加利弗尼亚国写下这些文字,而该国正受到总统阿诺·施瓦辛格和副总统奥尼尔的领导,而不是被东部那个穷国美利坚的少数人口投票选择的总统乔治·布什所统治。)
本章还讨论了其他一些衡量社会性偏好的博弈(可参见Bolton,1998;Sobel,2001)。独裁者博弈是指在最后通牒博弈中,回应者不具有实施拒绝的权力。独裁者博弈可以用来分析提议者在最后通牒博弈中如果提出一个慷慨的方案,其原因是担心被拒绝还是其本身就是利他主义的(答案是,担心被拒绝是主要原因而利他主义只是很次要的因素)。信任博弈是指在独裁者博弈中存在一个由某投资人进行的初始投资额,该投资决定了独裁者(即代理人)可以进行分配的量额。投资人“相信”代理人会回报足够的量额以使投资人认为对她的信任是值得的。信任博弈是简单的具有道德风险的交易模型,在其中不存在强制交易。投资的额度衡量了信任的程度;回报的量额衡量了值得信任的程度。蜈蚣博弈(见第5章)是一种多阶段的信任博弈。具有多个参与者的信任博弈是劳动市场上的“礼物交换”行为:厂商为工人提供工资,工人接受工资并决定自己努力工作的程度。努力工作对于工人来说是有成本的,但对于厂商却是有价值的。由于厂商无法控制工人努力工作,因此厂商必须信任工人会这样去做。对最后通牒、独裁者和信任博弈的实验研究近年来方兴未艾。这些博弈为人熟知,因为它们具有实际经济中的关键特征,并且对这些博弈进行实验研究简单易行。
另外两种重要的博弈是囚徒困境博弈和公共物品博弈。虽然对这些博弈已存在相当多谨慎的实验研究,我却不想在此过多论及,因为其结果已为人熟知,并且在其他许多文献中已有较好的相关论述(Davis and Holt,1993;Colman,1995,第7章;Ledyard,1995;Sally,1995)。
表2—1给出了一个典型的囚徒困境博弈的收益情况。相互合作可使每个参与者获得H的收益,该收益要优于相互背叛给各参与者带来的收益L。然而,如果其中一个参与者采取合作,而另一个参与者采取背叛,则背叛者可获得T的收益,这将优于选择合作带来的收益H(T>H);而合作者仅能获得S,这将劣于选择背叛带来的收益L。由于T>H且L>S,所有参与者都将选择背叛而无论对方合作与否。相互背叛是该博弈中惟一的纳什均衡,但却帕累托劣于(对两者都较差)相互合作的情形。
表2—1囚徒困境博弈
在公共物品博弈中,N个参与者之中的每个人都从他的禀赋ei中贡献一部分ci 来对公共物品进行投资,该公共物品被所有人共同享有并具有一个不变的单位价值m。[1]假定m<1/N,则最大化收益的行为将促使每个参与者贡献零单位(ci=0)。然而,如果每个人都贡献,则参与者总体将获得最大收益。
囚徒困境和公共物品博弈模型化了这样一些经济现象,例如环境污染问题,其中一个参与者的行为对其他合法的团体构成了有害的“外部性”(选择合作意味着自愿控制污染);又例如村民对一种可耗尽资源(如河水)的共享;又如一种公共物品的生产(比如学校或灌溉系统),“搭便车者”不能被轻易地排除在使用权之外(参见Ostrom,2000)。在这些博弈中,选择自愿合作与贡献的情况是较少的,但可以用某种制度上的安排(如政府税收可以促使搭便车者做出支付)或某种非正式的机制(如在某人朝自己的车窗外扔垃圾时遭到警告)来进行补救。而当这些博弈中的参与者重复相遇时,相互合作可以成为这些参与者的一个均衡,除非其中一方选择背叛。
实验表明,在一次囚徒困境博弈中有一半的实验对象会选择合作,而在公共物品博弈中实验对象通常会贡献出自己一半的禀赋来进行投资(其实分布区间是很大的,即很多实验对象会贡献全部禀赋或分文不出——参见Sally,1995; Ledyard,1995)。如果改动货币支付情况,会得到一些可预见的效果:降低T和提高S会增加在囚徒困境博弈中选择合作的次数;而提高边际收益m会提高对公共物品的投资。如果实验对象在博弈开始前有过交流,这对理论本身是没有影响的,但却在大部分情形下会提高选择合作的比率。
当博弈被重复进行,并且每次遇到的对手是随机的“陌生者”,那么选择合作或贡献的人就会减少,并主要集中在一小部分坚持者身上。图2—1给出了在每次都是陌生者的前提下平均贡献水平随时间的变化趋势(来自Fehr and Gchter(2000c))。该图还展现了惩罚能带来的强大效应。如果出于自私的原则,搭便车现象变得十分普遍,那么参与者将不会为了惩罚搭便车者而支付一定的成本(他们希望搭便车者受到别人的惩罚,这是一个“二级”搭便车问题)。但是这个判断是错误的:山岸(Yamagishi,1986)、费厄和盖奇特(Fehr and Gchter,2000c) 证明付出成本来进行惩罚是卓有成效的,如图2—1所示,惩罚可以使贡献水平保持在个人禀赋的一半以上。(尤其是在重复遇到陌生人的实验方案中,贡献趋近于100%,于是惩罚自动消失,因为在那么高的贡献水平上没有人会实施惩罚。)
图2—1在设置惩罚机制之前和之后的公共物品贡献
选择贡献的参与者会比搭便车者更希望别人也有所贡献。这种信任与选择间的相关性表明合作是有条件的,是需要有互惠前提的。当总是把两个实验对象固定在一起参加博弈时(比如Andreoni,1993),发现贡献水平同样很高,这与“无名氏定理”所认为的重复博弈中的有效收益是一致的。
囚徒困境与公共物品博弈对经济生活是很重要的,但它们却不是理解社会性效用理论的利器。这些博弈无法把真正利他主义的参与者和只是预期应该合作的参与者区分开来。同样地,它们也不能把真正自私的参与者和具有互惠偏好(但悲观地认为别人会搭便车)的参与者区分开来。本章将要论述的一些其他博弈在这方面要比囚徒困境和公共物品博弈做得更好。
在继续论述之前,有必要再强调一次(如Weibull,2000),即这些来自公共物品投资、独裁者分配、最后通牒拒绝、信任回报等博弈的经验证据并没有证伪博弈论本身。博弈揭示了关于分配的效用,一个参与者对别人获取收益(无论正或负)的关心必然会影响该参与者的效用。在实验时,博弈中的收益以货币度量。由于我们无法轻易计算或控制参与者在考虑他人收益时对自身产生的效用,因此我们在对一些博弈理论中的相关行为假定进行检验时,通常假设以货币收益作为衡量效用的方式。
在最后通牒博弈中,如果提议者正确地判断回应者对不平等的分配强烈不满并会拒绝一个所获甚低的分配方案,那么提议者从10美元中拿出4美元分给回应者将可能是一种均衡。但是如果提议者对回应者可能行为的判断是错的,那么分出四美元的方案将不是一种均衡。
这样,如何解释这些来自简单讨价还价博弈和公共物品博弈的经验证据,在于寻找一种合理便捷的方式,把各个观测到的收益值(比如每个实验者得到的美元支付)与个别参与者的“社会性偏好”对应起来,然后在参与者具有某种社会性偏好的前提下,对博弈理论中相关的一些行为假定进行检验。贯穿本章,你将看到关于博弈理论行为与仅仅评价自己收益的社会性偏好假定(这经常被随意地但不严密地称为博弈理论的判断)很容易地遇到了反例。于是一个有趣的问题将是:“这些反例是由完全自私的假定造成的,还是由博弈理论的推理过程造成的(或两者兼有)?”
答案看来是两者“兼有”,因此相关理论的两部分都需要修正。决定是否接受一个最后通牒方案并不需要策略上的思考(只不过是个简单的选择问题),因此这些反例很明显地形成对自私假定的责难。同时,有关人们在博弈中如何思考(见第4章)以及常和占优可解博弈中的有限策略思考(见第5章)的直接证据也表明,博弈理论中的推理过程在即便自私是合理假定的前提下仍旧是有限的。那么这说明博弈论死亡了吗?当然不是,它只不过正在接受重新修正,或是以一种更恰当的方式而一般化。关于社会性偏好(见本章2.8节)和有限策略思考(比如第5章以及Camrer,Ho and Chong,2001)的问题已有相关的较为简洁的模型分析,这仍将是一个研究热点。
2.1最后通牒与独裁者模型:基本的结果
在一个典型的最后通牒实验中,实验对象被规定与陌生的对手进行博弈,其中提议者提出一个具体的出价,而回应者决定是否接受该出价(这被称为特定出价法)。该博弈实验通常有两种变形,其一是重复进行此博弈(并且规定实验对象每次遇到的对手都不同),其二是让回应者设定一个最小可接受出价而不仅仅是决定是否接受一个特定的出价。采用最小可接受支付法非常便于观察对各种可能出价的反应。如果最有趣的出价(例如给对方一个非常低的支付)很少被观察到,说明最小可接受出价起到很重要的作用。由于某种原因,经济学家通常不愿使用最小可接受出价法来进行研究(哪怕使用特定出价法几乎无法从回应者的拒绝行为中得到任何结论)。[2]
表2—2和2—3罗列了从许多最后通牒博弈的研究中得来的统计结果。这些研究是针对一次博弈并使用特定出价法做出的(否则将会注明)。表中每一行表示一项实验,包括用来分配的金额及实验对象的对数。表2—2给出了不同出价区间下(以百分比表示)愿出此价的人数比率(百分比),表2—3给出了不同出价条件下(百分比)实施拒绝的人数比率(百分比)。出价百分比的中位数用斜体字表示。出价的平均值和总体的拒绝比率在各图的最右列给出。(如无特别说明,图中百分比表示总金额的相应比例。)一项实验中不同条件造成的显著差异以“显著符号”表示,即同样的字母表示实验条件无显著差异;不同的字母表示实验条件在p≤005的水平上具有显著差异。
表中所示的结果非常具有规律性。众数和最后通牒出价的中位数通常出现在40%~50%的水平,而平均数出现在30%~40%的水平。出价百分比在0,0~10和51~100的区间上都很少出现。40%~50%的出价水平很少会被拒绝,而低于20%左右的出价水平有一半被拒绝。
我们应该把导致回应者做出拒绝行为的情绪因素(称之为“气愤”),与A看到B对C做出某种不当行为而产生的情绪(称之为“义愤”)分别开来。气愤更个性`化一些,并经常会促使被指责的集团对气愤者重新公平对待。而出于义愤的A会更冷酷些,他更乐于看到以别的某种方式对B进行惩罚。(这些敏感的情绪对于解释诸如战争审判、纽伦堡案或南非信任与调解委员会的行为是有重要作用的。义愤者本身并没有受到直接伤害,但却因他人所受到的伤害而感到惊恐。与个人自身的气愤相比,义愤是一种相对较弱的力量。)义愤意味着更冷酷。恩斯特·费厄(Ernst Fehr)和他的同事们在近来的研究中采用了一种“第三集团惩罚”博弈,其中A会牺牲一定的支付来惩罚B对C的不公平行为。
如果提议者提出一个慷慨的出价,这可能是因为提议者内心深处是公平的,或者是因为提议者担心低额出价会遭到对方的拒绝(或两种原因均有)。这两种因素在独裁者博弈中可以很轻易地被区分开来,在该博弈中回应者被剥夺了可以拒绝的权力。如果提议者在一个独裁者博弈中愿意给对方一个正的出价,即提议者没有最大化自己的收益,则说明他在最后通牒博弈中表现出来的慷慨与其内心的利他主义因素有一定关系,而不是出于策略上的考虑。
在最初的独裁者博弈中,卡尼曼、奈兹克和泰勒(Kahneman,Knetsch and Thaler,1986)给实验对象两种选择,其一是与另外一名学生平分20美元,其二是不进行平分以使自己获得更多的好处(18美元,2美元)。其实验结果如表2—4所示,这是从多次独裁者博弈实验中得到的。四分之三的实验对象选择了平分(10美元,10美元)。
这些引人注目的结果所产生的影响使得这篇文献从错误的解释立场上解放出来。许多人认为关于最后通牒结果的主要问题在于搞清提议者提出的方案是基于内心的公正还是仅为策略上的考虑(只是为了防止被对方拒绝)。但其中的关键是“回应者的拒绝”,这使得提议者做出慷慨的决定。弗希斯等人(Forsythe et al,1994)第一次彻底地对独裁者博弈和最后通牒博弈进行了比较实验,其中独裁者可以自由选择出价(而不是在两种分配方案中进行选择)。该实验中的独裁者表现得不像卡尼曼等人所报告的那么慷慨,但是平均出价是总额的20%左右,这表明存在着一些纯粹的利他行为。独裁者的出价远小于提议者在最后通牒博弈中的出价,但却是一个正数,这说明提议者的行为既是由于策略上的考虑(多付出一些以防止被拒绝),也是出于利他主义动机。[3]早期的实验结果显示,在给出实际的拒绝模式下,出价的平均值与最大化预期收益时的出价相趋近(比如Roth et al,1991),这暗示提议者仅是出于策略考虑的。之后更多的分析表明实际的出价比在考虑最大化自身收益时的出价更慷慨一些,甚至在风险规避时也是如此(Henrich et al,2001;cfLin and Sunder,2002)。在一个允许无均衡信念(包括学习过程)的模型中,科斯塔古姆斯和乔纳(CostaGomes and Zauner,2001)发现提议者的信念通常有点过于悲观。
许多关于最后通牒博弈和独裁者博弈的研究对实验条件和实验对象的身份进行了变更,以使研究内容更为丰富。这种因素分为五类。方法论上的因素是指对实验方式进行改变——如奖金,匿名实验,重复进行等。人口统计方法(demographic)因素是指对不同人群的行为方式进行观测。(极少数这种效应被证明是显著或可再现的,即使存在着由人种、年龄和相貌所带来的效应。)当考虑不同的文化因素时,其重要程度是明显的:在具有更多“市场一体化”的简单社会中,最后通牒的分出额更接近平均分配。描述性因素是指改变对博弈的描述而不是其结构。结构因素是指通过增加可能的行动来改变博弈本身。方法论上的、人口统计方法上的以及描述性的因素变更已被证明在研究中只有有限的作用。文化上的和结构上的变更具有更大的效应,并且对于建立社会性偏好理论具有很大作用。
2.2实验方法论因素
人们饶有兴致地对最后通牒博弈的实验方法进行了各种变更并进行研究,该博弈于1982年被首度报告,并且在随后的几年中受到了广泛关注。
2.2.1重复进行
许多实验运用静态重复的方法来观察重复进行简单的讨价还价博弈是否会有什么特殊的结果。罗思等(Roth et al,1991),鲍尔顿和兹维克(Bolton and Zwick,1995),奈斯和凯莫勒(Knez and Camerer,1995),斯洛尼姆和罗思(Slonim and Roth,1998),以及里斯特和凯瑞(List and Cherry,2000)对最后通牒博弈进行了重复实验,并且让实验对象在每次都面对不同的陌生者。鲍尔顿和兹维克没有观察到任何有意义的结果;而其他的研究显示了出价与拒绝行为从长期来看呈轻微的(通常是不显著的)下降趋势。
随着时间的延长,当实验对象逐渐了解到所有其他实验对象将怎样去做,或者当与特殊的实验对象(比如纯粹自私)进行博弈时,他会对出价进行更苛刻的调整。哈里森和麦卡布(Harrison and Mccabe,1996b)对这种效应进行了观测。当实验对象被告知有关其他实验对象的出价及最小可接受出价时,实验发现在进行到第15次时实验对象的出价和最小可接受出价都降到了15%左右。[4]如果回应者发现其他许多人未对不公正的待遇做出惩罚,则他也不会这样去做,或者说他对于什么是公平的认知受到别人行为的影响。在另外一种条件下,当16个富有同情心的实验对象的数据被公布给具有16个附加随机选择并且最小可接受支付为1%~14%的实验对象时,有同情心的出价与最小可接受出价将随着时间的推移稳定地下降。
总的来看,这些研究只显示了很小的一部分经验效应(出价与拒绝行为的减少),除非这些人中被安插了自私且精明的实验对象。值得注意的是,拒绝的降低可能来自学习,或者来自临时满足报复感的偏好。如果拒绝行为是针对不公平待遇的一种情绪上的不满表现,那么这些表现出的报复欲望,正如人类其他的一些本能欲望一样(比如食欲、运动欲、性欲等),可以在较短时间内得到满足。例如亚里士多德就曾指出:“当人们将气愤发泄到他人身上后,其内心将得到平静。”又比如1945年后,在那些曾被德国占领的国家里,对效力于德国的投降者进行了审判,其中那些较迟接受审判的人通常都受到了较为温和的判决(其实罪责却是严重的)。不发达国家内的工人在受到穷人排山倒海般的乞讨时,本有的一点施舍冲动也就不复存在了,这被称为“施舍疲劳症”。
一个非常简单的方法可以把“疲于表达愤怒”和“记忆中已习惯于不拒绝”分别开来,即在一天或一周后“重启”这个实验。如果实验对象在实验中不再做出拒绝行为是由于他们已疲于表达愤怒,那么当一段时间后再次进行该实验时,拒绝行为的频率将再次上升。如果他们是由于记忆中已习惯于不再做出拒绝,那么在一段时间后的重新实验将不会得到什么效果。