囚徒困境模型问世以来,引起了人们无尽的兴趣。罗伯特·阿克塞尔罗德在其著作《合作的进化》中,探索了经典囚徒困境情景的一个扩展,并把它称作“重复的囚徒困境”。与原型略有不同的是采用正分激励:
每一局有0,1,3,5四种得分,分别命名为——双方合作奖励:3,3;双方背叛惩罚:1,1;背叛的诱惑:5;笨蛋的收获:0。
阿克塞尔罗德邀请全世界的学术同行来设计计算机策略,每个策略与其它策略逐个对局,看看哪个策略总体表现最好。令人惊讶的是:胜利者是所有提交策略中最简单的——首先在第一步合作,然后就模仿对手上一步的策略,我们称它为“一报还一报”。第二轮竞赛有更多的参赛者,他们也知道第一轮优胜者的策略,结果获胜的依旧是“一报还一报”。
通过分析两轮竞赛中的高分策略,可以总结出成功者的几个特征:
1,友善
最重要的条件是策略必须“友善”,就是说,不要在对手背叛之前先背叛。绝大部分高分策略都是友善的。
2,报复
成功的策略必须不是一个盲目乐观者,要容易被激怒,立刻报复。有些采用“两报还一报”的策略虽然表现也不错,依然没能胜过“一报还一报”。愚善是一个非常糟糕的选择,因为“小人”策略将残酷地剥削这样的傻瓜。
3,宽容
在给对手的背叛行为予以报复之后,如果对手不继续背叛,就可以退回到合作。只要对手背叛一次,就报复到底的“记仇”策略是不会获得成功的。
4,不耍小聪明
复杂的策略并没有表现得比简单的策略更好。一些试图占便宜的“老谋深算”策略在碰到愚善策略时会得逞,但在与其它对手打交道时经常会遭致报复而得不到高分。
5,不嫉妒
因为不首先背叛,所以在任何一组对局当中都不可能获得比对手更高的分数。“一报还一报”策略不是靠打击对手来获胜,而是通过诱导双方的合作行为来获得双赢,战胜其他不合作的策略。
经济学的理性人假设并没有错,竞争的最终目的仍然是为了自己能够获胜。“一报还一报”表现出这样一种智慧:虽然没有赢得过任何一场战役,却赢得整个战争。
这碗鸡汤着实有点浓。这还不算完,阿克塞尔罗德将游戏设定成可以传宗接代——设定一个策略的拷贝(后代)数量与它的竞赛得分成正比——来模拟适者生存的自然演化过程。
模拟出来的结果非常有趣。“小人”初期还能跟得上大部队,随着“愚善者”的灭绝,“小人”在“一报还一报”的包围中也迅速消亡。
如果起始条件非常恶劣,在一个遍布“小人”的社群中,单独的“一报还一报”也无法生存,但是“一报还一报”对单个“小人”的劣势有限,最多只输1分。即使只有一个小的友善群体,哪怕只占总数的5%,“一报还一报”也可以通过找到合作慢慢壮大,而且这个过程不可逆。
正义终将战胜邪恶,这结论真是鼓舞人心。难怪理查德.道金斯在为该书撰写的序言中声称:《合作的进化》值得取代圣经。