原标题:朝鲜拥核战术何以成功奏效?——基于懦夫博弈的分析
自朝核问题爆发至今,朝鲜在拥核道路上越走越远,目前已经进行了三次核试验,在某种程度上已达到了拥核的目的。作为一个国际社会中的弱者,朝鲜能够取得对抗强者的胜利,这一现象已经引发了国内外研究者的多方面解读 。有学者强调客观环境,例如,朱芹借鉴猎鹿博弈,认为“朝核问题就如一只鹿,中美韩俄日朝是六个出口,只要六方合作,收益最大,朝核问题就易解决,但只要一方放弃转而去寻求其他利益,猎鹿则会失败”。 程晓勇则从利益格局的复杂性、强国实力手段受限等角度进行了综合解读 ,认为这些因素使朝鲜达到了“力量倍增”的效果。有的学者则从朝鲜的主观策略来分析 ,例如,约瑟夫·奈(Joseph Nye)认为,朝鲜绑架了相关国家的安全 与利益,从而获得了一种 “弱者”的优势 。在一些分析家看来,朝鲜核试验更像是一种“高风险的赌博”。朝鲜之所以能够取得 “成功”,在于其采取了一种边缘(brinkmanship) 外交手段 。概而言之,既有研究成果从两方面揭示了朝鲜拥核成功的原因:一是各方、特别是中美两国间的利益差异为朝鲜 提供了可乘之机 ,二是朝鲜自身 的博弈战术使其能够最大限度地利用这种利益差异。
但是,这些解释在一些关键问题上仍然缺乏可信的理论回答。第一,尽管中美各有利益考虑 ,但在反对朝鲜拥核方面是一致的。这种共同利益为何未能产生足以迫使朝鲜弃核的压力 ?第二也是更加重要的一点是,边缘外交之所以能够 获得成功,来 自于懦夫博 弈 (或曰斗鸡博弈、胆小鬼游戏,chickengame)的理论支持。在这种博弈游戏中 ,越是冒险 、看起来不顾一切的一方就越容 易迫使对方成为“懦夫”、做出让步 ,从而使自己成为赢家 。这种理论 假设建立在各方实力均等的前提之上,但直觉告诉我们:如果各方实力严重不对称 (朝鲜与中美的博弈正是这样一种情况),弱者的所谓“比胆大”博弈很可 能难以产生预期的效果。既如此,朝鲜的拥核战术究竟何以奏效?为了提出关于朝鲜拥核策略的较为完整的理论解释,本文以懦夫博弈为分析工具,并采取一种“多重解释” 的方法。首先进行原初解释,即以常规的懦夫博弈模式对朝鲜的拥核战术进行解释, 旨在揭示两者之间的高度相关性(顺带表明懦夫博弈假设何以被广泛接受)。其次依据事实对懦夫博弈进行修正,即在实力不对称的情况下分析懦夫博弈的逻辑结果,从而通过理论解释与现实结果之间的差异发现问题。最后则致力于对这一差异进行新的解释,探究朝鲜拥核战术奏效的真正原因,从而为认识、管理甚至解决朝核问题提供一种新思路。
一
原初解释:懦夫博弈视角下的朝核危机
懦夫博弈的典型情况是如下一种假设:有两名赛车手相对行驶,比赛规则是先转动方向盘进行避让的一方为懦夫,坚持不避让的另一方获胜。如果双方均不避让坚持前行,其结果将是两车相撞,双方都车毁人亡;但如果双方都能选择转动方向盘以避让,则为平手。据此,懦夫博弈的收益矩阵可设定如下:
一博弈中存在两个纳什均衡,即甲方前行(收益为3)、乙方避让(收益为1),或甲方避让(收益为1)、乙方前行(收益为3)。所谓纳什均衡,是指每个参与者所选策略一定是对其他参与者所选策略的最优反应,其策略组合因此是稳定的。在甲方前行、乙方避让的情况下,如果甲方改变策略选择避让,则其收益将由3减至2;如果乙方改变策略选择前行,其收益将由1减至0,因此只有原策略才是最优反应。同理,在乙方前行、甲方避让的策略组合中亦如此。关键的问题是,由于存在两个纳什均衡,现实中的结果是谁来前行?谁来避让?在这种情况下,最好的办法也许是剔除策略组合中的避让策略,而且最重要的是让对方也认识到这一点。也就是说,懦夫博弈中获胜的一方通常是胆大、宁愿选择前行而不避让的一方。因为当一方表现得不顾一切利益算计而前行的时候,另一方就会发现与其同样前行而车毁人亡(收益为0),还不如选择避让、失去面子(收益为1)。“狭路相逢勇者胜”,这就是懦夫博弈的本质。
人们之所以倾向于把朝核危机视为懦夫博弈,是因为两者看起来极其相似。对于朝鲜来说,强硬行为意味着不顾一切进行核试验,即使发生战争亦在所不惜;软弱行为则意味着放弃核试验或核武器。对相关国家(特别是美国)来说,强硬行为意味着不惜一切代价制止朝鲜拥核(甚至是通过战争手段,而软弱行为则意味着仅仅采取外交、经济等无法对朝鲜形成致命损害的行为。根据懦夫博弈,这里存在两个可能的纳什均衡:一是朝鲜强硬、相关国家软弱(收益分别为3,1),朝鲜进行了核试验;二是朝鲜软弱、相关国家强硬(收益分别为1,3),朝鲜放弃了核试验或核武器。从朝鲜已进行了三次核试验来看,现实中的纳什均衡是前者。根据懦夫博弈模式,由于朝鲜采取了宁愿前行而不避让的悬崖战术,其取得这场博弈的胜利是很正常的。
1.第一次核试验
朝鲜于2006年10月9日进行了第一次核试验。此前的10月3日,朝鲜即发表声明宣布将进行核试验,对国际社会做出了强硬的表态。联合国安理会于6日发表主席声明,要求朝鲜取消计划中的核试验,立即无条件重返六方会谈,并警告朝鲜如果无视国际社会劝阻坚持核试验,安理会将根据《联合国宪章》采取行动。应该说,这种表态也是很强硬的, 因为《联合国宪章》中含有军事行动的内容。但朝鲜继续做出不顾一切的姿态,如禁止本国外交官与美国政府进行接触,同时撤回朝鲜驻联合国副大使韩成烈,随后于10月9日进行了核试验。之后,相关各方的反应虽然强烈,但主要是言词上的。美国小布什总统在谴责朝鲜的同时,仍然表示要继续通过外交手段解决朝核问题,其主要反应是要求联合国安理会就这一事件“立即做出反应”。对此,联合国安理会于14日通过了第1718号决议。该决议尽管决定针对朝方核武器、导弹等大规模杀伤性武器相关领域采取制裁措施,但排除了授权使用武力的可能,也未对朝鲜实施全面制裁。也就是说,相关国家选择了“懦夫”角色,朝鲜成为此次博弈的胜利者。
2.第二次朝核试验
2009年5月25日,朝鲜进行了第二次核试验。在进行此次核试验之前,朝鲜向外界表示,鉴于美国总统奥巴马丝毫没有改变敌视朝鲜的政策,朝鲜将继续加强国防实力和核威慑力。而美国朝鲜政策特别代表博斯沃思(Stephen Bosworth)的回应并不明朗,仅指出如果朝鲜决定再次进行核试验,将面临“相应后果”。核试验之后,美国的反应不过是表明“决心以外交方式处理朝鲜核问题”。相反,朝鲜的进一步反应是更加强硬、带有威胁性质的三项措施:视韩国加入“防扩散安全倡议”为“宣战布告”;不再受停战协定的约束,朝鲜军队将采取相应的军事行动;朝鲜军方不能保证处于海上军事分界线西北部海域朝鲜领海一侧的韩国5个岛屿的法律地位,同时不能保证美韩舰艇和普通船舶在这些岛屿周边海域的航行安全。最后,相关各方推出的对应朝鲜第二次核试验的实质措施是联合国安理会的第1874号决议,其中虽对朝鲜核试验表示最严厉的谴责,但其措施不过是旨在阻止朝鲜进一步的核计划(如冻结5家朝鲜实体的资产、并禁止世界各国为朝鲜提供可能会被用于制造弹道导弹的两种关键原材料等),而不是将其“推回去”。朝鲜的第二次核冒险又取得了成功。
3.第三次核试验
朝鲜的第三次核试验发生于2013年2月12日。在此之前,由于朝鲜发射卫星,联合国于1月23日通过决议,要求朝鲜不得再使用弹道导弹技术进行发射,放弃所有核武器和核计划,并表示朝鲜一旦再次进行发射或核试验,安理会将会“采取重要行动”。而朝鲜的反应则是公开宣称将进行更高水平的核试验,甚至要“瞄准宿敌美国”。对此,相关各国除了督促朝鲜不要挑衅之外,亦无他法。结果是朝鲜2月12日宣布成功进行了第三次地下核试验。之后相关各国紧急应对,但手段远称不上强硬。美国总统奥巴马只是要求国际社会采取迅速且有效的措施进行回应、重申对亚洲盟国的安全承诺以及强化反导系统。博斯沃思更是明确表示, “美国愿意通过对话和协商解决问题⋯ ⋯美国并不想攻击朝鲜,或动用武力颠覆朝鲜政权”。可见,面对朝鲜的强硬,相关国家缺乏足够强硬的反制措施,朝鲜再一次成为了胜利者。
总的来看,三次朝鲜核试验均体现出如下特征:朝鲜威胁要进行核试验(强硬),相关国家发出警告(多数时候属软弱范围、少数情况可算强硬)。但在朝鲜真正进行了核试验(继续强硬)之后,相关国家的反应就限于外交层次(软弱),而朝鲜的再反应仍属强硬,特别是在言词上表现出不惧一战的决心。当然,战争并没有发生,朝鲜或许只是恫吓,但问题的关键在于相关各国确实首先表现出软弱。正如谢林(Thomas Schelling))所指出的那样,“真正的威胁不应该是‘我可以实施威胁,也可以不实施,最终的选择权在我手中’,而应该是‘我可能实施威胁,也可能不实施,但是最后的情况我也无法确定,”。在不惧一切的朝鲜面前,其他的相关国家只能扮演“懦夫”。在外界看来,这正是懦夫博弈中的典型场面。因此,懦夫博弈成为许多有关朝核问题分析中不言自明的假设,也就顺理成章了。
二
发现问题:不对称博弈的理论后果
然而,上述解释忽视了一个较少被人注意的问题,那就是朝鲜与相关国家之间存在着巨大的实力差异,而典型的懦夫博弈场景假设各方都是力量对称的行为体。对称博弈需满足三个条件:
(1)所有参与者都有相同的策略集合;
(2)参与者使用相同策略时的收益相同;
(3)交换两个参与者的策略,则他们的收益也被交换。
在这种情况下,博弈的收益只依赖于行为体所选择的策略而不依赖于进行博弈的行为体,这类博弈称为对称博弈。然而,一个明显的事实是,即使各方的策略选择一样,实力的不对称也会导致收益的不对称。如儿童与成人相撞对彼此的伤害是不一样的,大卡车与小汽车相撞也会导致各自不同的结果。而且,必须承认的是,“现实中大量的竞争博弈是非对称的。这些竞争可能出现在雄性个体和雌性个体之间, 出现在年长个体和年幼个体之间,或出现在大型个体和小型个体之间,甚或是出现在资源的拥有者和非拥有者之间。如果非对称性事先就能被竞争者感知察觉,那么这就能够经常影响个体对其行为的选择。如果非对称性能够改变支付矩阵,或能够影响实施战斗策略的博弈将出现的结果,那么非对称性对个体行为的影响是显而易见的”。
懦夫博弈当然也不例外。前述典型的懦夫博弈模型中设定的收益值都是基于行为体的实力对称,而如果行为体的实力是不对称的,则相应的收益必然会发生改变,从而改变最终的博弈结果。就像两辆赛车一样,其马力、性能和速度都被假设为相同,所以它们的利益计算也是一样的:如果迎头相撞,结果是双方都车毁人亡。正是这一基于实力对称的假设左右了双方的选择(收益矩阵),使得不敢斗狠的一方成为博弈的失败者。但如果一辆是马力超强且不怕碰撞的高性能车(乙),而另一辆则是性能落后且脆弱的旧车(甲),一旦两车相撞,后者所面临的后果可能是车毁人亡(收益为0),而前者可能只是部分或轻微受损(收益大于0)。由此我们可以假定,对乙来说,与选择避让保住车子无损但失去面子相比,选择车子轻微受损但保住面子的收益是相当的,其值为1。这就极大地改变了收益矩阵,使得乙方前行(收益为3)、甲方避让(收益为1)很可能成为唯一的纳什均衡。因为在甲方前行(收益为3)、乙方避让(收益为1)这一策略组合中,乙方将发现,他如果改变策略选择前行,收益并不会下降(同样为1)。
事实上,基于相对收益的考虑(国际社会中的国家通常会这么做),在其收益不变的情况下,乙方会更愿意考虑让甲方收益减少的策略,即甲方与乙方均选择前行(收益为0,1)。在这种情况下,甲方为了避免车毁人亡,就只能选择避让,其冒险精神也就失去了意义,因为所谓悬崖战术的结果只会导致自己掉下悬崖。所以,甲方前行(收益为3)、乙方避让(收益为1)的策略组合是不稳定的,不再是纳什均衡。唯一的纳什均衡就是乙方前行(收益为3)、甲方避让(收益为1),亦即旧车一方不敢与对方的车相撞,而是选择避让、让对方前行。可见,在实力不对称的懦夫博弈中,冒险精神与恫吓策略失去了作用,起决定作用的是行为体的相对实力大小。
在朝核问题中,朝鲜与相关各国的实力是不对称的,而且朝鲜处于实力较弱的一方,“反对朝鲜发展核武器的国家的实力远远超过朝鲜”。 基于人口总数、经济总量、军事实力和科技发展水平等因素,美国丹佛大学的未来国际(International Futures,Ifs)数据库计算了世界各国的国力指数,即该国在世界各国总实力之和中所占的比例。根据该数据库,在2006、2009、2013年等各次朝核试验年份,美国、中国的国力指数要超过朝鲜几十倍甚至上百倍(参见表1),三国实力对比处于极端不对称的状态。
这种实力的不对称导致了两个方面的改变。一是朝鲜的威胁显得缺乏可信度,其悬崖战术无法对博弈结果产生真正的影响。这是因为,“威胁必须具有必要性和可行性,而且保证被威胁者的行为对威胁客体本身的损害远远大于实施威胁的一方”。威胁必须与能力联系起来。“一个条件过高的威胁将无法实现预期目标。——例如,一个拥有中等规模核力量的欧洲国家让前苏联人滚出匈牙利,否则其将对后者进行大规模进攻。毫无疑问,前苏联人对这个威胁将置之不理,因为前者无法做出实际行动让前苏联人相信它具有这种能力;相反,假设这个欧洲国家威胁向前苏联一天发射一颗携带核弹头的导弹,或者发射某天在前苏联境内自动爆炸的装置,(这个威胁就将有效)。”类似地,朝鲜有关“宣战” 威胁同样是不足信的。尽管“延坪岛炮击事件”使人们意识到朝鲜确实有发动实际挑衅的可能,但冷静的分析家都明白,其真正发动一场大规模战争的可能性很低,因为那对中国和美国来说只是一场“麻烦”,但对朝鲜来说则意味着毁灭。
由此,实力不对称导致的第二个结果就是改变了相关各方的收益值,从而直接改变博弈结果。由于朝鲜的核武器未形成战斗力以及与美中两国存在巨大的实力差异,如果朝鲜与这两个国家均选择强硬,其收益值不会是(0,0),而会是(0,1)。以美国的军事实力,朝鲜政权可能面临生死存亡的危险(其收益为0)。而朝鲜至多将报复范围扩展至驻韩美军,而无法攻击美国本土(其收益为1)。事实上,美国驻韩美军正在向南部署,其意图就是避开来自朝鲜的可能的直接打击。在这种情况下,美朝相互伤害的后果是极不对称的。根据前述不对称博弈的逻辑,此时应是朝鲜主动选择退让而非美国。朝中博弈的逻辑与此类似,两者之间的总体实力与军事能力都是极其不对称的。在不对称条件下,采取强硬态度的应该是美国或(和)中国而不是朝鲜,按道理朝鲜不会选择坚持发展核武器。这种理论分析很好地解释了第一次朝核危机。当时美国决意使用武力也要达到使朝鲜弃核的目的,结果朝鲜退让,最终达成框架协议。但是,为什么在第二次朝核危机中,实际结果是朝鲜强硬而中国和美国让步呢?这就是下文需要回答的问题。