理论与实践中的理性威慑 | ||||||
凯斯·克劳斯 [澳大利亚] | ||||||
[出自《当代安全与战略》] 1999 | ||||||
| ||||||
威慑理论被一些学者誉为20世纪国际关系领域最重大、最深奥的学术创造。如克里斯托弗·艾肯和邓肯·施奈德认为, “理性威慑是一门影响深远的社会科学理论……它主导了二战后的战略思维……并为西方军事政策提供了理论框架。” [ 注:C· 艾肯和D·斯尼达尔,《理性威慑理论及对比研究》,《世界政治》 总第41号第143页。 ] 还有一些人认为超级大国间的“长期和平”就是核威慑的结果。并非人人都认同这些观点,也很难对它们的正确性进行评估。依这些人看来,威慑理论对大国之间的冲突关系进行了连贯而合理的描述,在某种程度上已成为制定国家安全政策的基础。 | ||||||
在本章中,作者通过追溯威慑概念的出现及其学术发展的不同阶段,介绍所谓“理性威慑争论”的基本情况,并分析理性威慑理论的几个关键组成部分,为评估威慑理论提供一些必要的工具。本章的重点是威慑理论的发展过程,同时分析该理论在核战略发展及超级大国(尤其是美国)政策制定中所发挥的(或并未发挥)的作用。理论与实践的关系有时紧密有时松散,但很少有人怀疑“理性威慑”对核时代政治发挥了积极的或是消极的深刻影响。换言之,正是由于威慑理论与重大公共政策的明显联系,它才深深地困扰着学术界。但对于那些希望冷战的结束会开启一个无核新时代的人来说,理性威慑理论却是一个绊脚石。 | ||||||
“威慑”究竟是什么?其最普通的定义是“通过威胁使对手屈从于自己的意愿”。 [ 注:G·唐斯,《理性威慑的争论》,《 世界政治》总第41期第226页。 ] 就这一点而言,威慑在战争的 谋划中已有悠久的历史,核威慑不过是一个以威胁毁灭一切来惩罚的特例而已。事实上,可以通过鉴别以下几个定义使核威慑的概念更为精确。首先,威慑与防御有别,因为它强调明确区分“毁伤能力与打败敌军的能力——即惩罚与获胜(或如某些学者所称的,‘惩罚’与‘抵御’(denial)区别。” [ 注:A·乔治 、R·斯莫科,《美国外交政策中的威慑》(纽约1974年版)。 ] 因此,威慑(或至少是核威慑)出现了第一个悖论:如格伦·辛德所指出的,在核时代,我们总是处在这种状态:“我们赖以实施威慑的武器,恰恰是那些一旦威慑失败,便无法理性使用的武器。” [ 注:斯尼达尔,《威慑与防御》第9页。 ] | ||||||
其次,威慑与威逼(compellence)不同,后者的定义是 “甲国决策者通过威胁或实施制裁,迫使乙国政策满足其要求的一种努力,它包括(但不限于)撤消已采取的措施”。 [ 注:P· 休斯和B·拉赛特,《检验威慑理论:严必生效》,《世界政治》总 第42期。 ] 换一句话说,威慑是旨在防止出现某种结果(如战争或侵略)的一种防御性战略,而不是一种威逼他人服从于自己意愿的战略。这两个概念的区别有些模糊,但在评估威慑行动成败的经验主义研究中,分清二者在实践上的区别是非常重要的。因为威逼比威慑更难达到目的,而许多威慑行动最终却变成了威逼。 | ||||||
第三,威慑既可被视为国家关系的一般状态(在这种状态下,对峙的国家即便都不想发动进攻也还是以武装力量来规范其相互关系),也可用以描述当至少有一个国家显示出侵略企图,此后的报复性威胁又震慑往了潜在侵略者而呈现的紧急状态。 | ||||||
辨别以上定义对于我们寻找研究威慑的方法、从理论上描述国家的威慑行为,或判断学者是否将威慑视为一种理性的国家政策都有重要意义。但要认识到进行这种辨别的原因和重要意义,就必须简单追溯威慑理论及实践产生、发展的基本脉络。 | ||||||
威慑理论的产生 | ||||||
1945年广岛上空核爆炸后,当时的观察家并未看出核“革命”的来临。尽管大都意识到这种新式武器有着巨大的毁伤力,但原子弹并未使以往的战略理论过时,也未使核威慑立即显现。事实上,关于原子弹的第一批论述都力图将之归类于既有的战略空袭或空军理论之中。对德累斯顿和东京的常规轰炸与对广岛和长崎的核轰炸似乎没有质的不同,而且有必要将广岛爆炸的心理冲击放到二战人类大毁灭的背景下分析。因此,大多数决策者认为核武器能够并应该用于作战甚至赢得战争。在40年代末和50年代,特别是在朝鲜战争期间,美国政府各级官员曾在各种场合宣扬使用核武器。但由于核武器不可估量的杀伤力,加之后来苏联也拥有了核武器,美国最高层似乎从未认真考虑过动用核力量。 | ||||||
有先见之明的观察家如伯纳德·布罗迪敏锐地觉察到核战略在思维领域引发的变化,但他们属于少数派。布罗迪在40 年代曾有过这样的阐述,“到目前为止我们军事机构的主要使命是赢得战争,以后将转为避免战争。几乎没有什么其他合理的目的”。布罗迪进而说明,“在原子时代,美国任何安全方案的出发点和基本步骤就是采取措施确保我们在受到进攻时有能力实施对等报复”。以上两点——以确保报复作为威慑基础和以避免而不是赢得战争作为战略基础——最终成为几乎所有核威慑论述的基调。但是避免战争和赢得战争的区别(与前述威慑与防御的区别类似)意味着常规威慑与核威慑之间存在很大的不同。我在此不想解决这一纷争,但读者应该发觉,如果核威慑在概念上确实与常规威慑大相径庭,那么战例研究对于核国家筹划威慑是没有多少借鉴价值的。 | ||||||
这对于政策制定有多大意义不很清楚。美国第一个明晰的威慑政策——大规模报复战略,不过是一个拓展了的普遍威慑,是将美国的防御“主要建立在能以我们选择的手段、在我们选择的地点立即实施报复的强大力量基础之上” [ 注:引自前国务 卿约翰·杜勒斯的发言。 ] 这当然不只包括核武器。然而,在朝鲜战争中,艾森豪威尔当局为把中国和朝鲜推回谈判桌,似乎曾表露过要使用这种威胁。但如前所述,萌发使用核武器的念头几乎就是禁忌。由于对这种粗糙的政策不满,加之核武器技术的进步,专家们开始涉足研究威慑理论的各个方面。在50年代末和60年代初,人们曾付出艰苦的努力阐释“理性威慑理论”的基本概念,并试图以此指导政策制定。 | ||||||
威慑理论的黄金时代 | ||||||
50年代末60年代初被称为威慑理论的“黄金时代”。肯尼迪政府尤其是其国防部长罗伯特·麦克纳马拉,将一大批在核威慑领域有深入研究或重要著述的民间防务专家延揽到决策圈内。战略分析家如阿尔伯特·沃尔斯泰特、托马斯·谢林、赫尔曼·康惠、亨利·基辛格和威廉·考夫曼等人的观点赢得了大批信众,在一些情况下发挥了很大的影响力。 | ||||||
冷战使安全战略领域发生很大的变化,民间防务专家的兴起就是其中之一。美国与苏联的战略竞争使财政资源滚滚流向 “思想库”和美国国务院带头的各项研究。其中最为知名的是兰德公司,它是上面提到的许多人的暂时或永久栖处。而超级大国战略平衡的出现使大规模报复这样粗糙的威胁理论日渐窘迫,从长远看甚至有潜在危险。大规模报复也许是普遍威慑的有效形式,但对于特定威慑而言它不是一种连贯的和可信的战略,它也没有解决逐渐显露的威慑难题和矛盾。核技术的突飞猛进,尤其是洲际战略弹道导弹的发展,使明确有效威慑的各种条件更为迫切。最后,据肯尼迪总统估计有三分之一或二分之一可能引发核战争的古巴导弹危机,将核对抗的危险暴露无遗,并导致有关各方采取措施约束军备竞赛并稳定超级大国的关系。 | ||||||
在此期间有四项重要的学术和政策性的创新。第一个创新是认识到成功威慑的三个条件——一支报复性力量、一个确实有效的威胁和一条传递这个威胁的可靠途径,是不易实现的。第一个条件涉及到所谓的“第二次打击能力”,即遭受突袭后对攻击者实施足够(或是难以承受的)杀伤的报复性打击能力。这对于核力量建设和运用提出了严格条件(如使部队保持一级战备状态、将武器分散为陆海空基部署及发展机动导弹等),尤其是战略武器库的发展使第一次打击的“斩首”企图成为可能之后。当然,实施这些政策也有困难和代价:比如,与国家指挥机构的联系被切断后,为避免被核“斩首”的危险,应授权低级官员和指挥官自主作出决定。然而,这会增加发生意外事故及叛乱行为的风险。 | ||||||
作出确实有效威胁在很多方面更为棘手,这也许是威慑理论的一个核心难题。乍看上去,这似乎很简单,只须作出明确的承诺(即“红线”警告)并保证进行自动还击。但如果承诺太明确,就意味着不受核安全保护的友国和盟国容易受到侵略的威胁。反之,如果承诺太模糊会导致误解甚至会“跌入雷池”。最后,如巴里·奥尼尔所总结的,威慑理论的内核中有这样一个困境:“要使威慑可靠必须相信对手不会采取自杀性的行动;必须使对手相信你会做出自杀性的反应。” [ 注:参见奥尼尔《博弈理论模式》。 ] 这个难题从未获得有效解决,有两点原因:其一是,既然核攻击会带来难以承受的巨大毁伤结果,如何能使这样的威胁确实有效?另一个是,即使在受到攻击后国家安全岌岌可危,但实施报复只会招致对方另一轮更猛烈的打击而使自己受到更大损伤,如何能使这种报复的威胁可靠? | ||||||
接下来是如何传递信息。和平时期这个问题尽可以通过外交渠道解决,但人们很快发现,在危机时却很难做到这一点。一是表达的问题:如何能够确保在危机状态下,一些特定的行动如提高部队戒备等级、取消军事人员休假、召回外交人员或变更政府日常安排不被对方误解。或者,如古巴导弹危机显示的那样,如何防止日常行动如越界侦察或部队机动被视为故意挑衅。另一个问题是危机决策,因为大家都清楚,无论个人、集体,还是机构组织处于压力下,都无法确保作出“理性”的决策。总而言之,满足威慑条件需要在清楚与模糊之间、保持威慑确实有效的理性与非理性之间、小到足以有效的惩罚与大到足以震慑的打击之间、第二次打击有余的力量与第一次打击不足的力量之间寻找准确的平衡。没人拥有实现这种平衡的魔方。 | ||||||
第二个创新是研究出一种能够自圆其说的有限核战争战略。亨利·基辛格和赫尔曼·康恩在书中曾探讨过理性运用核武器的种种可能性,但大多数观察家很快就看出将核武器用于实战是荒谬的。如康恩在一本名为《论逐步升级》的书中列举了 “逐步升级”战争的44个阶梯,其中第15阶梯开始使用核武器。劳伦斯·弗里曼对此讥讽道,“对于很多人来说,竟有人发明30种方法来使用核武器是不可思议的。” [ 注:参见康恩《论逐步 升级:寓言及方案》(1965年出版)及弗里曼《核战略的演变》。 ] 康恩将最后一步称为“痉挛战”,即在最后关头把剩余的核武器全部投出去。但对于那些认为核交战不可控(第一二枚核弹除外)的人来说,无法想像这样的战争能实现任何目的,也不认为苏联会有兴趣约束这样的战争,或是政府在核屠杀来临之际能够从容地逐级运用核力量。然而,这场争论却突出展示了核威慑的独特之处。 | ||||||
第三个创新是澄清了“反军力”威慑战略与“反城市”威慑战略的区别。反城市威慑战略以轰炸城市和其他“软”目标相威胁,以对敌方民众造成难以想像的杀伤报复其进攻。反军力威慑战略与之相反,是以对方的武装力量为攻击目标的。大规模报复战略可视为一种原始的反城市战略,但不难想像这种种族灭绝的政策不仅令决策者生厌,也为大多数军人不喜。它也会招致对手用剩余的核力量进行第二次打击,使自己受到进一步杀伤。在这种情况下,加之导弹打击精度的提高和各种核武器发展的过剩,开始有人研究能够削弱对手军事力量(包括核力量)的反军力“实战”战略,认为这会提高威慑的可信度。但这又产生了另一个悖论:以对方武器系统为目标的核战略会被看成为第一次打击的准备,而不是一项报复性的政策,这在对手抢先把武器发射出去的情况下是毫无意义的。而且,第一次打击政策是挑衅性的,有损战略稳定。 | ||||||
威慑有两个基本矛盾,一个是如在“摊牌”后实施威胁将是非理性的,一个是它的武器几乎没有什么实战价值。这在政策上造成了某种对立,其结果是战略选择在反军力和反城市两种方案中摇摆不定。因此,在60年代美国的政策是奉行“相互确保催毁”(以消灭苏联百分之二十人口的及百分之五十的工业能力为目标的反城市战略),而北约却将政策基础建立在灵活反应原则(核实战战略)之上。在70年代初期,曾在兰德公司工作过的尼克松政府国防部长詹姆斯·斯莱辛格放弃了相互确保摧毁,转向“自由选择”这一实战原则。卡特总统曾打算转向“最低限度威慑”,但由于担心会钻进死胡同,他也赞同继续研究核实战的灵活性。 | ||||||
第四个可能也是最重要的创新是所谓“稳定冲突战略”。它的出现,缘于人们逐渐认识到任何一个超级大国都无法在核对抗中获胜,任何一场核冲突对于各方都将是空前灾难,古巴导弹危机更使人们坚信这一点。美苏两国领导人接受了这一观点,两国政府高级官员和军官在无数次的讲活中也表达了这一观点。在某种意义上,核战略已自成一派:它被从日常的国家安全决策中分离出来,按其自身的、往往是与直觉相悖的逻辑发展。有很多例子可以说明这一点。 | ||||||
稳定威慑理论的一个基本观点是民防或反弹道导弹系统这种防御性的准备是消极的,会降低发动先发制人的第一次打击所冒的风险,因而会破坏相互威慑。这种逻辑导致两个超级大国在l972年签署了《反弹道导弹条约》,该条约规定只能在一个地点(导弹发射场或首都附近)部署这种防御系统。放弃防御准备是与军事逻辑格格不入的,但双方政治领导人接受了这一点,这反映出民间战略家对决策的重大影响。 | ||||||
另一个基本观点是“撒手不管的威慑”的重要性,或称之为“非理性的理性’的重要性。这种观点认为,国家领导人如果表现出乐于进行非理性冒险,有不顾一切或自杀性行为的倾向,或在冲突升级时易于失控,那么他在威慑对抗中“获胜” 的可能性就大。有证据表明在1973年巴以战争时尼克松总统和他的国家安全顾问亨利·基辛格曾有意树立这样形象。然而,这暗示着如果谁努力防止冲突升级或精心设计更多的解决方案,反而可能发生陷入他想避免的结局。虽然在民主社会中表现“非理性”的倾向是很难的,但事实上威慑大厦就是建立在这种“非理性”基础上的;如果出现他想避免的这种结局,就只有威胁进行非理性的行动。 | ||||||
托马斯·谢林对这种困惑作了最好的阐释。他的两本书,《武器及其影响》和《冲突战略》确立了威慑的正式模式。他通过枚举一些日常生活事例说明共同利益及默契的重要性,认为它们决定着冲突逻辑。他的观点获得广泛认同(尽管有时令人难以理解)。比如,他用一个很常见的例子说明“香肠战术” (即进攻者通过发动一系列小型攻击,并保证这些攻击行为将是最后一次,而取得胜利): | ||||||
告诉一个孩子不要涉水,他会坐在岸边把脚泡在水里,他还没“进入”水里。如没遭到斥责,他就会站起来。这时他身体在水中部分并不比以前多。犹豫一下后,他会向前迈出一步,并马上停下来看看有没有人管他,然后再向前走一点,并表示他只是来回走走与以前没有什么不同。再过一会儿,我们就只能要求他不要游得见不到影。 [ 注:谢林,《武器及其影响》第66页(1966年出版)。 ] | ||||||
另一个重要观点是,即使没有正式的或可靠的沟通,人们的行为也会自然趋同。如谢林所说,“如果两人知道对方要做同样的事情,那么他们就会彼此协调意图和期望”。为说明这一点,只须做一个简单的试验:让一些学生在事先不能通气的情况下约定第二天某时某处见面,并奖励那些作出相同选择的学生。在现实生活中,这种默契通常不是根据逻辑推断,而是根据想像、比较、经验作出的。在核世界,这种默契通常被称为“防火墙”或门槛,如果想限制冲突就不能突破它们。这里面包含了超级大国的一些简单的行为规则,如“不要寻衅滋事”、“不要攻击对方领土”,以及核时代可能最重要的防火墙 ——“不要使用核武器”。 | ||||||
谢林的研究重大价值在于其分析基础,决策者对此不很重视,但能引起学者大的兴趣。他的研究根植于新兴的“博奔论”。稳定冲突逻辑最早是由格莱恩·辛德、布鲁斯·卢塞特、丹尼尔·埃尔斯博格和赫尔曼·康恩等人应用于核威慑的。这些早期研究距“理性威慑理论”只有一步之遥,他们提出的朴素、看似合理的推理方法不仅阐释了威慑战略的疑问,而且系统解释了独立行为体之间冲突与合作的关系。尽管谢林没有运用很多“模式”(如支付矩阵、博弈树形图等),他的许多本质上是社会学或心理学的见解都被下一代理性威慑理论研究人员继承了下来。 | ||||||
理性威慑理论的“第三次浪潮” | ||||||
兴起于70年代和80年代的所谓威慑理论“第三次浪潮”标志着学术研究、政策宣示与核战略目标开始分道扬镳。从政治角度上讲,政策宣示在70年代和80年代初便出现了上面所提到的一系列变化,但美国的政策宣示与其实际的核战略目标之间的差距却进一步扩大了,这种核战略目标包含于“综合作战计划”之中。核弹头数量的增加,武器系统精度的提高,以及指挥与控制系统的复杂化,使“综合作战计划”日臻完善,也使美国总统可以选择多种手段逐一摧毁它所确定的苏联和中国军事目标。而在学术界,主要工作是试图定型并完善此前学者提出的粗糙模型,学者们还在讨论理性威慑理论及其两个主要竞争者——心理分析理论和所谓的“个案分析”理论的长处和短处。尽管有迹象表明学术辩论与政策辩论之间仍存有重要的联系,但是两者已不再相互促进发展,学术界与政界的人员流动也少了下来。 | ||||||
但是,究竟什么是“理性威慑理论”呢?事实上,这个问题令赞同者和反对者都感到为难,几乎没有人对这个理论进行过明确的定义,不同的人有不同的提法。如前所述,理性威慑理论的开创者是谢林和埃斯伯格这些人。他们很随意地阐释了该理论的几个要素并提出了一些早期的模型。其中,最为人所知的是“囚徒困境”和“斗鸡博弈”,它们都形象化地对超级大国的对抗作了贴切的比喻。“囚徒困境”的主要内容是:两个犯罪嫌疑人被警察捕获,将他们判刑的条件是至少有一人承认犯罪。他们被分开关在两个房间并面临两个选择:保持沉默或承认犯罪。如果两人都保持沉默,他们都会被判犯有轻罪而入狱一年。如果一个人承认犯罪,那么他(或她)将入狱三个月而另一人将入狱十年。如果两个都承认犯罪,那么都将入狱五年。囚徒选择矩阵按图6.1所示,囚徒A选择的结果标在每一方框的右上方,囚徒B标在左下方。 | ||||||
图6.1 囚徒困境 | ||||||
“答案”或是均衡位置(也被称为“纳什均衡”)是两个人都承认犯罪,因为不论其中一人怎么做,对另一人都是最佳选择。其中的逻辑不难分析:如果囚徒B保持沉默,囚徒A就要选择是入狱三个月还是一年,因此承认有罪为上策。如果囚徒B承认犯罪,A就要选择入狱十年还是五年,还是承认有罪为妙。同样的逻辑也适用于囚徒B。这与核威慑的类似之处不难推敲。在没有建立“信任”或是强制承诺情况下,想避免出现大家都不希望的结局是不可能的。碰巧的是,黑社会组织间的不招供盟誓和报复威胁正起到了这个作用! | ||||||
第二个是“斗鸡博弈”,这要更有趣一些。它取材于一种青少年车赛,两人沿一条公路迎面高速驾驶,谁先掉头谁就是“小鸡”。当然,很难对这种比赛进行量化分析,因为其选择结果涉及到“荣誉”及死亡这种不可估量的概念。但是仍可用抽象的价值来表现代价和收益进行分析。如果两位参赛者都掉头,那么他们就打成了平手,没得到也没失去什么。如果都不掉头,就都失去了一切(负500分)。如果只有一人掉头,那么他(或她)就失去了“荣誉”50分,被另一人获得。 | ||||||
图6.2 斗鸡博弈 | ||||||
这个比赛没有稳定的均衡位置,即参赛者的选择发生交汇,因为两人都想取得右上方或左下方方框的结果。但从另一方向讲,都掉头才是两人明智的选择,而这样做要求有一定程度的默契。间题是这种选择是不稳定的,因为两人都想使对方相信自己是不理智的,会进行疯狂的冒险,从而赢得比赛。为了“比赢”,参赛者可能装作醉醺醺的样子或是满口大话,可能把前车窗涂上油漆挡住视线,或是把方向盘扔到窗外,迫使可能更理智些的对手承担选择的责任。这就是“非理性的理性”。“斗鸡博弈”可与古巴导弹危机为代表的核边缘政策相类比。当时美苏领导人陷入激烈对抗,双方都认为美国对古巴核设施的攻击将导致一场核战争。 | ||||||
理性威慑理论最重要并最有趣的部分有很强的技术性,前面提到的竞赛只能作为出发点。实际上,共有78个类似矩阵,两个参赛者把各种结局按他们喜好的顺序排列出来(这样可以免除给价值定量的麻烦)。我在这里不想讨论它们,但有必要解释一下理性威慑理论建立的基础、理性威慑理论(及大部分博弈理论)涉及到三个根本假设,艾肯和施奈德总结如下: | ||||||
1、理性行为人假设。行为人有喜好和选择方案,而且他们试图根据另一行为人的喜好和选择优化其选择方案; | ||||||
2、主体原因假设。结局的变化应由行为人机会的差异解释; | ||||||
3、主体独立假设。国家被假定为一个独立的理性行为人。 | ||||||
这些假设是从经济学借鉴来的,在经济学领域理性行为人模式被用来分析个人及公司在各种情况下的行为。在理性威慑理论中,这意味着国家被假定为: | ||||||
l、是“效益最大化”追求者,并同意对国家“效益”的定义(该定义一般来讲是与“扩展力量”同义的)。 | ||||||
2、有可过渡的稳定的偏好(如果我喜欢巧克力胜过喜欢香草,喜欢香草又胜过喜欢草莓,那么我喜欢巧克力胜过喜欢草莓,而且我不轻易改变我的偏好!)。 | ||||||
3、有一定程度的冒险倾向(一些领导人愿意用国家生存进行豪赌,而另一些领导人为保住既得利益不愿冒险)。 | ||||||
4、以“战略性”方式处理国家关系,利用所拥有的信息进行选择,为达到目的愿意采取任何策略。 | ||||||
需要说明的是这些假设并不意味着理性有任何特定的“内容”,不意味可以给所有的结局定一个分数(只可以根据喜好排序),也不意味决策者掌握所处环境、各种不同结果的可能性及对手的喜好方面的确切信息,尽管早期的模式对此作出了肯定的假设。因此,这些假设受到不同程度的批评是不足为奇的。 | ||||||
理性威慑的中心任务是研究在什么条件下能够运用威胁迫使对手按照自己的意愿行事;在特定的核环境中,是研究超级大国达成战略平衡、减小核战争风险的具体条件。稳定核威慑实质上就是“非核战争”这种均衡结局。威慑各方面的研究成果是极其丰富的,我只想重点说明吸引了斯蒂文·布莱姆斯、罗伯特·鲍威尔、巴利·奥奈尔、弗兰克·赞格尔及哈里森·瓦格纳这样杰出分析家的三个问题,它们促发了复杂的数学模式分析的发展。这三个问题是:模式中如何处理不确定性及冒险倾向差异,如何提高可信度及决心,如何加强危机稳定。这种研究有着双重目的:研究更可信的推理模式,在这些模式的基础上证明或驳斥“老一代理论家”关于威慑作用的论述。 | ||||||
第一个问题是理性威慑理论如何将核对抗所蕴含的不确定性具体化。一些简单的理性选择模式如“囚徒困境”假设存在完全信息:每个行为人都知道博弈规则、回报的性质、各种结局的可能性、自己的偏好顺序及另一方的偏好。但核对抗却不是这样,决策必须在充满不确定性的环境下作出,特别是对手的意图及愿望是不确定的,他们可能言不由衷或凭借大话掩盖其真实意图。批评者抓住了这一点,称“政治家(对另一政府对于挑战作出反应)的吃惊频谱与理性威慑理论不和谐”。 [ 注:瓦 格纳,《威慑理论中的理性与误解》,《政治理论杂志》1992年第4 期第115页。 ] 但这是把威慑的缺点与模式的缺点混淆了。事实上,大多数模式预测威慑可能会出现失误,理性威慑试图在模式分析中以 “不完全信息”概念处理不确定性及判断失误问题。可以通过下面两种方式的一种将不完全信息引人模式分析之中:每一个行为者都不知道对手如何估量各种结局,但可以通过反复的互动行为捕获一些信息;一方不知道另一方有多大决心和承诺进行自卫或保护盟友,不知道他愿意冒多大风险。 | ||||||
第二个问题涉及到威慑的活力,即如何提高建立威慑的可信度。传统观点认为在因战争边缘政策产生的危机中,决心大的一方会获得优势,并且双方保持现状的意愿对于和平解决危机是非常关键的。但依照这种观点会产生一个所谓的信誉悖论:为树立敢作敢为的信誉而在小事上表现强硬会产生适得其反的效果,因为即使是弱小国家也会发现在小事上强硬没多大风险。这些结论可以直接从“比大胆”博弈的分析中获得。但是随着“比大胆”模式进一步复杂化,有一些与以往不同的发现显示出来。鲍威尔在“寻求可信度”的研究中将这种简单的博弈扩展开来,使之成为“双方不完全信息”博弈,即双方都不知道对手的决心及双方有多大可能滑过边缘,并将这种博弈系列化,即通过一系列步骤推演博弈(而不是以前那种只有一步推理的矩阵),这对达成均衡有了更严格的限制。鲍威尔的研究结果显示,在一定条件下决心大的国家不一定占据优势,而且降低对于决心的错误判断反而可能使危机失去稳定。 [ 注:鲍威 尔,《双方不完全信息的核边缘政策》,《美国政治科学问题》1988 年第1期第155页。 ] | ||||||
第三个问题是危机稳定及危机的较量和升级。不同的作者研究这个问题有不同的目的:一些人的兴趣是分析确保稳定的条件,特别是在一方拥有第一次打击优势而导致另一方可能考虑实施先发制人的第一次打击的条件;另一些人的兴趣是研究如何改进博弈理论使之能够仿效双方有一系列“行为”的危机的发展。对于前者,鲍威尔这样的学者强调“危机的不稳定性源自多个因素微妙的互动关系,第一次打击优势不过是其中之一”,因此,仅从第一次打击优势这一点研究核武器能力就太狭隘了。对于后者,布莱姆斯这样的学者提出了“行动理论” (这与动态博弈相仿)来连续推演稳定均衡结局,并用以阐释古巴导弹危机和1973年巴以战争,这两个事件中美军曾进入“预防警备状态”(即准备运用核武器状态)。有必要再演示一遍布莱姆斯古巴导弹危机的树状结构图进行说明: | ||||||
图6.3 博弈树 | ||||||
说明:(X,Y)=(美国分数,苏联分数);4=最好;3=次好;2=次坏;l=最坏【资料来源:S·布莱姆斯,超级大国的博弈(新哈芬,CT:耶鲁大学出版社,1995),第60页,经耶鲁大学的允许而采用。】 | ||||||
每一组行动由“分支”(两个交叉线条)表示。一方行动后(这里是美国选择封锁还是空炸),反应方(苏联)就有两个选择:保留导弹还是撤走。如果撤走,推演就结束了。如果不撤就进行下一轮,美国要选择封锁还是空炸。每一个选择都有优劣之分,在每一线条的下端标出。这些优劣被定了分数(4是最理想的结局,1是最糟糕的结局),美国分数是括号中前面的那个。读这种推演图的方法是“由后至前”,即从树状图的下端开始对参与者的选择作出评估。在这个案例中,在最后一轮,美国选择空炸(3,l),而不是封锁(1,4),因为在苏联抗拒的情况下持续封锁是美国最坏的结局。这样,我们划掉 “再封锁”(由线条上划一短横表示)。接着,苏联要选择保留(将面临遭受空炸的结局,3比1,它的最糟糕选择),还是撤走(4,3)。美国接下来选择立即空炸(2,2,它的次坏结局),还是先封锁(4,3,它的最好结局),它选择封锁。因此,推演的结果是先封锁然后苏联撤走。这些优劣顺序是由相当复杂的可能性分析得来的,这种树状图可被延伸到更多的 “分支”。 | ||||||
总体看来,理性威慑理论的工具为学者们提供了探究威慑理论问题的有效手段,包括如何确立和评估信誉,如何使威胁可信,更好的交流在稳定危机方面的作用,及反复的双边互动对于结局的影响。上述论点是依靠复杂的模式技术建立起来的,这里不加说明。这些模式能否为决策提供令人满意的结论是另一回事。事实上,不事先确定“进步”的含义很难评估理性威慑理论所取得的成果。理性威慑理论最常见的进步标志是内部的:许多作者为自己工作辩护的理由是该理论对某种模式进行了进一步的阐述。比如,鲍威尔运用了动态博弈和不完全信息。赞格尔依靠的是“行为理论”和三阶段博弈。这些作者同时声称他们的阐述也可在一定程度说明现实世界的国家关系互动。然而,如果以外部作为进步标准的话——即在更大程度上说明外交政策和国家关系的运作,较之谢林那个时代理性威慑理论并未取得多大进步,这主要是因为很难以“现实世界” 的证据“检验”该理论的各种新观点。如果没有现实经验作参考,数学模式“结论”本身不能被视为科学发现或进步。 | ||||||
在研究对理性威慑理论的几种批评意见之前,有必要简要指出威慑的理性选择方案的魅力何在。理性威慑理论的首要动力是它非常符合盛行的现实主义国际关系学说,该学说认为在无政府状态下国家为了生存只能依靠它们自己的智慧和资源。现实主义的中心假设是国家是独立的行为体,其领导人对于 “国家利益”有清晰的认识,他们的决策是建立在对于各种行为的代价和收获有着理性评估的基础之上的,并且至少有一种评估其环境及潜在对手的方法。用另一句话说,在现实主义者看来,国家间政治就是国家间纯粹的战略互动,游离于任何社会的和文化的框架之外,交流的方式仅限于发出信号和实际行动,而且,建立信任即使不是不可能,起码也是相当困难的。 | ||||||
与其他方法的辩论 | ||||||
在理性威慑理论与其他威慑理论之间有一条很大的鸿沟。对理性威慑理论有两个主要而直接的挑战,一个是以罗伯特· 杰维斯为代表的心理分析方法,一个是以亚利山大·乔治、詹尼斯·斯坦因和理查德·奈德·里鲍为代表的个案分析方法。实际上,这两种方法有着紧密的联系,并没有截然的区别。我在这里不想详细论述它们的长处和短处,只重点谈谈它们对理性威慑理论的批判,以及对这些批判最常见的回应。 | ||||||
被质问的第一个问题是理性威慑理论的基本假设,即决策人理性和效益最大化假设,在多大程度上与现实相符。正如乔治和斯莫科批评到: | ||||||
目前这种抽象的、推理式的威慑理论对于政策实施是不够的……(因为)现实生活中某些威慑现象对威慑结果起着关键性的作用,但是在现有理论简单化的假设中没有考虑到这一点。 [ 注:乔治和斯莫科,《美国外交政治中的威慑》。 ] | ||||||
里鲍和斯坦因用更犀利的语言表达了同样的观点: | ||||||
现有的威慑理论是不完善的,漏洞百出。它们不仅是关键性战略行为蹩脚的预言家,也是蹩脚的政策指南。威慑理论没有考虑到战略选择最重要的决定性因素。这些因素不仅不在基本假设范畴之内,有时甚至与其矛盾。 [ 注:里鲍和斯坦因,《理性威慑理论:我想,故我威慑》,载《世界政治》1989年第2期。 ] | ||||||
有很多更直白的批判,有些是集中反驳理性威慑理论的独立行为人假设的,有些则质疑理性行为假设,还有一些针对决策者的效益最大化。比如,威慑的机构分析法及控制论分析法称,大机构或大团体的决策过程不是以独立理性行为人假设模式运作的,其中包含了对政策选择造成严重影响的各种利益考虑。 | ||||||
对于这种批评有两点值得注意。一是这不一定会使理性威摄理论失效,因为它的假设在决策过程中可以进行相应修改,例如冒险或避险倾向,决策过程中的信息不完善等。正如斯蒂文·布莱姆斯和马克·基尔戈针对心理分析法的指责说: | ||||||
无疑,心理因素会影响参与者对敌人及其威胁的看法,并影响对决策者在危机中行动的估计。然而,在我们看来,原则上将这些因素引入博弈理论模式没有什么阻碍,这种模式允许存在不完善或不完全信息,允许各种威胁存在可能性,允许在危机中时间压力限制战略选择,等等……因此,我们相信这些方法是可以互补长短的。 [ 注:布莱姆斯和基尔戈,《博弈理论和国家安全》(1988年版)。 ] | ||||||
不幸的是,在这方面做的工作少之又少,其中部分原因是独立理性行为人这个基本假设受到了挑战,而该假设是所有正式模式得以建立的基础。第二个须注意的是这种批评有些偏离主题了:根据理性威慑理论支持者的观点,假设的本意不是为了反映现实,而是为了激发理论见解而采取的简单化分析模式。一些学者甚至提出假设根本不必与现实相符——理论的检验标准就是它预测结局的能力。如我们下文所见,这样的反驳不足以令人信服。 | ||||||
批评的第二个焦点是该理论的实践或是预测价值。在浅层次上,可以辩称理性威慑理论是不可以检验的,因为“无法洞察人们身处核战争状态下,如决定是否发动核攻击,或是否实施这个决定,以及是否承受这样的结果时,会作出什么反应”。换言之,这个模式建立在决策者如何确定其选择顺序的假设基础上的,无法对他们的决策进行科学考核。即使这被视作一个实践性的问题——也就是通过对战略家及决策者的考察进行分析,“他们也根本没搜集任何实践材料来检验理论家分析的选择结构是否反映现实社会人们对于威慑竞赛的理解”。他们没这样做不值得大惊小怪。需要指出的是‘预测”这个概念在这里有两个含义:预测选择顺序,或是预测结局。前者实际上就是模式的假设,但与其他假设不同的是,它们必须与现实世界行为者的态度相符。后者要求理性威慑理论走出寻找均衡结局的模式推演套路,明确处理威慑事务时需遵循什么样的原则,由该理论得出的预测在多大程度上与“现实世界”的选择相符,以及为何这些预测出现偏差。即使理性威慑理论的大部分假设不一定必须是“真实的”,为成为“科学的”仍须处理好现实世界“事实”的诸多复杂性,这是经常引起争议的。否则理性威慑理论就无法检验,也无法获得进步,因为预测结局的能力是对它完善的基础。 | ||||||
第三种批评观点认为,理性威慑理论的模式将现实世界过于简单化了,得出的分析结论不适用于政策选择或结局。比如,詹姆斯·德纳多得到专业人士和非专业人士广泛认同的“直观威慑理论”认为,“在你所熟知的理论中找不到正确的预测核选择方案(比如在军备控制和武器采购问题上)”,他总结道: | ||||||
我们威慑和军备竞赛的重要理论在它们列举的博弈中都错误地确定了选择……将战略选择划分为“鹰派、鸽派”或是“强硬派、温和派”这种老套路不能反映出现实核选择的丰富性和多样性。 | ||||||
因此,我们不能确保由理性威慑理论得出的在理论上正确的结论如果被决策者采纳的话,不会导致一个悲剧性的结果。 | ||||||
更具体一些说,一些人认为理性威慑理论在军备控制与裁军谈判中已造成了一种“维持现状”的偏执,甚至可能会激发军备竞赛。由于理性威慑理论的目标是在竞赛中找寻稳定的均衡,因此军备在任何层次上的稳定都成为成功与否的标准。有人认为将大规模杀伤态势定义为“和平”是荒谬的。因此,在有关大规模削减两个超级大国的战略武库的讨论中,以理性威慑理论假设为研究出发点的学者如麦克尔·梅等人得出结论说,“部署3000件核武器大体符合威慑要求的限度”,如果削减到这一数额以下就有可能破坏稳定。但是根据“存在主义威慑理论”(少量的核武器由于具有大规模杀伤力也可确保威慑成功),将核武器削减到几百枚也是可以接受的。“存在主义威慑理论”似乎不是以理性效益最大化假设为基础的,它的观点是即使使用一枚核武器也会导致政策上的灾难。这虽然近似于核武器运用的人道主义考虑。却反映出决策者的真实想法和偏好。比如,前国防部长罗伯特·麦克纳马拉曾声称,“在与肯尼迪和约翰逊两任总统的私人谈话中,我毫不保留地建议他们在任何情况下都不要首先动用核武器”。 | ||||||
理性威慑理论家的回答不难想像。首先,他们指出不管个案分析多么深刻,不管分析数量有多大,也不能成为威慑的一种理论:如艾肯和施奈德所说,“变量表……不是理论”,“(关于威慑成功与失误的)类型学不管有多新奇多深奥,也不能从中推论出令人信眼的或出人意料的结局”。多少令人吃惊的是,虽然理性威慑理论在实践验证方面存在缺点。他们还是声称 “个案分析方法对理性威慑的实践验证没有给人留下深刻的印象”。至于与政策联系方面,埃尔斯伯格在1961年便明确做出反击,“不幸的是从历史上看决策者往往拒绝借鉴抽象理论 ……认为它们‘太朴素了’,而是根据更粗糙更含糊的模式制定决策”。换句话说,就是其他方法在科学性、先进性和活力方面不如它。 | ||||||
对威慑理论更深刻地批判 | ||||||
在这场辩论的背后,是更深刻的关于社会科学的意见分歧。对理性威慑理论更深层次的批判已将矛头指向社会科学这面更大的织锦,威慑理论不过是这面织锦上的一块刺绣,并且逐渐牵涉到国际关系和政治科学领域一系列重要的问题。在此,我仍不打算对这些细节逐一评述,但准备谈一下对理性主义分析方法的几个主要批判。 | ||||||
反对威慑理论(不仅是理性威慑理论)的一个理由是,它深受文化影响并有种族中心论倾向,特别是它反映了美国武力运用的理性尺度上及运用“科学”解决棘手的政治和民族问题的困惑。这方面最好的例子就是美苏关于威慑性质的观点分歧:事实一再证明苏联决策者极度反感美国的威慑模式,包括威慑与防御的区别,相互确保毁灭的合理性(或不可避免性),以及“威慑”这个词的基本含义。这似乎不只是由于误解,或是由于选择排序及战术手腕上的差别,而是由于不同的“战略文化”:由历史经验及国内政治环境生成的处理战争及和平问题的思维方式。正如凯恩·布斯所指出的,我们没有过硬的理由假设对手以与我们相似的方法分析形势。这也是个案分析方法及心理分析方法的观点。当然,可以反驳说理性威慑理论可以引入多种排序,只有理性这一假设才必须是恒定的。但这一论点也并非无隙可击。 | ||||||
这就直接引出了第二个疑问:理性威慑理论“理性”这一概念的确切含义。选择的简单排序,或是对于威慑结局的不同定量,是以理性的简单定义为基础的,按照这一定义,任何选择只要是稳定的并且可以传递的便可视作是理性的。因此,甚至自杀——无论是否是国家行为,都可能是“理性的”。比如,赞格尔就赞同采纳简单理性概念以避免“对于行为者选择目标理性问题无休止的、不可调和的争论”。问题是根据我们对于理性行为的直觉认识,很难将自杀性轰炸的理性或人道主义的理性等同起来。如果威慑被视为是一定历史条件下的国家互动关系,那么理性威慑理论就无法回避决策者向外传递的外交政策目标及意图问题。甚至是理性威慑理论家也承认这种关系微妙的社会性与传递性。如纳尔巴夫所言,“信誉的价值依赖于别人如何看待它”。这反过来也会影响建立信誉的意愿。 | ||||||
因此,辩论不只是关于博弈的性质,而且是关于我们应尊重哪种“顺序”,及应追求哪种目标。两个超级大国的威慑关系演变似乎包括了这个基本因素,它们在相互较量中逐渐认识到应在低水平军备下获得更大安全。两国的退休领导人一再声称他们除非是在极端的形势下,否则永远不会考虑批准核攻击。但是理性威慑理论的分析工具允许战略家(学术的或是政治的)表明他们没太大必要学习或是理解现实决策和战略政策,也没必要分析苏美之间的“战略对话”。这种对话始于早期的交流,并延伸到关于军控及有关在核世界安全概念双边含义的细节讨论。双边或共同安全概念是很难在理性威慑理论模式中体现的,这些模式也没有引导政策建立这种共识。理性威慑理论不能解释或预测米哈伊尔·戈尔巴乔夫领导下的前苏联军事理论及威慑战略发生的变化,如果确定他的选择顺序的话,便可以很好地对他的行为进行模式化。 | ||||||
这两项争论交汇成对理性威慑理论的第三个批评,即威慑理论的几个核心概念——可信度、信誉、决心及“挑斗方和回应方”,离开了一定的信息传递和行为互动的社会环境就没有什么意义了。其中最引起争议的是某些假设内容,“竞赛”是由一方的某一行动启动的,在威慑环境下学者和决策者可以毫无困难地识别谁是挑斗方谁是防御方。仅凭信息可以无困难传递这个假设但不能解决问题,信息不完善假设也不是惟一障碍。可信度和信誉离开了一定的社会背景,不受到别人的尊重和承认就没有价值。然而只要我们承认意图是重要的,承认我们讨论的是一种社会关系,那么“重点就不仅是个人选择,而是所选择的对象如何思考,研究,相信或是否认,努力建立共识,改变别人对于世界的看法,总之,运用他或她作为社会一员的能力发现问题,解决问题,并塑造环境”。这不是理性威慑理论所要描述的世界,在它的基本假设中,独立的行为人能够确定其利益,并在一个已定的他们无法逃避或改变的博弈结构中实现其目标。 | ||||||
与此相似,在威慑环境下谁是挑斗方谁是回应方也是很难辨别的。以古巴导弹危机为例:起因是苏联在古巴部署中程导弹吗(即挑斗方)?还是前苏联对美国入侵古巴(猪湾)的防御性回应?还是因为美国封锁古巴而成为挑斗者,而在那里部署导弹不过是与美国在土耳其部署导弹相似而已?事实上,古巴事件的进展,包括信息误传及双边采取的一系列行动,与前面提出的博弈树状结构图并不十分相符。 | ||||||
最后但不是最不重要的指责是,核威慑在伦理上是错误的。在批语者看来,理性威慑理论的抽象性掩盖了这样一个事实,即核威慑,至少是超级大国间的核威慑,是建立在大规模杀伤、种族屠戮和种族灭绝的威胁基础上的。即使事关生存,做出这样的威胁也不符合正义战争的任何衡量标准。合理使用一些核武器以补偿自己损失这样的说法不是毫无道理,但此举蕴含的巨大升级危险也足以使之止步。虽然这种反对不是针对理性威慑理论本身,而更多的是针对政府的威慑政策,但它的两个基本观点却是指向威慑理论家的。第一个观点是,理性威慑理论及威慑政策的研究已成为一种“神学”,只有一些“高级牧师”懂得其曲折深奥处,他们可以藉此否定或忽视普通百姓特别是和平和裁军运动人士的意见。威慑语言不仅抽象、生僻,而且有引诱性和排他性。第二个观点是,理性威慑理论由于排斥了其他威慑方法,实际上加重了决策困难,并给人一种错觉好像一切尽在掌控之中,这是相当危险的。 [ 注:格林,《致命 的逻辑:核威慑理论》(1908年出版)。 ] 正是巴利奥奈尔(他本人就是博弈理论家)所说,动态博弈分析法隐含着出现危机和战争的假设,这是绝对错误的。在核交战中,无论是美国还是苏联都不能确定来袭导弹的目标,因此也不能判别究竟是针对军事目标的攻击还是全面的攻击,而这对于理性威慑理论的升级模式是极其关键的。在现实世界中没有“裁判”命令决策者遵守动态博弈分析法的逻辑进行上下“轮” 转换,当战争的迷雾不遵守博弈理论的规则时,对悲剧结局感到忏悔的战略家有理由被视为道德失败者。 | ||||||
结论 | ||||||
我们是否接受理性威慑理论作为研究威慑现象的方法、描述世界的工具或是制定政策的指南,在很大程度上取决于我们对它总体重要性的认识。如果它不过只是对政策没什么影响力的一个有趣的学术派别,那么前面所提的许多批评观点是没有多大意义的。反之,如果它是国际关系领域一门极其重要影响巨大的理论,就有理由仔细审查其长处和短处了。没有谁成功地仲裁了这场辩论,前面提到的许多作者对于理性威慑理论的重要性也有相当大的意见分歧。我所能断言的是20世纪60年代学术界与决策圈之间紧密的联系已松散得多了,理性威慑理论专家及其见解受到冷遇,但是在决策圈内仍有许多人持有该理论的世界观。 | ||||||
也许近几年中最有趣的变化就是许多威慑理论的主要设计师转而呼吁采取激进措施全面核裁军。罗伯特·麦克纳马拉与数位在堪培拉委员会中地位显赫的同事一道大声疾呼,“应采取紧急而果断的措施消除核武器及其带来的威胁。核武器的毁伤力是巨大的,任何程度的使用都意味着灾难。” [ 注:《堪培拉委 员会关于消灭核武器的最后报告》,1996年8月14日公布。 ] 与 此相似,在1996年底有近40位英国、美国及俄罗斯的官员发出“全面彻底消灭核武器”的呼吁。其中包括前英军国防参谋长洛德·卡弗陆军元帅、前驻欧洲盟军司令约翰·加尔文上将和俄罗斯将军亚利山大·列别德。像麦克纳马拉这样的人从“威慑理论黄金年代”的催生者和筹划者演变为核裁军人士,这一变化至少应引起学者、学生和决策者们反思,是否有必要为共同安全寻找一种着似清晰高雅的理论基础,而牺牲世上男女对于历史发展动力的明确共识。 |