在《未来战争》(1899)一书中,Ivan Bloch 创造出一个令人惊叹的量化的战争史-关于战争的打法-不是历史本身的价值,而是因为他相信量化的历史可以作为预测未来战争的基础。Bloch和Neuatadt和May(1986)都希望我们可以根据过去的纪录理解现在和预测未来,但是都不成功。Bloch的经验揭示了用历史预测未来的困难度。在历史研究的基础上,他作了三项重要的预测。第一是,军事科技的演进将使相对弱小的一方足以防御强大一方的攻击。他预测,机关枪的发展能让躲在壕沟内的每个士兵在每秒钟射出大量子弹,造成入侵者极大的伤害。这个预测不幸言中,第一次世界大战就是最大特征,就是同盟国和轴心国一连串无效的攻防战。数万士兵付出生命,却无法突破双方的防线。Bloch在马恩战役、索末战役和夏特提尔利战役的二十年前就写好了剧本。

  他的第二个预测是也几乎完全正确。他认为,不论是发动战争或防御的财政成本都会高得难以置信。这确是实情。但他的第三个预测却完全错误。他认为,由于成本过高和难以取胜,当欧洲的政治精英认识到成本效益的问题之后,会寻求比较合理的方法来解决国与国冲突。为什么他会错得这么离谱?一个解释是,作为一个西方经济学家,他假设政治、军事和经济精英都是理性的。这虽然有部份真理,但事情却复杂得多。那么,我们还可以从历史学到什么其它教训呢?

  想从国际史寻求教训的人并没有坚实的、可以作为出发点的前例可寻。虽然早远有Buckle、Condocert和Bagehot等人想把科学方法和历史结合为一,晚近一点的还有Bloch(1899)、Richardson(1939)和Wright(1942),但既没有什么可信的著作,也没有形成可以用科学方法处理历史的共识-不管是政治史、外交史还是军事史。相反的,主流传统是「搜索枯肠的历史」(Hoffman 1965),去研究某些可以揭示问题的案例,或者去支持既有的关联性。虽然有上述这些先行者,多数政治学家依然一方面遵循Santayana的说法(不去学习历史教训的人必定会重复犯错),一方面又把历史当成「一件又一件可恶的事实」。

  即使如此,多数人仍然认为,历史是帮助我们理解和避免导致战争过程的最有效来源。然而,这种想法并不是那么完全,因为还有其它提供洞察力的来源。第一,有许多情验情境可以用来模拟国际冲突,我们也不该忘记,过去的国际体系也只是现在和未来国际体系的模拟。经济市场、劳资关系、前工业社会体系、动物社会、都市生活、交通阻塞、大型组织、银河、气象结构等等,都是可以模拟的来源。

  第二是社会科学实验。在适度控制的环境下,其中的个人和团体会像国家、派系、政府官员、外交官等一样行为。虽然近年来只是用来教学,但这些社会心理实验对理决策过程和态度形成相当有益。

  第三是计算机仿真,当它以完整的经验通则为基础时,它的价值特别大。即使经验通则不够完全,这类仿真也可以有力地展示逻辑一致性,提供丰富的假设和洞察的来源。第四是形式模型,以博奕理论的抽象架构为基础。虽然它和人类真实活动的复杂性相去甚远,模型还是可以用来测试推论的逻辑,提供独树一格的灵感和假设。另外还有其它方法,但本文旨在讨论「从历史学习教训」的前景。  

  一些基本的衡量标准

  选择用历史来获得有关战争与和平的知识,不只是求助于「历史」本身。如果没有历史这个学科和杰出的研究者,社会科学家不可能

   。历史学家汲取经验素材,评人论事,对模糊的、争议的事实抽丝剥茧。他们还提供丰富而多样的诠释,这些都是社会科学的加工原料。然而,除了少数例外,他们通常不愿作通则化( generalization)的工作,而宁愿细致的分析一个事件、一个时代或一个场景。

  首先要界定时空背景,再检视该时空背景中的所有相关案例。第三,严格地比较各种案例和状况,找出与手头上的个案最相近的例子。譬如说,当美国国务卿 Dean Rusk宣称「慕尼黑的教训」可以适用在一九六七年中南半岛的冲突时,新闻记者、国会议员和一般民众应该问下列的问题:「这两个案例在哪些面向上相似?有多相似?在哪些面向上不同?有多不同?在维也纳会议后,有多少这类型的案例?每一个案例采取了哪些政策?哪些案例转变到哪些方向?简单地说,国务卿先生,除了你告诉我们的案例之外,也请告诉我们关于法休达、阿加迪尔、康士坦丁堡和萨拉耶佛的案例」。当然,Rusk不会是第一个,也不会是最后一个常常「耽溺于以历史来证明其理论」(Acton 1909)的外交官。

  同样的原则也可以适用于军事准备:在哪些情况下,不同层次的军事准备最能够加强国家安全?对于过度武装和过少武装的国家来说,情况会更复杂吗?更具体地说,过度武装会不会和过少武装一样危害到自身的安全吗?很明显,没有哪两个情况会完全相同,但也没有哪两个情况会完全不同。国家不同,但所有国家都有一些共同的属性。军事战略不同,但都是基于极为类似的前提。历史会变迁,但也有高度的延续性。因此,虽然时间、地点和情况都会改变,望文生义地解释历史也有危险,但是,不把历史纪录当成政策指导是更不负责的作法。

  如同前述,如果我们把过去当成一个手提箱,随意抽取可以支持自己观点的东西,再把不符合自己偏见的东西放回去,我们就不能期望从历史学到太多东西。只有汇整各种案例,或是小心地选取具有代表性的样本,才能合法地建立通则。偏颇和扭曲的母体或样本只会导致偏颇的结果。

  但这还不是寻求历史教训的唯一要求。第二个要求是,对每一个想要通则化的现象,都要先转化为清楚的语词(变项),再转化为可以作为变项指针的量化型式。这就要以各种量化过程把变项「操作化」(operationalizing)(Singer 1982)。最明显的量化类型是「测量」(measurement):以公分来测量高度,以度数来测量气温,以芮式规模来测量地震强度,以时速来测量加速度,许多物理现象都以科学上可接受的度量衡来量化操作。比较不明显但类似的型态是「计数」(enumeration):女性在国会议员中的比例,一个箱子的酒瓶数,劳动人口的失业比率,一个部队的坦克数目,许多物理和社会现象都用计算数量的方法来量化操作。

  然而,正确的计数需要明确的分类,计算女性、酒瓶、工人和坦克,要比计算危机、忧郁症、小型企业、政治激进派、伟大的音乐家、好老师和经济紧缩等不易定义的现象容易得多。要把一个案例包含或排除于一个范畴,并没有足够清楚和操作的判准。即使有,对于分类标准也没有共识。因此,在遇到不容易量化的事件或状况时-例如国家安全或军事准备-我们得先把分类规则说清楚。

  如果同一领域的多数专家都同意这些分类规则和应用方法,这是最好的状况。这种状况很少在一开始就发生,通常要经过好几年甚至几十年才能达成共识-如何去定义天才、违法者和台风,如何测量合金的硬度、液体的浓度、薄膜的延展度、战争的强度、共犯的罪行度、以及商业周期的长度。然而,最终会出现一些规范,以及关于纳入和排除程序的共识,让我们得以制造科学上有用的资料。因此在今天的国际政治领域,我们有比较清楚的共识去定义主权国家、强国、军事纠纷、内战和国际法,去测量国力、外交重要性和战争的强度与规模(Small and Singer 1982; Gochman and Maoz 1984; and Singer and Die 1991)。不幸的是,许多概念和变项还没有走到这个地步,但这并不造成妨碍-上述概念在刚刚提出和运用时都曾被人质疑。

  如果要从历史学习的话,还必须满足最后一个要求。我们不能只把概今操作化,也不能只检验相关的案例。我们必须用统计方法来分析资料,并注意不让预期和偏见事先决定研究结果。我们的分析不能事先偏向或反对某一理论。我们不只要注意那些符合假设方向的模式,也要注意那些指向其它方向的模式。同样地,统计应该要能告诉我们,观察到的现象偶然发生的可能性有多大,把历史的偶然性和确定的发现区别开来。  

  历史事实检测

  为了从历史纪录中找出正确的通则,我现在要运用上述原则。过去事件的规律性可以产生两种用途。第一种是学术性的用途,企图以检验假设或建设理论的方式来增加我们的知识。在这种用途上,我们要问某种模式是否重复发生?发生的频率?是随时间起落或者循环发生?此外我们还要问,某些变项是否同时出现和消失,这种关系只发生在某些时空,或是更具普遍性?当然,因为Bernard de Voto(1952) 的关系,我们认识到「历史拒斥决定论」。但和他不同,我们也认识到历史可以「容忍偶然」。我们很少发现哪一种变项间的关系在各种时空中都有效。如前所述,我们以操作方法建立资料,来确定发生了什么、何时发生、何处发生和在什么条件下发生。我们以统计方法分析资料,测量模式的规律性,并判断是否只是偶然现象。

  从理论转到实践,第二种用途是在更坚实的基础上建立我们的政策,而不是建立在最近发生的、最戏剧性的、最成功的、最具灾难性的和最容易记得的案例上。这个期望必须检验所有相关案例,而虽然这些例子有很多种诠释,但还是有一些明确的判准。

  我们的想法是要建立「条件性预测」(contingent forcast),意思是说,历史证据可以让我们宣称「如果我们在这些状况下做这些事,最可能的结果就是如此」。在检视过自维也纳会议或一次世界大战以来的所有案例,包括两大强权之间的纷争之后,这些纪录将会显示,哪些行动和反行动会以何种频率产生哪些结果。当然,这类型的预测并不具确定性,因为我们的知识不足、分类错误(把手上案例分到错误的类型里),更因为国际体系就像所有社会和生物体系一样,都是不断发展的,在其中,变项间的关系并不是固定不变的。

  值得注意的是理论和实践的密切关系,正如老话说的:「没有比好的理论更实际的东西」。虽然足够数量的科学研究可以产生有效的「条件性预测」,但这些只是「相关性的知识」(co-relational knowledge),其效力是有限的。但是,如果把正确的研究和创造性的设想结合起来,就有可能得出合理而一致的理论,来解释不同型态的国际战争。虽然我们做了很多设想,但这种理论目前还不存在。虽然很多设想都被称为「理论」,但是若把理论定义成「一致而具解释力的知识」,那么很多设想都是违反历史证据的,我们也根本没有理论。

  当我们进入更高阶段的细致研究之后,只要能解释各个变项间令人迷惑的变化关系,在政策上的报偿就很高。只要我们理解各个时间的变化,也知道造成这些变化的条件,就能更坚实地预测某项政策行动的结果。根据密西根大学「战争关联小组」和其它以同一种方法论观点工作的同仁提供的「相关性知识」,现在要已经有可能作到有政策意义的「条件性预测」(Singer 1980; Gocliman and Sabrosky 1990; and Vasquez and Henehan 1992)

  (以下从略)

  我们以尼克森政府时代的「世界状况报告」,对其中三种说法加以检视。  

  接受战争会鼓励侵略

  首先,我们发现有「如果接受诉诸武力,会驱使其它国家采取同样的行为」这样的句子。我们把这个通则用十种版本和历史证据做比对,发现最正确的说法应该是「如果其它国家不立即和勇敢地援助军事攻击的受害者,在两年内就会有另一场攻击行动」。检视从一八一六年到一九六五年之间的五十场国与国战争,我们发现,只有十三个受害国立刻受到支持,三十七个独自作战。然而,前者有百分之四十六而后者有百分之四十一发生后续战争,这显示援不援助受害国并没有太大的差异。另一种说法是,「如果其它国家不立即和勇敢地援助军事攻击的受害者,战争发动者就会获得胜利」。我们发现,发动者获得胜利的有三十四个案例,其中有百分之三十五后续发生战争。但在发动者失败的十六个案例中,其中有百分之五十六发生后续战争。虽然这并不构成统计上的显著差异(Q=.40; X2=1.96) ,却令人惊讶地显示出:让发动者侵略成功最能保障和平。  

  同盟能吓阻战争

  从一九四五年以后,美国外交政策深受这样一条历史信念的影响:「我们必须建立坚强的同盟,以吓阻可能发动战争的国家」。这反映在「北大西洋公约组织」、「中欧公约组织」、「东南亚公约组织」和「美澳纽三边安全条约」,还有其它双边防御条约的建立。我们不用现成的例子来检视这个信念的有效性,而用拿破仑战争以后的时期来检。

  再一次,这个概念可以有几种诠释。最普遍的说法是:在同盟高度结合期间,国际体系的战争事件最少。虽然这种说法对十九世纪各种同盟类型来说是正确的,这个世纪的状况却正好相反。另一种说法是:对每一个强国来说,在形成正式同盟后,三年内很少或甚至没有战争。反之,在没有同盟的时期,就会有一个或更多的战争。我们发现,在有主要强国同盟的六百四十八年中,只有百分之十八卷入战争,其它百分之八十二没有。然而,在没有同盟的二百三十九年之后,我们也发现同样的比例:百分之十八卷入战争,百分之八十二没有。在历史上,同盟并不会影响主要强国的好战性。

  还有另一种关于同盟吓阻效用的诠释,是去检视「加入」而非已经「身处于」同盟的情况。在这一点上,这个信念更不合乎历史事实:在主要强国加入同盟的一百三十五年中,有百分之二十三卷入了战争,百分之七十七没有。此外,没有同盟形成的七百五十二年中,只有百分之十七卷入战争,百分之八十三没有。更甚者,在七百五十二年没有形成同盟的年份中,只有百分之十七卷入战争,百分八十三没有发生战争。总而言之,以联盟来避免战争是非常不可靠的。  

  维持和平需要实力

  这个普遍化的概念不仅 "有存在的理由",而且或许是最被学术界或政策分析者共同接受的陈腔滥调。此说法是基于 "我们"是和平爱好者, 但 "他们"只懂得使用武力的假设。1971年《世界状况报告》清楚地阐释了这种论点:「维持和平需要武力。只要有人使用武力威胁我们及友邦的重要利益,我们就必须很强」。 但此历史殷鉴有使人们记得军事武力及政治权力的区别吗?

  猛然一看,或许有。也就是说,在五十九个大国介入战争的案例中,三十四件是发生在那些其军事、工业、及人口在主要强国平均实力之下的国家;只有二十五件发生在那些在平均实力之上的国家。然而,若把注意焦点从静态分析转移到变化的方向上,这种不一样的地方则不明显了;也就是说,有三十件发生在权力衰亡期,而二十九件发生在上升期。但是,由于参与国家间的战争是一回事而被迫对敌人的意图作反应是另一件事,我们下面要看的是从1816年来主要强权国家在当他们成为其它主要或次要国家发动战争的目标时的实力。虽然只有九个例子,生命仍有伤亡,当标的物是在平均实力之上且四个是在平均之下;(?)同样地,其中五个是维持稳定或在上升,四个是在下降。差异是小到可以被忽略的。

  当然,经由比较加入战争的大国的实力及它的特定对手,而不是所有的主要国家,尼克森政府的例子较易被公平地检验。当我们只着重在九个大国对大国的战争时,九个中的五个例子,受创国家事实上是经常较弱的,且所有比他的对手还强的四个国家在相对实力来讲是从未下降的。积极来说,没有任何一个大国在比潜在攻击者强且处于上升期时会被攻击。

  但是当我们检验这些未发生战争的例子时,我们发现,相对实力对战争及非战争的影响并不大。 举例来说,我们可以针对每个在前五年其实力在平均水准之上或下的大国,来看这些国家在接下来的后五年是处在战争或和平状态。我们可看到,在实力低于平均水平的国家中,有九十四个走向战争,而仅八十四个在平均之上的国家走向战争;另一方面,在前五年较弱的大国中,在后五年中有126个例子无战争,而在前五年较强的国家中只有52个例子是无战争。当Q值只有.19且 小于c2 的 1.37值时,这个模式必然令人质疑军事力量的效用。如果我们测量的不是能力高低的问题,而是上升及下降的问题,答案也是一样的。

  从这三个例子可得到一个相当实际的目的。它们显示,只要仔细观察相关的例子,对于关键变量操作性或数值的发展(或二者)及合适的转换口头上的政策问题成为小心操作的统计分析,则我们较能正确地预测历史经验。此种方式使我们较不会骤然的接受某种具备易适用性特质的通则或是过份确定此种符合普遍在决策中心人物心中先入为主观念的通则化。  

  中国军事经验的例子,1949-1992

  若是我们想从历史教训中学到一些重要的经验,一些重要要求是必须考虑的,且配以一些例证,现在让我们把重点转向当下的考虑。 亦既是说,我们现在需要检视于统计分析中对于中国介入国际冲突中的一些具代表性的模式,在此方面,我们藉助于Alastair Iaian Johnston 于1998年的中国季刊上 的相当杰出的分析。取用于我的同事所主持的研究计画的数据库(Correlates of War Project), Johnston 检视相当多的例子,且成为首先用较科学及计量的方式来分析中国外交政策的学者之一。到1992年为止,我们可从中国介入世界冲突的例子中的到什么样的通则?

  中国是所有大国中第二个最易有纠纷倾向的国家。平均每年2.74次?军事冲突,比起美国的3.93次 及远远被拋在后面排名第三且的英国的1.89次。当大部分(66%)中国的介入国际纠纷集中在1969-1973时期,邓小平时期的战争只是稍微低于介入纠纷的边缘,亦既单方或双方作了明显的武力威胁,展示或动员武力,或是在战争边缘的诉诸武力。49%的纠纷都是起因于领土纠纷,而不是政体的不同或是政策不一致所引起。 现在,转移战争的频率到战争的伤害程度,比起其它大国以及印度,中国常常倾向高程度,亦即比起动员或展示武力,更接近过分使用武力。另为一个角度是,当战争来临时,中国倾向于比其对手更易把战争层次拉高且相当少会对敌人的挑衅不太反应或低度反应。 在此文章中,我希望阐释用较系统及科学方式来研究中国外交及军事政策的价值及可行性。基于高风险性(赌注),若是不能有效地使用可用方式,则似乎会使研究中国问题蒙上不幸的阴影,更不用提到其它地区了。但是就像此篇文章前面所点出的,此比只是阅读及记忆历史需要花更多努力。我们需要发展兼具对历史研究及科学方法严谨的研究态度。