博弈论与战略互动

nicholasxw · 发表于 2009-6-1 16:09:36

作者：陈宏

文章来源：《外交评论——外交学院学报》2007年第2期

摘要: 谢林对博弈论与战略互动的分析以国际政治的“ 非零和游戏”特征为基本假定, 他超越了理性主义的研究范畴, 关注非理性因素在战略互动中的作用, 并试图对非理性行为加以分析。战略行动的本质是通过自己的行动去影响他人对自己将如何行动的期望从而影响他人的选择, 并最终形成有利于自己的结果。

关键词: 博弈论; 战略互动; 理性主义

托马斯·谢林( Thomas C. Shelling) 是美国著名学者、经济学家, 同时也是研究外交事务、国家安全、核战略与军备控制的专家。他和罗伯特·奥曼(Robert J.Aumann) 一起分享了2005年诺贝尔经济学奖。谢林曾受到过严格的经济学的训练, 最初也曾致力于传统经济学的研究, 以后研究兴趣逐渐转移到核战略与军备控制等国际政治领域中来。1960年, 谢林发表了其经典著作《冲突的战略》, 对讨价还价理论和冲突管理理论作了细致的分析。因此,谢林认为国际政治本质上是一种“ 非零和游戏”,因为大部分的所谓国际冲突都存在某些共同利益,都可以看成是一种讨价还价的情形, 冲突各方需要合作以协调彼此的战略。谢林所有的国际战略理论都建立在这一假定基础上。

一、博弈论与社会科学

( 一) 理性主义与超越理性主义: 谢林博弈论的理论基础

谢林首先是一个提倡理性合作论的学者, 他创造性地扩展了博弈论的应用范围并在各个领域提出了原创性的理论洞见, 尤其是在国际关系领域,他的学术兴趣紧扣现实主题, 尤其是针对冷战期间美苏两个超级大国之间的核竞争。作为一名国际关系研究学者而言, 我们很难把他称为是一名现实主义者或是一名自由主义者, 因为他强调国际政治的参与者既存在共同的利益又存在相互冲突的利益。谢林强调国际战略的丰富议题正是来源于“ 国际事务既有相互依存又有相互对立的事实。”[1](P4)纯粹的冲突只有在以完全消灭对手为目的战争这种极端的情形下才存在。即使在战争中也存在某些共同利益如避免相互毁灭的行为, 这就需要合作和相互协调。因此, 谢林认为国际政治本质上是一种“非零和游戏”, 谢林所有的国际战略理论都建立在这一假定基础上。从谢林强调讨价还价的理性实质来看,他是一个典型的理性主义者; 从谢林强调合作以协调彼此战略这点来看, 把他看成是一名自由主义者也是有道理的。所以, 总体上说, 他是一个理性合作论者。谢林的理论大部分方法属于理性主义的研究方法。他认为理性假定有利于构建理论体系。但他始终关注非理性因素在战略互动中的作用, 并试图对非理性行为加以分析。从这一点上说, 他又超越了理性主义的研究范畴。

主流国际关系理论, 无论是新现实主义还是新自由制度主义, 其理论基底都是理性主义[2](P12)。理性主义把国家定义为追求国家利益最大化的行为体。而这种理性又与新古典经济学的理性概念有许多相似之处。理性选择理论( Rational Choice Theory, 简称RCT) 是新古典经济学的理论基石。这种理性主要体现在新古典经济学关于理性人的假设上, 即假定个人在任何情景下都追求效用最大化。效用是偏好的函数, 偏好只要满足完备性和传递性就可以体现为理性。这种关于理性的过于简化的假定限制了理论的适用范围。首先, 垄断是经济的常态, 完全竞争的市场只是理想类型, 从来没有存在过。垄断条件下个人的决策必然受到他人决策的影响。而各种制度的存在如保护私有产权和自由交换的法律制度也是社会中互动的个人经过实践活动长期创造和演化的结果。围绕新古典经济学核心理念发展起来的一般均衡分析和比较静态分析对垄断和制度演化问题的解释力很弱; 其次, 新古典经济学的理性假设使经济学变成了一门“ 去伦理化”的学科,由于抽掉了人的因素, 比如人类的同情心、正义感、道德意识等伦理因素, 人类变成了在这个冷冰冰的地球上精于算计、冷酷无情的动物。

博弈论既继承了理性主义合理的成分, 又恰恰能够弥补理性主义的这些欠缺。首先, 它研究的是其行动将相互影响的决策者们的行为。可以说, 只要行为结果依赖于两个或两个以上的决策者的共同影响, 博弈论就有用武之地。国际关系理论研究的是国与国之间的冲突与合作, 其中很重要的一部分是国与国尤其是大国之间的战略互动, 研究相互依存的决策者的行为, 而博弈论正是研究类似问题的一种强有力的分析工具; 其次, 博弈论为研究伦理问题提供了一个方便的研究方法, 使我们在研究人类互动时, 不必再僵硬地坚持新古典经济学中理性人的假设。其实, 古典经济学从来没有忽视道德情感因素在社会生活中的作用, 亚当·斯密的《道德情操论》比《国富论》早17年出版。斯密认为人类与生俱来的同情心要求人类推己及人, 在我们的利益与他人的利益发生冲突时能够尽量公正[3](P163)。从这个意义上讲, 新古典经济学背离了斯密的传统。

主流国际关系理论也深受新古典经济学理性主义的影响。我们以现实主义和自由主义理论发展的历史线索为例来说明这个问题。古典现实主义的学者卡尔( E. H. Carr) 和摩根索( Hans J. Morgenthau)尽管都强调权力在国际政治中的核心作用, 但两人都强调国际道德和意识形态在维护权力的合法性方面的重要作用。卡尔在批判乌托邦主义的同时,也强调国际关系需要在权力与道德之间寻求妥协和平衡。指出“ 若要在国际关系中建立有序的和平变革程序, 也必须寻找某种方法, 使这种变革不仅基于权力, 而且也基于权力与道德之间艰难的妥协, 因为这种妥协是一切政治生活的基础。”[4](P197)摩根索则把道德看成是一种能够在某种程度上限制权力的因素, 并认为当今世界民族主义的泛滥弱化了国际道德对权力政治的这种限制作用[5](P265- 295)。

自由主义的早期形态— —理想主义甚至把道德置于权力之上。到了沃尔兹( Kenneth N. Waltz) 的结构现实主义和基欧汉( Robert O. Keohane) 的新自由制度主义, 国家就成了单一的理性行为体, 在既定的结构和制度环境下寻求自我利益的最大化, 道德因素被弱化到最小的程度, 自然也就忽视人类情感因素在促进人类合作中的重大作用[6] [7]。在新现实主义那里, 理性假设必然导致冲突是国际关系的常态的论断; 在新自由制度主义那里, 制度可以促进合作, 但制度始终笼罩在权力的阴影之下, 国际制度的创立尤其依赖于权力, 人类合作的总体前景暗淡。这是理性排斥情感与道德的必然结果。理性主义在国际关系研究领域的主导地位是科学行为主义影响的必然结果。道德与情感等社会因素被视为非科学因素而被排斥于研究领域之外。所幸的是, 博弈论为我们研究人类情感和道德因素提供了工具。如今博弈论不仅用来分析核威慑、军备竞赛等现实主义议题, 也用来分析制度的设计与演化如何能促进国际合作这一自由主义核心命题。而演化博弈论和实验博弈论则用来研究包括道德因素在内的文化传播与变迁, 与建构主义的研究范式有着很大的结合空间。可见, 博弈论超越了理性主义的分析方法, 具有更广泛的应用领域和适用范围。

( 二) 相互依存的决策理论: 博弈论的基本概念和方法

我们在这里用囚徒困境的例子说明博弈论的基本概念和方法。囚徒困境是20世纪博弈论最有影响的实例, 它预设了以下几种情景: 两个被抓获的囚犯面临这样的处境, 如果其中一人坦白他们的罪行则他将免于刑事处分, 而另一个拒不交代将被判10年徒刑; 如果两人都不坦白, 则由于司法当局缺乏足够证据只能判两人1年徒刑; 如果两人都交代了自己的罪行, 则两人都将被判处3年徒刑。显然, 对两个人来说, 最好的选择应该是互相合作拒不交代, 这是一个“ 帕累托最优”。问题在于, 这个选择组合是不稳定的, 因为每个人都害怕对方交待, 使自己成为牺牲品, 因此便会选择交代而谋求自己更大的利益。理性计算的结果是两人均选择不合作。

按照纳什均衡的定义, 如果存在一个所有参与者选定战略的一个组合, 在这个组合中, 每个人的战略都是针对其他人战略的最优反应, 这个组合就是纳什均衡。在囚徒困境中, 双方不合作是唯一的一个纳什均衡。这一结果可用如下矩阵表示:

图1中“ 囚徒1”、“ 囚徒2”代表两个博弈人, 他们都有“ 不坦白”和“ 坦白”两中可选择的策略, 矩阵中的数字表示双方不同组合策略下的收益组合,第一个数字为“ 囚徒1”的收益, 第二个数字为“ 囚徒2”的收益。该博弈的纳什均衡为双方都坦白这一策略组合, 亦即两个囚徒相互不合作。

依自我利益为目标的理性行为, 却导致对每个人都较差的结果, 这一惊人的结论给现代社会科学带来了深远的影响。它揭示个体理性深刻的内在矛盾—— 从个体利益出发的理性选择行为最终不但不能保证个体的最大利益, 而且损害了集体利益。它还颠覆了自斯密以来的那种教条, 即个体利益和社会利益总是相和谐的。它提出了这样一个深刻的问题: 如果每个人都依据或仅仅依据理性原则来行事, 那么人类的合作何以成为可能呢?

囚徒困境揭示了人类社会中存在的许多相似的情形, 从军备竞赛到环境污染到资源的过度开采。囚徒困境是对现实的高度简化和抽象, 省略了许多关键问题。后来的许多学者在此基础上添加了不同的条件, 得出许多有益的结论。1.囚徒困境是两人博弈, 而现实中更常见的是多人博弈。多人博弈有可能形成联盟, 这对研究国际关系中的联盟行为尤其具有重大意义; 2.囚徒困境中两人不允许交流, 如果允许彼此之间相互交流以协调彼此的战略, 则结果将极为不同;3.囚徒困境是一次性博弈, 实际的国际关系中往往是多次博弈, 而重复博弈则将产生不同的结果。

那么, 如何避免类似于囚徒困境的结果呢? 第一, 如果博弈各方彼此之间能够建立起信任关系,那么他们就会采取合作战略以争取双赢。建构主义主张人类能够通过长期实践与社会互动建立一种基于信任与合作的康德文化, 从而从根本上克服囚徒困境问题; 第二, 如果博弈各方能够彼此签订有约束力的合约, 彼此承诺采取合作以谋求共赢。或者有一个强有力的机构强制各方执行合作战略, 则也可以避免囚徒困境。而国际体系既缺乏有效的司法体系以惩罚违约者, 也缺乏中央政府以强制各方执行合作战略。由霸权国提供的国际机制并不稳定且并不总具备合法性。这从另一个侧面证明了现实主义的观点, 是国际政治的无政府性质造成了囚徒困境; 第三, 重复博弈能够在一定程度上缓解囚徒困境。博弈理论有一个无名氏定理, 该定理说, 重复性的博弈很有可能产生合作性的结果。这一定理没有得到充分的证明, 更多的是由直觉告诉我们。而在无限重复博弈中, 合作则只是被证明有可能。阿克塞尔罗德( Robert Axelrod) 通过计算机仿真证明如果博弈各方采取“ 一报还一报”战略, 从长期看有助于合作的形成[8]。

囚徒困境在当代经济学、社会学、政治学等社会科学领域均有独立的学术地位。它对人类理性提出的质疑继续影响着社会科学理论的发展方向。

二、博弈与冲突的战略

( 一) 非合作博弈与谢林点(Schelling Point ):谢林国际关系理论的基本假定及方法论

《冲突的战略》一书的主要目的在于建立一种基于博弈论基础上的统一的国际战略理论。谢林认为许多人类互动现象包括国际冲突都适合用非合作博弈理论加以描述。国际战略层面上的各种战略如威慑、裁军、有限战争等都属于这类现象。这是谢林国际战略理论总的立论基础和出发点, 是我们从总体上把握谢林国际战略理论的关键。

我们知道博弈论的目的是希望找到稳定的、可预测的人类互动行为模式。这种模式在博弈论中被称为均衡。围绕这一模式博弈论发展出最重要的均衡概念就是纳什均衡。纳什均衡是纯数学性的, 往往存在许多个纳什均衡解。一般的博弈论学者给出具有特定结构的博弈论模型, 从数学上证明或找出某种均衡解就算大功告成。为了寻找更为合理的纳什均衡, 博弈论发展出子博弈精炼纳什均衡的概念, 不过这种方法仍是数学的。但谢林并不满足于这种方法, 他进一步追问, 如果将其应用于真实的人类互动, 那么哪一个均衡是我们所希望的呢? 谢林的答案是: 只有引入非数学因素才能给出进一步的答案。这些因素包括法律的、道德的、文化的、心理的因素。在运用博弈论进行分析讨价还价行为时, 谢林强调有三条须重视: 第一, 不能让对博弈的纯数学分析占据主导地位; 第二, 在构建博弈论模型时, 我们往往抽象掉许多细节, 而这些细节对博弈结果往往有我们所想不到的重要影响; 第三, 混合动机博弈经验因素至关重要。谢林据此得出一条根本性的结论: 有关战略原则的规范理论不可能运用纯粹分析的办法得出[8](P162- 163)。以上我们可以清楚地看到作为非数理博弈创始人的谢林与一般纯粹数理博弈论学者的区别。这里借用著名博弈论专家迪克西特的论点: 谢林在两个方面把博弈论带回了我们的生活。第一, 他把抽象严谨的博弈论数学模型用一个个我们所熟悉的故事表达出来; 第二, 他极大地扩展了博弈论的应用范围, 使博弈论摆脱了纯粹数学分析的局限性。其方法可以运用到所有研究人类互动的领域[9](P213- 229)。由此我们也可以理解谢林提出的要把博弈论作为统一的社会科学的方法的观点。

在真实的国际环境下采取何种战略才能达到我们所期望那个的目标呢? 很显然, 要使谈判的各方达成均可接受的协议, 谈判的每一方都必须考虑谈判对手的想法, 也就是必须对谈判各方的期望进行协调。存在许多因素能使各方的期望趋同, 为说明这些因素是如何起作用的, 谢林提出了聚焦点( focalpoint) 的概念。它是指博弈各方共同规避或共同认可的一些事项, 这些事项使得博弈中的各方能够具有协调彼此期望的基点。某一显著的自然或社会标志物都可以成为谢林点的基础。如荒野中的一座小桥可能成为失散的游客找到彼此的逻辑地点, 这座小桥就是聚焦点。某些不具有聚焦点性质的均衡就会被排除掉, 因而缩小了选择范围。具有这类性质的协调被称为默式协调( Tacit Coordination) 。在缺乏沟通的情况下共有的某些知识和经验会使他们的想法趋同。二十世纪六十年代, 谢林曾在课堂上做了一个实验, 他问学生们一个问题, 假如有一天你须在纽约和一个朋友会面, 但不知具体时间和地点, 你会在何时何地与朋友见面? 结果大部分学生都选择中午12点在中央车站的大钟下面找朋友。中央车站的大钟和中午12 点就是使默式协调成为可能的聚焦点。谢林把有限战争看成是一个默式协调问题。因为在有限战争中存在着广泛的利益分歧和大量的不确定性, 同时也害怕寻求谈判会被对手视为急于达成协议的软弱的信号, 公开谈判和沟通很难做到。但在有限战争特别是核时代的有限战争条件下, 战争各方又都存在避免战争升级和减少战争损失的共同利益, 这就使研究默式协调这类问题极有意义。先例、传统甚至心理因素都有助于“ 聚焦点”的形成。在有限战争中一些具有这类性质的因素有山川河流湖泊等自然因素, 也有其他社会或文化因素。例如朝鲜战争北纬38度线, 二战期间对不使用毒气的默识。

可以说,《冲突的战略》一书贯穿的一条主线就是如何在冲突中发现聚焦点并实现战略协调。

( 二) 国际战略与有效沟通

谢林认为, 战略行动的本质是通过自己的行动去影响他人对自己将如何行动的期望从而影响他人的选择, 并最终形成有利于自己的结果。这里有效的沟通是战略成功的关键。谢林的国际战略理论主要内容有:

( 1) 谈判的力量来自于限制自己的力量: 讨价还价理论的实质

讨价还价过程包括公开的和不公开的两种, 后者是指对手之间互相猜测和解读对手的行为, 每一方都认识到自己的行为正在被解读和预测, 每一方都根据自己所创造的预期而行事。在存在多种可能的结果的情况下, 谢林认为讨价还价行为的实质就是通过一些主动的、不可逆转的牺牲自己某些选择的自由来限制对手的选择自由从而达到自己所希望的结果。限制对手只有通过束缚自己才能做到。在讨价还价过程中弱势一方反而具有优势, 自由选择在某种意义上意味着选择让步的自由。讨价还价的力量来自与束缚自己手脚的力量[1](P28- 34)。如果一方不能再让步, 那么只有另一方让步才能避免谈判破裂。这里的关键是让对手相信你再也不能让步了。

这里谢林提出了两个重要的概念: 可置信承诺和可置信威胁。承诺与威胁都是限制自己行动的言语或行为的战略, 前者固定自己的行动, 后者固定对对手行动将如何反应的行动。承诺与威胁的目的都是通过这种战略行为引诱或迫使对手选择对自己有利的战略。承诺与威胁奏效的前提是使对手相信自己有执行这种不可逆转的、不可撤销的战略的利益和动机。要通过行动尽量减少对手怀疑自己战略的空间。将军下令炸毁部队后面的桥梁也许是明智之举, 尽管这一举动缩小了自己的选择空间, 但它同时也缩小了对手的选择空间, 而且它形成了一个看得见的可信的威胁: 退路已断, 作出誓死抵抗的姿态迫使进攻方放弃进攻以避免两败俱伤。中国历史上著名的破釜沉舟、背水一战都是可置信威胁的例子。如果撤销承诺或威胁的成本很高, 可置信承诺或威胁产生作用的可能性就很大。

为增加承诺与威胁的可信度, 谢林主张有时可采取把一次大的行动分解为小阶段采用小步骤予以实施的策略, 谢林称之为渐进策略( salami tactics) 。一次性的大规模行动成功的可能性不大, 而小规模行动成功的可能性就增加了许多。在国际关系中缺乏信任的国家之间也需要采取一些小步骤来逐步建立互信, 这使我们想起中美“ 乒乓外交”的著名例子。谢林提出这个思想的时候, 博弈论还没有发展出合适的分析工具对之加以证明。直到2002年才由他人证明: 在由两人组成的博弈中, 如果公共物品由私人来提供, 那么由双方分成几次轮流提供的总公共物品大大多于由每一方只一次性地提供的公共物品总量。通过逐渐增加自己的贡献, 并威胁如果对方采取搭便车行为自己将停止贡献, 使总物品得到有效供给[10]。谢林的直觉和洞察力又一次得到验证。不过, 他的这个思想来自于美国战略所面临重大问题,也是为当时的美国利益服务的。二十世纪五十年代中期至六十年代初, 华盛顿采取的“ 大规模报复战略”在苏联的核导弹已能打到美国本土的情况下已不切实际。谢林论证无须进行核战争而只需在边缘地区采取逐步反应的战略也能取得冷战的胜利。在中国的古老智慧里就有“ 小步快跑”这种类似的渐进战略。中国的改革开放也采取“摸着石头过河”的渐进战略以避免类似俄罗斯一次性的“休克疗法”给社会经济所带来的冲击。

谢林认为, 对付威胁的一个有效办法就是故意截断沟通渠道使对手知道威胁信号不能到达, 威胁就不能起作用。这种情形可以用博弈论中的“ 性别大战”来说明。夫妻两人希望周末在一起。同时丈夫希望看足球, 妻子希望看芭蕾。前提条件是两人都不愿分开。在相持不下的情况下, 如果妻子告诉丈夫她已决定晚上看芭蕾, 然后关掉电话, 则丈夫只有去看芭蕾。

( 2) “恐怖核均衡”的合理性: 核威慑与核裁军理论博弈论为建立一个统一的威慑理论提供了有效的方法。作为一种国家战略的威慑, 其目的在于影响对手的选择以达到有利于自己的结果, 威慑战略成功的关键在于影响对手对自己如何行动的预期,并且要有具有说服力的理由让对手相信自己如何行动取决于对手如何行动。

二十世纪六十年代, 核战争的阴云笼罩世界。许多美国冷战专家认为, 只要苏联能够发动让美国丧失还击能力的突然袭击, 核战争就难以避免。他们建议美国核武器分散在世界各地, 加大美国核武器的可移动能力, 同时通过谈判促使苏联削减核武器和洲际导弹。在这种情况下, 如何应对突然袭击成为各国政界和学术界的重大课题。

谢林把突然袭击形象地比为类似以下情形的博弈问题: 晚上我举着枪下楼去查看楼下的动静是怎么回事, 却和手上也举着枪的窃贼迎面相遇。这时就有可能发生双方都不愿见到的结果。即使窃贼只想安全离开, 而我也希望他这样, 仍然存在一种危险, 即他认为我会开枪而被迫先开枪。更糟糕的是,危险还在于他会认为我会认为他会开枪而先开枪,或者他会认为我会认为他会认为我会开枪等等以至无穷[1](P207)。突然袭击问题的实质就是担心别人会错误地认为我们会首先攻击他而首先攻击我们, 我们不得不首先攻击别人。攻击的动机来自于彼此之间互相不断的怀疑。相互之间缺乏信任是这类问题的本质特征。

传统的裁军理论认为, 为防止战争爆发或限制战争的范围与降低战争的残酷程度, 各国应首先裁减那些杀伤性强的进攻性武器。核裁军被认为是防止突然袭击的重要手段, 是全面裁军的基础。二十世纪五十年代中期美国政府对苏联提出的“ 开放天空”政策其目的就是要监控对方的核设施以减少突然袭击的可能。谢林认为, 防止突然袭击的关键不在裁军, 而在于让对手相信我们没有首先攻击对手的动机, 应尽量采取措施减少对手对我们的猜疑。我们不但要确保对手没有首先攻击我们的动机, 还要向对手确保我们没有首先攻击的动机。主动地透露一些相关信息反而有利于降低突然袭击发生的概率。另一方面, 谢林认为, 设法使敌人对我们发动突然袭击变得困难固然是一种办法, 但更有效的办法是消除敌人首先发动突然袭击的优势, 使这种冒险没有任何好处。因此, 威慑的关键不是现在所具有的毁灭敌人的能力, 而是在经受敌人打击后还能毁灭敌人的能力即报复的能力, 报复能力比抵御攻击的能力更重要。最好的核武分布是双方都有还击能力, 或者任何一方都不具有一次性毁灭对手还击能力的能力。只有保护好具有报复能力的武器, 威慑才会真正发挥作用。从这个意义上说, 保护导弹发射井比保护居民区更重要[1](P233)。因为这是确保还击能力的关键, 只要想办法保护好报复的力量就没有必要害怕对手会实施先发制人的突然袭击, 突然袭击就不是一个可置信的威胁。从这个意义上来说“ 恐怖核平衡”尽管恐怖, 却也是防止核大战的唯一稳定的有效机制。谢林据此得出了不同于传统裁军理论的结论: 核裁军不一定导致战略稳定, 而一定程度上的核军备竞赛也不一定会导致战略不稳定, 核裁军也不是裁减常规武器的前提[1](P237)。从理论上来说核武器越多, 则在经受住对手的第一次打击之后生存下来的核武器就越多。一方的核武器越多, 对手需要毁灭包括己方报复能力的核武器数量就会成倍增长。当然这并不是说核武器越多越好,它的数量还要受到各国预算能力的限制。

( 3) 危险的游戏: 不确定性战略与边缘政策理论在混合动机的博弈中, 有时需要采用承诺与威胁行动让对手预测到自己的行为以利协调彼此的战略。但在某些情况下, 威胁或承诺的成本太高以至于无法实施从而减少了可置信性。如用“ 大规模报复战略”对付边缘地区的小规模战争就是一个威慑过头的例子。这时可以引入适当的概率机制降低行动的期望成本。因此, 不确定性本身就构成一种威慑。有限战争本身作为一种威慑手段具有确定的目标, 但谢林认为有限战争还加大了引起全面战争的风险。战争行为本身就充满了各种不确定性, 谁也无法完全控制战争进程。随着有限战争的逐步升级, 引起全面战争的概率也越来越大, 这本身就是一种威慑。当然, 不确定性战略不是模糊战略, 后者会宣称“ 我也许会也许不会采取某种战略”。不确定性战略的实质是通过一些有意识的行动来表明自己已经无法控制局势, 使对手相信局势就要失控, 从而加大了灾难性结果出现的风险。这种行动称之为“边缘政策”(Brinkmanship)。一种不确定性的威慑反而比公开宣布一种确定性的威慑效果要好,最好的办法就是让对手相信你越来越无法控制局面, 危险性越来越高。“边缘政策”可用“ 胆小鬼博弈”( Chicken) 加以分析: 两人高速驾车同时驶向对方, 如果一人在最后时刻转向, 此人就输掉比赛, 被称为胆小鬼; 如两人都没有转向, 两人均车毁人亡;如两人均把车转向则双方都没有损失。“ 边缘政策”就像两辆急速对向而开的车, 一人威胁对方说不惜车毁人亡也要冲到最后, 然而这种威胁却未必奏效, 它不是一个可置信威慑。如另一方也采用这一威慑政策, 最坏的结果就会产生。如果这种情况发生在国际关系中, 就意味着战争爆发, 这就是第一次世界大战爆发的情形。如果一个车手把方向盘拆掉并高举着让对方清楚地知道自己已无法控制车子, 随着两车越驶越近, 车毁人亡的危险性就越来越大, 对手就会让步以避免最坏结果。在国际谈判中如果能让对方相信自己已无法控制国内局势,无法再作让步, 则对手多半会让步。

三、谢林理论的贡献与局限

20世纪后半叶的现代社会科学已深深打上了谢林的烙印。受谢林的启发, 现代博弈论学者分别在制度和伦理文化两个向度上继续深化研究, 它们构成了当代学术的前沿。运用博弈论研究制度的代表是美国经济学家安德鲁·肖特( Andrew Schotter) 的《社会制度的经济理论》, 这是一部用博弈论方法系统研究人类社会制度的学术著作。肖特的制度分析明显受谢林的影响。他认为人类制度的出现主要是为了解决人类社会中普遍存在的囚徒困境和其他协调博弈问题。如果一个社会反复地面临某种类似囚徒困境的情形, 那么一个有效率的做法是演化出某中行为规则, 以避免没有效率的某种结局。这种规则能约束人们的机会主义行为[11](P36- 38)。可以把社会制度的产生看成是一种由重复博弈而形成的非合作均衡。肖特认为人类的大多数制度是自发产生的结果, 是由个体的分散决策演化而来, 这又证明了哈耶克的自发社会秩序理论①。运用博弈论研究政治哲学和伦理问题的代表是宾默尔( Ken Binmore)《博弈论与社会契约》一书。该书试图把人类思想史上的巨人霍布斯、休谟、卢梭、康德、斯密、罗尔斯等人的思想用博弈论模型一一演示出来[12](P2)。桑塔费学派则试图融合实验博弈论、文化人类学、经济学等学科进行跨学科的研究[13]。在国际关系理论研究领域, 我们甚至可以将权力、制度、文化等要素在博弈论的分析框架之内统一起来, 使我们更能客观地比较各个流派的优点和不足, 加强不同学派的交流与对话, 推动学科的进步。

应该指出, 谢林理论的许多方面存在着不足,主要表现在他对许多现实问题的随意解读上, 影响了其理论的严谨性。如他把二战期间各国没有使用毒气说成是各国无法在使用毒气上形成共识, 不使用毒气是各方的聚焦点, 这一解释非常牵强; 又如他试图运用他的理论寻找在有限战争中如何使用小型核武器的规则, 目的显然是维护美国的霸权地位; 另外, 谢林在某种程度上夸大了博弈论的作用。理论总有其边界, 无所不包的理论从来没有过。如果博弈论成为万能理论, 那么它的理论价值也就没有了。

谢林的理论对社会科学和国际关系学都产生了重要的影响。在《冲突的战略》一书的前言中, 谢林说人类活动的事例是构建理论所必不可少的, 它们不应分离。任何所谓的纯理论无一不是起源于对现实问题的关注。对理论观念的澄清就是对现实问题的确认。理论的功能不只是阐释现实, 也是为了改造现实。这对今天的中国国际关系理论界尤其具有启发作用。谢林把博弈论从抽象的数学王国带回我们的现实生活, 使之成为我们理解我们自己和我们生活于其中的世界的强大工具。谢林还给了我们这样的启发: 深刻的思想完全可以用简洁的语言来表达, 而深刻的思想就来源于我们对生活的领悟和观察。

注释：

①哈耶克认为, 自发社会秩序所遵循的规则系统是进化而非设计的产物, 而且这种进化的过程是一种竞争和试错的过程, 因此任何社会中盛行的传统和规则系统都是这一进化过程的结果。参见哈耶克著, 邓正来译:《自由秩序原理》, 三联书店, 1997年版。

参考文献：

[1]Thomas C.Schelling.The Strategy of Conflict[M].Cambridge,Mass.:Harvard University Press,1980.

[2]亚历山大·温特.国际政治的社会理论[M].秦亚青译.上海:上海人民出版社,2000.

[3]亚当·斯密.道德情操论[M].蒋自强,等译.北京:商务印书馆,1997.

[4]爱德华·卡尔.20年危机:国际关系研究导论[M].秦亚青译.北京:世界知识出版社,2005.

[5]汉斯·摩根索.国家间政治[M].徐昕,等译.北京:北京大学出版社,2006.

[6]肯尼思·华尔兹.国际政治理论[M].信强译.上海:上海世纪出版集团,2003.

[7]罗伯特·基欧汉.霸权之后:世界政治经济中的合作与纷争[M].苏长和,等译.上海世纪出版集团,2001.

[8]Robert Axelrod.The Evolution of Cooperation[M].New York:Columbia University Press,1999.

[9]Avinash Dixit.Thomas Schelling’s Contributions to Game Theory[J].Scandinavian Journal of Economics,Vol.108,No.2(Spring,2006).

[10]陈太明.基于博弈论视角的冲突与合作--奥曼与谢林的学术贡献评介[J].天津商学院学报,2006,(6).

[11]安得鲁·肖特.社会制度的经济理论[M].陆铭,等译.上海:上海财经出版社,2003.

[12]肯·宾默尔.博弈论与社会契约(第一卷)[M].王小卫,等译.上海:上海财经出版社,2003.

[13]赫伯特·金迪斯,萨缪·鲍尔斯.走向统一的社会科学[M].浙江大学跨学科社会科学研究中心译.上海:上海世纪出版集团,2005.

		自动登录	找回密码
密码			注册

博弈论与战略互动

相关帖子

浏览过的版块