(ngkai)上传至★常青书吧★:http://bbs.ourtw.com Thinking Strategically The Competitive Edge in Business , Politics , and Everyday Life 策略思维——商界、政界及日常生活中的策略竞争 [美]阿维纳什·K,迪克西特 Avinash K.Dixit    巴里·J.奈尔伯夫        Barry J.Nalebuff /著    王尔山/译    王则柯/校 中国人民大学出版社 内容简介 耶鲁大学教授奈尔伯夫和普林斯顿大学教授迪克西特的这本著作,用许多活生生的例子,向没有经济学基础的读者展示了博弈论策略思维的道理。试看一例: 奈尔伯夫大学毕业的时候,在剑桥大学的正式舞会上参加轮盘赌游戏并且以700:300的大比数领先,眼看大奖在望,鬼使神差他却无视己经具有的后动优势,在最后一轮大意先行,结果功败垂成。事后他回忆那天酒喝多了,忘记了博弈论的教导:领先的时候要采取让对手先行的保守策略。这位博弈论的高才生,就这样输在原来处干第二位并且曾经求和建议分享奖励的女士手下(参见本书第一章)。 人生是一个永不停息的决策过程。从事什么样的工作,怎样打理一桩生意,该和谁结婚,怎样将孩子抚养成人,要不要竞争总裁的位置,都是这类决策的例子。你不是在一个真空的世界里做决定,相反,你身边全是和你一样的决策制定者。虽然冲突的成分很多,但是合作的因素也不少。本书将帮助你学会策略地思考,在人生博弈中扩大胜面。 本书以讲故事取胜。它的学术根源,是迪克西特教授在普林斯顿大学公共与国际事务学院开设的“策略博弈”课程。简而言之:这是关于了解对手打算如何战胜你,然后你战而胜之的艺术。怎样打赢一场网球,少数如何战胜多数,为什么要“喜爱”你最讨厌的对手等等,都在讨论之列。 这是一门新兴的策略科学,由一些简单的基本原理组成。不同背景和行业的读者掌握了这些原理,运筹帷幄取得胜利的本领就会上升一个层次。 “当代世界学术名著”出版说明 中华民族历来有海纳百川的宽阔胸怀,她在创造灿烂文明的同时,不断吸纳整个人类文明的精华,滋养、壮大和发展自己。当前,全球化使得人类文明之间的相互交流和影响进一步加强,互动效应更为明显。以世界眼光和开放的视野,引介世界各国的优秀哲学社会科学的前沿成果,服务于我国的社会主义现代化建设,服务于我国的科教兴国战略,是新中国出版的优良传统,也是中国当代出版工作者的重要使命。 我社历来注重对国外哲学社会科学成果的译介工作,所出版的“经济科学译丛”、“工商管理经典译丛”等系列译丛受到社会广泛欢迎。这些译丛多侧重于西方经典性教材,本套丛书则旨在译国外当代学术名著。所谓“当代”,我们一般指近几十年发表的著作;所谓“名著”,是指这些著作在该领域产生巨大影响并被各类文献反复引用,成为研究者的必读著作。这套丛书拟按学科划分为若干个子系列,经过不断的筛选和积累,将成为当代的“汉译世界学术名著丛书”,成为读书人的精神殿堂。 由于所选著作距今时日较短,未经历史的充分洗炼,加之判断标准的见仁见智,以及我们选择眼光的局限,这项工作肯定难以尽如人意。我们期待着海内外学界积极参与,并对我们的工作提出宝贵的意见和建议。我们深信,经过学界同仁和出版者的共同努力,这套丛书必将日臻完善。 中国人民大学出版社2002 年6 月 “经济学系列”策划人语 经济学到了20 世纪才真正进入一个群星璀璨的时代。在20 世纪,经济学第一次有了一个相对完整的体系。这个体系包容了微观经济学和宏观经济学这两个主要的领域。经济学家们在这两个主要的领域不断地深耕密植,使得经济学的分析方法日益精细完美。经济学家们还在微观和宏观这两个主干之上发展出了许多经济学的分支,比如国际经济学、公共财政、劳动经济学等等。体系的确立奠定了经济学的范式,细致的分工带来了专业化的收益。这正是经济学能够以加速度迅猛发展的原因。 走进经济学的神殿,人们不禁生出高山仰止的感慨。年轻的学子顿时会感到英雄气短,在这个美仑美奂的殿堂里做一名工匠,付出自己一生的辛勤努力,哪怕只是为了完成窗棂上的雕花都是值得的。 然而,21 世纪悄然降临。经济学工匠向窗外望去,发现在更高的山冈上,已经矗立起一座更加富丽堂皇的神殿的脚手架。我们的选择在于:是继续在20 世纪的经济学殿堂里雕梁画栋,还是到21 世纪经济学的工地上添砖加瓦。 斯蒂格利茨教授,这位21 世纪的首位诺贝尔经济学奖得主曾经发表过一篇文章,题为《经济学的又一个世纪》。在这篇文章中他谈到,20 世纪的经济学患了“精神分裂症”,即微观经济学和宏观经济学的脱节,这种脱节既表现为研究方法上的难以沟通,又反映出二者在意识形态上的分歧和时立。21 世纪将是经济学分久必合的时代。一方面,宏观经济学正在寻找微观基础;另一方面,微观经济学也正在试图从微观个体的行为推演出总量上的含义。这背后的意识形态的风气转变也值得我们注意。斯蒂格利茨教授曾经讲到,以下两种主张都无法正确估计市场经济的长期活力:一种是凯恩斯式的认为资本主义正在没落的悲观思想;另一种是里根经济学的社会达尔文主义,表达了对资本主义的盲目乐观。我们已经接近一种处于两者之间的哲学,它将为我们的时代指引方向。 21 世纪的经济学将从纸上谈兵转变为研究真实世界中的现象。炉火纯青的分析方法和对现实世界的敏锐感觉将成为经济学研究的核心所在。 “当代世界学术名著·经济学系列”所翻译的主要是处在20 世纪和21 世纪之交的经济学著作。这些著作在学术的演进过程中起到的更多是传承的作用。它们是20 世纪经济学的集大成者,也是21 世纪经济学的开路先锋。这些著作的作者大多有一个共同的特征。他们不仅是当代最优秀的经济学家,而且是最好的导师。他们善于传授知识,善于开拓新的前沿,更善于指引遥远的旷野中的方向。如果不惮“以偏概全”的指责,我们可以大致举出21 世纪经济学的若干演进方向:博弈论将几乎全面地改写经济学;宏观经济学将日益动态化;政治经济分析尝试用经济学的逻辑对复杂的政策决策过程有一个清晰的把握;经济学的各个分支将“枝枝相覆盖,叶叶相交通”;平等、道德等伦理学的讨论也将重新进入经济学。 介绍这些著作并不仅仅是为了追踪国外经济学的前沿。追赶者易于蜕变成追随者,盲目的追随易于失去自己的方向。经济学是济世之学,它必将回归于现实。重大现实问题的研究更有可能做出突破性的创新,坚持终极关怀的学者更有可能成长为一代宗师。中国正在全方位地融入世界经济,中国的国内经济发展也到了关键的阶段。我们推出这套丛书,并不是出于赶超的豪言或是追星的时髦。我们的立足点是,在世纪之交,经济学的发展也正处于一个关键的阶段,这个阶段的思想最为活跃,最为开放。这恰恰契合了中国的当前境况。我们借鉴的不仅仅是别人已经成型的理论,我们想要从中体会的正是这种思想的活跃和开放。 这套丛书的出版是一项长期的工作,中国社会科学院、中国人民大学、北京大学、南京大学、南开大学、复旦大学、中山大学以及留学海外的许多专家、学者参与了这套译丛的推荐、翻译工作。这套译丛的选题是开放式的,我们真诚地欢迎经济学界的专家、学者在关注这套丛书的同时,能给予它更多的支持,把优秀的经济学学术著作推荐给我们。 中文版前言 现在距离我们完成《策略思维》之日已有十几年时间。在这段时间里,博弈论达到全盛时期。当初我们动笔的时候,知道博弈论的人还寥寥无几,懂得将博弈论用于实践者更是屈指可数;有关博弈论的著作充满数学公式,令人望而生畏,其应用也仅限于“奇爱博士”( Dr.Strangelove ,同名电影主角)这样的防务分析员。不过,从那时起,博弈论的贡献渐渐获得世人承认,先是约翰·纳什获得诺贝尔奖,然后有了一部获得奥斯卡奖的电影。如今,在绝大多数大学,博弈论成了热门课程,在不少商学院甚至被规定为一门必修课。博弈论在实践中也得到了广泛的应用。从拍卖金额高达几十亿美元的用于承载手机信号的电波波段,到为麦肯锡这样的顶尖咨询公司提供策略咨询服务,再到预测谁会在真人秀《幸存者》中被淘汰出局,博弈论可说无处不在。到目前为止,本书已经售出25 万多册。 策略思维在中国有着很深的渊源。人人都知道孙武和他的《孙子兵法》*,其实在中国还有很多不那么知名的策略作者和思想家。译者王尔山在翻译本书的时候,就想到了中国历史和传说中的几个故事,意识到这些故事包含博弈论的基本要素,可以用于解释这个理论。现在,她正在考虑撰写一部以这些历史故事为基础阐述博弈论的著作;我们期待早日看到这部作品。 我们希望各位可以从本书得到一些收获。一是改变观点。我们希望你可以从别人的角度观察这个世界。正确做到这一点对于确定你自己的最佳策略是必不可少的。不过,从别人的角度观察这个世界做起来并不容易。我们总喜欢把别人看做和我们一样的人,而不是完全不同的类型。博弈论要求你设身处地,仔细分析自己若处于对方的境地,思路会有什么变化,哪怕你完全不能同意他们的见解。说不定,在你读完本书的时候,你会发现自己对美国人的见解有了进一步的认识。 二是向前展望,倒后推理。这里说的是做出一系列行动和反行动,预计沿着你现在前进的道路走下去,最后你会到达哪里。我们听说,有一句成语的大致意思是“如果你留在目前的道路上,这就是你最后的归宿”。“向前展望,倒后推理”的法则却告诉你,应该首先确定自己最后希望达到什么目标,然后从这个结果倒后研究,直到找出自己现在应该选择哪条道路,这样才能保证以后可以达到那个目标。 记住,博弈论说的并不仅仅限于击败对方。这个理论同时解释了建立合作与战而胜之两方面的策略。也许这意味着我们应该将孙武和托尔斯泰结合起来,变成《战争与和平的艺术》。 最后,我们希望各位可以从阅读本书的过程中得到许多乐趣。我们在写作本书时,感到很有乐趣。 阿维纳什·迪克西特 巴里·奈尔伯夫 2002 年5 月21 日 *英译名为《战争的艺术》。—译者注 策略思维是关于了解对手打算如何战胜你,然后战而胜之的艺术。我们每个人都会在工作中和日常生活中用到策略思维。生意人和企业必须借助有效的竞争策略才能生存下去;政治家必须设计竞选策略,使自己得以当选,还要构思立法策略,使自己的主张得以贯彻;橄榄球教练必须制定策略,由球员在场上实施;父母若想教会孩子良好的行为举止,自己至少应该变成业余的策略家(而孩子是职业选手); 40 年来,超级大国的核策略一直主宰着人类的生死。 范畴如此广泛的好的策略思维,一直是一门艺术。不过,它的基础是由一些简单的基本原理组成的。这是一门新兴的策略科学。我们写作本书的信念在于,假如来自不同背景和行业的读者了解了这些原理,他们就会变成更出色的策略家。 关于策略思维的科学称为博弈论。这是一门相对年轻的科学,历史尚不足50 年。博弈论已经为现实生活当中的策略家们提供了许多有用的启迪。不过,就像其他学科一样,博弈论也渐渐陷人了行话术语和数学符号之中。虽然这些都是必不可少的研究工具,但结果却将理解其基本想法变成少数专业人士的特权。我们试图将其中许多重要思想翻译过来,使聪明的普通读者也能读懂。我们用描述性的例子和案例分析取代了理论证明。我们去掉了全部数学以及大部分术语。对于一切愿意思考一点算术、表格和图表的读者,读懂本书应该不会有什么困难。许多书籍已经尝试过为特定目的找出策略思维的方法。汤姆·谢林(Tom schelling )关于核策略的著作,尤其是《冲突策略》 (Strategy of Conflict)和《军备与影响》(Arms and Influence),都颇负盛名。实际上,谢林还是将博弈论大量应用到核冲突领域的先行者。迈克尔·波特( Michael Porter )的《竞争战略》(Competitive Strategy )描绘了商业策略当中的博弈论教训,也同样有名。史蒂文·布拉姆斯(Steven Brams) 也写过几本书,最有名的当数《博弈论与政治》 (Game Theory and Politics )。 我们在本书中并未将整个博弈思想局限于任何一个特定场景;相反,我们用了许多不同的例子说明每一个基本原理。这么一来,具有不同背景的读者总能从中看到一些令人感到亲切的案例。他们还会看到同样的原理是如何适用于相对陌生的情况的;我们希望这样做能使他们用一种新的眼光看待许多新闻或者历史事件。我们还从大多数美国读者共有的经验当中提取例子,比如来自文学、电影和体育的生动案例。严肃的科学家可能觉得这会使策略学问变得琐碎,不过,我们相信,来自电影和体育的熟悉的例子是一个非常有效的工具,有助于传达重要的博弈概念。 就像托尔金(Tolkien)的《指环王》(Lord of the Rings)一样,我们这本书也是以讲故事取胜的。它的“古代起源”是阿维纳什·迪克西特在普林斯顿的伍德罗·威尔逊公共与国际事务学院开设和讲授的一门关于策略博弈的课程。巴里·奈尔伯夫后来也在耶鲁大学的政治科学系以及耶鲁的组织与管理学院(简称SOM)教过这门课程和另一门类似的课程。有许多学生对这些课程表现出很大的热情,贡献了许多想法,我们深表谢意。尤其需要提到的名字包括安妮·凯斯(Anne Case )、乔纳森·弗莱明(Jonthan Flemming)、希瑟·哈泽德(Heather Hazard )、丹尼·罗德里克(Dani Rodrik )和乔纳森·希姆索尼(Jonthan Shimshoni)。和野崇(Takashi Kanno)与岛津泳一(Yuichi Shimshoni) 承担了将我们的论述和概念译为日语的工作,而在这个翻译过程中,他们也使英文版本变得更完善。 写作一本更接近大众阅读层面而非教科书的想法来自密歇根大学的哈尔·瓦里安(Hal Varian)。他还在初稿阶段就给我们提供了许多有用的想法和评价。W.W.诺顿公司的德雷克·迈克费利(Drake McFeely) 是一个严格细致的编辑,非常了不起,很有眼光。正是他做了非同寻常的工作,才使我们的学术论文成为生动有趣的故事。假如本书现在仍然留有教案的痕迹,那一定是因为我们没有全盘接受他的建议。 许多同事和朋友都认真阅读了本书早期的草稿,向我们提出了大量详细而出色的改进建议。我们要特别感谢戴维·奥斯汀-史密斯(David Ansten-Smith ,罗切斯特大学)、艾伦·布林德(Alan Blinder ,普林斯顿大学)、塞思·马斯特斯(Seth Masters , S.Bernstein公司)、卡尔·夏皮罗(Carl Shapiro ,普林斯顿大学)、路易斯·泰勒(Louis Taylor , MITRE 公司)、托马斯·特伦戴尔(Thomas Trendell , ATT-Paradyne公司)、特里·沃恩(Teriy Vaughn ,麻省理工学院出版社)以及罗伯特·威利格(Robert willig ,普林斯顿大学)。斯泰西·曼德尔鲍姆(Staccy Mandelbaum)和劳拉·康·沃德(Laura Kang ward)作为手稿编辑,对我们的错漏之处非常宽容。各位每次阅读的时候,假如找不出一个错误,就该感谢她们的功劳。 我们还要感谢那些帮助我们确定本书书名的人。哈尔·瓦里安从一开始就建议我们用“策略思维”的书名。耶鲁SOM的学生们给我们提供了更多选择。我们比较中意的书名包括德博拉·哈尔彭(Deborah Halpern)的“超越球场”以及威廉·巴恩斯(William Barnes )主笔的广告语: “策略思维——上阵时千万别忘了它”。① 阿维纳什·迪克西特 巴里·奈尔伯夫 1990 年10月 ① 当然还有其他一些相当有意思的提议,比如“策略与你”。 目录 序言 什么是策略行为?………………………………(1) 第1 部分 第1章 10个策略故事………………………………(7) 1 .妙手传说………………………………………(8) 2 .领先还是不领先………………………………(9) 3 .直奔牢房………………………………(11) 4 .我将坚持到底………………………………(13) 5 .给猫拴个铃档………………………………(15) 6 .楔子的尖端………………………………(17) 7 .三思而后行………………………………(18) 8 .多管齐下………………………………(19) 9 .别跟笨蛋对等打赌………………………………(21) 10 .博弈论可能危害你的健康………………………………(22) 11.未来的模样………………………………(23) 12 .案例分析之一:红色算我赢, 黑色算你输………………………………(24) 第2 章准备接招………………………………(27) 1 .轮到你了,查理·布朗,………………………………(27) 2 .两种策略互动………………………………(29) 3 .策略的第一法则………………………………(29) 4 .决策树与博弈树………………………………(30) 5 .更加复杂的树………………………………(35) 6 .讨价还价………………………………(38) 7 .战争与和平………………………………(41) 8 .英国人玩的博弈………………………………(42) 9 .案例分析之二:汤姆·奥斯本与 1984 年橙碗球场决赛的故事………………………………(45) 第3 章看穿对手的策略………………………………(47) 1 .优势策略………………………………(49) 2 .封面之战………………………………(50) 3 .劣势策略………………………………(56) 4 .均衡策略………………………………(62) 5 .盛宴还是饥荒………………………………(65) 6 .案例分析之三:莽汉软招………………………………(67) 第1 部分结语………………………………(70) 第2 部分 第4 章走出囚徒困境………………………………(75) 1 .如何达成合作………………………………(80) 2 .觉察作弊………………………………(81) 3 .对作弊者的惩罚………………………………(82) 4 .惩罚的保证………………………………(86) 5 .惩罚方式的选择………………………………(88) 6 .以牙还牙………………………………(89) 7 .以牙还牙策略的一个替代选择………………………………(94) 8 .案例分析之四:国会对联邦储备局策略行动………………………………(96) 第5 章策略行动………………………………(99) 1 .无条件行动………………………………(101) 2 .威胁与许诺………………………………(103) 3 .警告与保证………………………………(105) 4 .核阻吓………………………………(106) 5 .时报的策略………………………………(109) 6 .更多的策略行动………………………………(112) 7 .杀鸡焉用牛刀?………………………………(112) 8 .案例分析之五:波音、波音,完蛋了?………………………………(114) 第6 章可信的承诺………………………………(117) 1 .建立可信度的八正道………………………………(119) 2 .只有一次生命可以献给你的祖国………………………………(132) 3 .你难以拒绝的提议………………………………(134) 4 .案例分析之六:你会不会宁可向IBM 租一台电脑?………………………………(136) 第7 章不可预测性………………………………(138) 1 .怎样使输赢机会相等?………………………………(140) 2 .有人要打网球吗?………………………………(142) 3 .为什么你应该选择正确的混合策略?………………………………(149) 4 .为什么不能依赖对手的随机化?………………………………(149) 5 .你的技巧变化了,你的最佳混合策略怎样变化?………………………………(150) 6 .怎样随机行动?………………………………(151) 7 .独一无二的情况………………………………(152) 8 .谎言的安全措施………………………………(153) 9 .出人意料………………………………(155) 10 .得势不饶人………………………………(158) 11 ,案例分析之七:霸王行动………………………………(160) 第2 部分结语………………………………(163) 1 .历史注记………………………………(163) 2 .深入阅读………………………………(164) 3 .我们的遗漏责任………………………………(165) 4 .从这里开始………………………………(165) 第3 部分 第8 章边缘政策………………………………(169) 1 .为什么选择不确定性?………………………………(171) 2 .风险机制………………………………(174) 3 .风险控制………………………………(176) 4 .逃离边缘………………………………(178) 5 .跌落边缘………………………………(178) 6 .核边缘政策………………………………(179) 7 .案例分析之八:大西洋上的边缘政策………………………………(181) 第9章合作与协调………………………………(183) 1 .钟为谁而鸣?………………………………(185) 2 .那条人迹罕至的路线………………………………(187) 3 .第22 条军规?………………………………(190) 4 .比超速驾驶传票还快………………………………(195) 5 .他们为什么离开?………………………………(197) 6 .可能高处不胜寒………………………………(200) 7 .政治家与苹果酒………………………………(203) 8 .股市与选美………………………………(204) 9 .复习………………………………(206) 10 .案例分析之九:牙医分布的 解决方案………………………………(207) 第10 章投票的策略………………………………(211) 1 .打破平局………………………………(212) 2 .中点的选民………………………………(215) 3 .天真的投票………………………………(218) 4 .法庭的秩序………………………………(219) 5 .老于世故者………………………………(221) 6 .历久不衰的名人………………………………(223) 7 .爱一个可恶的敌人………………………………(226) 8 .案例分析之十:全取或全失………………………………(230) 第11章讨价还价………………………………(233) 1 .谈判中的锄强扶弱体系………………………………(235) 2 . “这对你的伤害大于对我的伤害”………………………………(237) 3 .边缘政策与罢工………………………………(238) 4 .同时就许多事情讨价还价………………………………(240) 5 .案例分析之十一:施比受好?………………………………(241) 6 .附录:耐性自有回报………………………………(243) 第12章激励………………………………(245) 1 .怎样奖赏工作表现?………………………………(246) 2 .怎样组织一个合作项目?………………………………(249) 3 .招标、拍卖的策略………………………………(258) 4 ,案例分析之十二:取胜的风险………………………………(261) 第13章案例分析………………………………(263) 1 .别人的信封总是更诱人………………………………(263) 2 .末位应该变成首位………………………………(265) 3 .三方对决………………………………(266) 4 .弄巧成拙的防鲨网………………………………(267) 5 .糊涂取胜………………………………(269) 6 .大好时节与时机选择………………………………(271) 7 .坚持就是胜利?………………………………(272) 8 .贵人行为理应高尚………………………………(276) 9 .独霸天下………………………………(277) 10 .海湾大桥………………………………(279) 11 .公用地悲剧………………………………(279) 12 . 1 美元的价格………………………………(281) 13 .李尔王的难题………………………………(282) 14 .美国诉艾科亚………………………………(283) 15 .错错得对………………………………(285) 16 .赢得最后一步………………………………(286) 17 .边缘政策与陪审团………………………………(288) 18 .管闲事的自由………………………………(289) 19 .给市长发一枚“大奖章”………………………………(291) 20 .大洋两岸的武装………………………………(292) 21 .慈善捐助的局限性………………………………(295) 22 .再分配的局限性………………………………(298) 23 .有时骗倒所有人:拉斯维加斯的老虎机………………………………(300) 注释………………………………(303) 索引………………………………(311) 附录 约翰·纳什:现代博弈论奠基人………………………………(326) 译后记………………………………(329) 序言 什么是策略行为 人们在社会当中应该怎样举止行事?1 我们将要给出的答案与道德或礼节无关。我们也不打算与哲学家、传道者或埃米莉·波斯特”*(Emily Post)一争高下。我们将要讨论的主题虽然没有道德或礼节那么宏大,却同样反映我们每一个人的生活。本书是讲述策略行为的。不管我们是否乐意,我们每一个人其实都是策略家。既然这样,当一个出色的策略家总比当一个蹩脚的策略家更好一点吧。本书的目的就是帮助你改善在开发和运用行之有效的策略方面的技巧。 *埃米莉·波斯特(1873——1960 ) ,美国礼节风尚专家,他1922 年出版的《礼节》 一书,其定其权威地位,至今畅销不衰。——译者注 工作,即便只是社交生活,也可以看做是一个永无止息的决策过程。从事什么样的工作,怎样打理一宗生意,该和谁结婚,怎样将孩子抚养成人,要不要竞选总统,等等,这些都只不过是重大决策的几个例子。上述情况存在一个共同的条件,即你不是在一个毫无干扰的真空世界里做决定。相反,你的身边全是和你一样主动的决策制定者,他们的选择与你的选择相互作用。这种互动关系将对你的思维和行动产生重要的影响。 为了解释这一点,我们不妨设想一个伐木工人的决策和一个将军的决策会有什么区别。当伐木工人考虑怎样砍伐树木的时候,他不必担心木头可能跳起来进行反击。他的工作环境是中立的,没有对抗。不过,当一名将军打算消灭敌方军队的时候,他的每一步计划都会引来抵抗,他必须设法克服这种抵抗。和这位将军一样,你必须意识到,你的商业对手、未来伴侣乃至你的孩子都是聪明而有主见的人。虽然他们的目标常常与你的目标发生冲突,但他们当中同样包含你潜在的同盟者。在你做决定的时候,必须将冲突考虑在内,同时注意发挥合作的效力。类似的互动决定就具有策略性,与之相适应的行动计划称为一个策略。本书将帮助你策略地思考,然后将这些想法付诸实践。 在社会科学当中,研究策略性决策制定过程的分支称为博弈论,原意为游戏理论。这一理论涉及的“游戏”范围很广,从象棋到孩子抚养,从网球到企业兼并,从广告到军备控制,几乎无所不包。正如匈牙利幽默大师乔治·米克斯(George Mikes)描述的那样,“许多欧洲人认为生活是一场游戏;英国人认为板球才是一场游戏”。我们则认为双方说得都不错。 玩这些游戏需要用到许多不同类型的技巧。其中一种是基本技巧,比如打篮球不能缺少的投篮能力,在法律界工作不能缺少的判例知识,乃至打扑克不能缺少的一副不动声色的面孔。策略思维则是另外一种技巧。策略思维从你的基本技巧开始,考虑的是怎样将这些基本技巧最大限度地加以发挥。比如,你了解法律,就要确定为自己的委托人辩护的策略;你了解你的橄榄球队传球或带球突破的本事有多大,而对手防御的能力又有多好,那么,你作为一个教练,就要决定本队到底是应该传球还是带球突破。有些时候,比如几个超级大国处心积虑构想一个大胆的计划,其中包含触发一场核战争的危险,那么,策略思维还意味着懂得适可而止。 我们的目标在于提高你的策略IQ 。不过,我们并不打算提供一本策略大全。我们建立了策略思维的概念和原理,假如你想将它们运用于自己面临的某一个具体情况,并且想找出正确的选择,那么你还得再做一些工作。这是因为,在一些关键方面,各种情况的具体条件都不尽相同,我们即便开出用于指导行动的通用处方,到头来很可能只是误导了你,弄巧成拙。无论遇到什么情况,你都要将我们讨论过的好的策略的原理以及其他方面结合起来,一并进行考虑。你必须综合考虑这些因素,而且,假如这些因素相互冲突,还要权衡各种不同因素的分量。我们并不能承诺我们可以解决你遇到的一切问题。实际上,博弈论这门“科学远未达到完美佳境,而策略思维在某些方面看来仍然属于一门艺术。 我们倒是可以提供一些指导,帮助你将想法变成行动。第1章举了几个例子,解释了在一系列不同的决定下策略问题是怎样出现的。我们指出了一些行之有效的策略以及一些不那么行之有效的策略,甚至提到了一些完全错误的策略。接下来的章节则把这些例子变成一个思考体系或一个思考框架。而在最后几章,我们阐述了几个涉及范围更加广泛的策略的情况,比如边缘政策、投票选举、激励机制以及讨价还价,你将看到有关原理是怎样发挥作用的。 本书运用的例子既有人们熟悉的、琐碎的或有趣的类型——通常取材于文学作品、体育比赛或者电影,也有令人畏惧的类型,比如核对峙。前者只是一个用来阐述博弈论概念的赏心悦目的工具;至于后者,有些读者一度可能觉得核战争这个话题实在太吓人,不会有理性分析的空间。不过,随着冷战的阴云渐渐消散,大家都相信世界会进人一种更加安定的局面。我们希望,在排除军备竞赛以及古巴导弹危机中的情绪化内容干扰之后,我们可以重新检讨其中的博弈层面包含的策略逻辑。 这些章节以实例作为重要内容,不过,这些例子主要用于建立或描述正在讨论的某个特定原理,至于具体用到的这个例子,其在现实当中的许多细节都会忽略不计。在每章结尾,我们都提供了一个“案例分析”,这就跟你在商学院上课时可能遇到的情形差不多。每个案例都具备一系列特定条件,由你负责运用该章讨论的原理,确定这一情况下应该采取的正确策略。有些案例没有标准答案,不过,这也正是人生的一大特点。许多时候,并不存在完全正确的解决方案,只能用并不完美的方法去处理遇到的问题。在研究我们的讨论之前,请仔细思考每一个案例,这将比简单地读无数遍课文更有助于理解其中的观点和思路。为了本给大家提供更多的练习机会,我们在最后一章收录了23个案例,大致按照越往后就越难的顺序排列。 读完本书,我们希望你能成为一位更精明的经理人、谈判者、运动员、政治家或更高明的父母。我们提醒你,一些有助于达成上述目标的好策略,不一定会为你赢得被你击败的对手的敬意。假如你想公平竞争,那就告诉他们,你有这么一本书。 当代世界学术名著·经济学系列 策略思维 第1部分 第1章10个策略故事 我们从10个来自生活不同方面的策略故事开始,提供一些怎样才能发挥最佳水准的初步概念。许多读者一定在日常生活中遇到过类似情况,而且,通过一些思考或尝试,犯过一些错误后,也找出了正确的解决方法。对于其他读者,这里的一些答案可能出人意料,不过,让读者感到惊讶不是我们提出这些例子的根本目的。我们的目的是要指出,类似这样的情形普遍存在,而且形成一系列相互关联的问题,系统地思考这些问题可能会让你收到事半功倍的效果。请把这些故事当做主菜之前的开胃菜,它们的作用是增进你的食欲,而不是马上把你撑饱。 1 .妙手传说 运动员究竟有没有一朝命中、百发百中的“妙手”这一说?有时候,乍看上去,篮球明星拉里·伯德(Larry Bird)、冰球明星韦恩·格雷茨基(Wayne Gretzky)或是足球明星迭戈·马拉多纳(Diego Maradona) 真的是百发百中,永不落空。体育比赛解说员们看到这种长期存在、永不落空的成功事迹,就会宣称这名运动员具有出神人化的妙手。不过,按照心理学教授托马斯·吉洛维奇(Thomas Gilovich)、罗伯特·瓦隆(Robert Vallone)和阿莫斯·特维斯基(Amos Tversky)的说法,这其实是对真实情况的一种误解。[l]他们指出,假如你抛硬币抛上足够长的时间,你也会遇到在很长一段时间里全是抛出同一面的情况。这几位心理学家怀疑体育解说员们其实是找不到更有意思的话题,只好从一个漫长的赛季中寻找某种模式,而这些模式跟长时间抛硬币得出的结果其实没有什么两样。因此,他们提出了一个更加严格的测试。比如,在篮球比赛中,他们只看一个运动员投篮命中的数据,据此考察这名运动员下一次出手仍然命中的概率究竟有多大。他们也用同样的方法研究这名运动员在这次出手没有命中却在下一次出手命中的情形。比较命中一次之后再次出手仍然命中的概率与这次没有命中而再次出手命中的概率,假如前者高于后者,那就表明妙手一说不无道理。 他们选择美国NBA费城76人队(Philadelphia 76ers)进行测试,结果与妙手一说发生矛盾:一名运动员投篮命中之后,下一次出手就不大可能命中了;假如他在上一次出手没有命中,再出手时反倒更可能命中。就连拥有“得分机器”称号的安德鲁·托尼(Andrew Toney)也不例外。这是否意味着,我们谈论的其实是“射频观测器之手”,因为运动员的水准有起有伏,就跟射频观测器的灯光忽明忽暗一样? 博弈论提出了一个不同的解释。尽管统计数据否定了一朝命中、百发百中之说,却没有驳倒一个“鸿运当头”的运动员很可能在比赛当中通过其他方式热身,渐入佳境。“得分机器”之所以会不同于“妙手”, 原因在于攻方和守方的策略会相互影响。比如,假设安德鲁·托尼真有那么一只妙手,对手们一定会对他实施围追堵截,从而降低他的投篮命中率。 事实还不仅如此。当防守一方集中力量对付托尼的时候,他的某个 队友就无人看管,更有机会投篮得分。换句话说,托尼的妙手大大改善了76人队的团队表现,尽管托尼自己的个人表现可能有所下降。因此,我们也许应该通过考察团队合作连续得分的数据来测试妙手一说。 许多其他团队项目也有类似情况。比如在一支橄榄球队里,一个出色的助攻后卫将大大改善全队的传球质量,而一个拥有优异的接球才能的运动员则有助于提高全队的攻击力,因为对方被迫将大部分防守资源用于看管这些明星。在1986年的世界杯足球决赛上,阿根廷队的超级明星迭戈·马拉多纳自己一个球也没有进,不过,全靠他从一群联邦德国后卫当中把球传出来,阿根廷队两次射门得分。明星的价值不能单凭他的得分表现来衡量;他对其他队友的贡献更为至关重要,而助攻数据有助于衡量这种贡献的大小。冰球项目排列个人表现名次的时候,助攻次数和射门得分次数占有同等分量。 一个运动员甚至可能通过一只妙手带动另一只手热身,进而变成妙手,帮助他自己提高个人表现水准。比如波士顿凯尔特人队的明星拉里·伯德,他喜欢用右手投篮,虽然他的左手投篮技术同样远在大多数人之上。防守一方知道伯德通常用右手投篮,自然会不惜集中一切兵力防他的右手。不过,他们的这一计划不能完全奏效,因为伯德的左手投篮技术亦实在了得,他们不敢大意,非得同样派人看守不可。 假如伯德在两个赛季之间苦练左手投篮技术,又会怎样呢?防守一方的反应就是增派兵力阻止他用左手投篮,结果却让他更容易用右手投篮得分。左手投篮得分提高了,右手投篮得分也会提高。在这个案例当中,左手不仅知道右手在做什么,而且帮了大忙。 再进一步,我们会在第7章说明左手越厉害,用到的机会反而可能越少。许多读者大约在打网球的时候已经遇到过类似的情况。假如你的反手不如正手,你的对手渐渐就会看出这一点,进而专攻你的反手。最后,多亏了这样频繁的反手练习,你的反手技术大有改善。等到你的正反手技术几乎不分上下,你的对手再也不能靠攻击你的弱势反手占便宜时,他们攻击你的正手和反手的机会渐渐持平,而这可能就是你通过改善自己的反手技术得到的真正好处。 2 .领先还是不领先 1983 年美洲杯帆船赛决赛前4轮结束之后,丹尼斯·康纳(Dennis 10 Conner)的“自由号”在这项共有7轮比赛的重要赛事当中暂时以3胜1负的成绩排在首位。那天早上,第五轮比赛即将开始,“整箱整箱的香槟送到‘自由号’的甲板。而在他们的观礼船上,船员们的妻子全都穿着美国国旗红、白、蓝三色的背心和短裤,迫不及待要在她们的丈夫夺取美国人失落132年之久的奖杯之后参加合影。[2]可惜事与愿违。 比赛一开始,由于“澳大利亚二号”抢在发令枪响之前起步,不得不退回到起点线后再次起步,这使“自由号”获得了37秒的优势。澳大利亚队的船长约翰·伯特兰(John Bertrand)打算转到赛道左边,满心希望风向发生变化,可以帮助他们赶上去。丹尼斯·康纳则决定将“自由号”留在赛道右边。这一回,伯特兰大胆押宝押对了,因为风向果然按照澳大利亚人的心愿偏转了5度,“澳大利亚二号”以1分47秒的巨大优势赢得这轮比赛。人们纷纷批评康纳,说他策略失败,没能跟随澳大利亚队调整航向。再赛两轮之后,“澳大利亚二号”赢得了决赛桂冠。 帆船比赛给我们提供了一个很好的机会,观察“跟随领头羊”策略的一个很有意思的反例。成绩领先的帆船,通常都会照搬尾随船只的策略。一旦遇到尾随的船只改变航向,那么成绩领先的船只也会照做不误。实际上,即便成绩尾随的船只采用一种显然非常低劣的策略时,成绩领先的船只也会照样模仿。为什么?因为帆船比赛与在舞厅里跳舞不同,在这里,成绩接近是没有用的,只有最后胜出才有意义。假如你成绩领先了,那么,维持领先地位的最可靠的办法就是看见别人怎么做,你就跟着怎么做。① ① 这一策略在竞争者超过两个之后就不再适用了。即便只有三条船只,假如一条船偏向右边,一条船偏向左边,成绩领先者就得择其一,确定自己要跟哪一条船。 股市分析员和经济预测员也会受这种模仿策略的感染。业绩领先的预测员总是想方设法随大流,制造出一个跟其他人差不多的预测结果。这么一来,大家就不容易改变对这些预测员的能力的看法。另一方面,初出茅庐者则会采取一种冒险的策略:他们喜欢预言市场会出现繁荣或崩溃。通常他们都会说错,以后再也没人听信他们,不过,偶尔也会有人做出正确的预测,一夜成名,跻身名家行列。 产业和技术竞争提供了进一步的证据。在个人电脑市场,IBM的创新能力远不如将标准化的技术批量生产、推向大众市场的本事那么闻名。新概念更多是来自苹果电脑、太阳电脑和其他新近创立的公司。冒险性的创新是这些公司脱颖而出夺取市场份额的最佳策略,大约也是惟一途径。这一点不仅在高科技产品领域成立。宝洁作为尿布行业的IBM,也会模仿金佰利(Kimberly Clark)发明的可再贴尿布粘合带,以再度夺回市场统治地位。 跟在别人后面第二个出手有两种办法。一是一旦看出别人的策略,你立即模仿,好比帆船比赛的情形;二是再等一等,直到这个策略被证明成功或者失败之后再说,好比电脑产业的情形。而在商界,等得越久越有利,这是因为,商界与体育比赛不同,这里的竞争通常不会出现赢者通吃的局面。结果是,市场上的领头羊们,只有当它们对新生企业选择的航向同样充满信心时,才会跟随这些企业的步伐。 3 .直奔牢房 有这么一个笑话,说的是在斯大林时期的苏联,有一位乐队指挥坐火车前往下一个演出地点,正在车上翻看当晚将要指挥演奏的作品的乐谱。两名克格勃军官看见他在读着什么,错把乐谱当成某种密码,立即将他作为间谍逮捕了。他争辩说那只是柴可夫斯基的小提琴协奏曲,却无济于事。在他被投入牢房的第二天,审问者自鸣得意地走进来,说:“我看你最好还是老实招了吧。我们已经抓住你的朋友柴可夫斯基了,他这会儿正向我们招供呢。” 这个笑话成了介绍囚徒困境的开场白,而囚徒困境可能是最广为人知的博弈。现在我们就来看看它如何导出符合逻辑的结果:假设克格勃真的逮捕了某人,而此人的惟一罪名就是取了“柴可夫斯基”这么一个名字,而且克格勃将乐队指挥和他分开进行审问。如果这两名无辜者否认克格勃指控的罪名,那么,他们将分别被判处3年徒刑。① 如果乐队指挥昧着良心承认罪名,其中还牵涉到那位素不相识的所谓“同谋”, 柴可夫斯基却仍然否认罪名,那么,乐队指挥可以在1年之后获得自由(以及克格勃的赞赏之情),而柴可夫斯基则会因拒不认罪而遭到严厉惩罚,被判处25年徒刑。当然了,假如乐队指挥与柴可夫斯基调换一下,乐队指挥拒不认罪,柴可夫斯基不但屈从认罪,还把他供了出来,那 ① 还有一个笑话讲的是古拉格(Gulag)的老囚犯问新来的囚犯:“你的刑期有多长?”回答是“10 年。”“你究竟做了什么啦?”“什么也没做。”“不可能,一定搞错了。什么也没做的刑期只有3年而已。” 么,两人的下场也会发生相应的变化。假如两人同时认罪,那么,他们都将被判处这一罪名的标准刑罚——10年徒刑。① 现在设想乐队指挥的思路。他知道柴可夫斯基要么招供,要么拒不认罪。假如柴可夫斯基招供,乐队指挥若是拒不认罪或招供,与之对应,他会被判处25年或10年徒刑,相比之下,对他来说招供的下场显然略胜一筹。假如柴可夫斯基拒不认罪,乐队指挥若是同样拒不认罪或招供,与之对应,他会被判处3年或1年徒刑,相比之下,对他来说招供的下场仍然略胜一筹。由此可见,招供显然是乐队指挥的最佳做法。 而在捷尔任斯基广场(Dzerzhinsky Square)另一个单人牢房里,柴可夫斯基也在做同样的盘算,得出同样的结论。当然了,结果是两个人同时招供。之后,当他们在古拉格群岛(Gulag Archipelago)流放地见面,说出各自的经历后,比较一番,就会发现,他们其实吃亏了。因为,假如他们两人都拒不认罪,他们两人的刑期都会大大缩短,早日重获自由。 假如他们在接受审问之前有机会见面好好谈清楚,那该有多好,他们一定会同意拒不认罪。不过,接下来他们很快就会意识到,无论如何,那样一个协定也不见得管用。一旦他们被分开,审问开始,每个人内心深处那种企图通过出卖别人而换取一个更好判决的想法就会变得非常强烈。这么一来,他们还是逃脱不了最终在古拉格相遇的命运,大概还会在那里好好算一账,看看谁欠谁更多。这两个人究竟有没有可能取得足够的相互信任,从而达成双方都希望看到的结果呢? 许多人,许多企业,乃至许多国家,都曾经吃过囚徒困境之苦。看看生死枚关的核军备控制问题吧。每个超级大国最希望看到的结果都是另一个超级大国销毁核武器,而它自己则继续保留核武器,以防万一。最糟糕的结果莫过于自己销毁核武器,而别人却依旧全副武装。因此,无论另一方怎么做,自己一方仍然倾向于保留核武器。不过,它们双方也有可能一致认为,双方同时销毁核武器的结果会比一方销毁而另一方不销毁的结果更好。现在的问题在于决策之间的相互依赖性:双方一致希望看到的结果出现在各方都选择各自比较糟糕的策略的时候。假如各方都有很明确的想法,打算突破有关协定,私底下发展自己的核武器, ① 实际刑期是3653天,因为“额外的3天是闰年多出来的时间”(A.Solzhenitsyn,One Day in the Life of Ivan Denisovitch, 1962)。 还有没有可能达成各方一致希望看到的结果呢?在这种情况下,只有其中一方来一个思维方式的根本改变,才能推动世界回到裁减核军备的轨道上去。 本着为自己的舒适生活、安全乃至生命着想,我们都有必要了解如何走出囚徒困境。在第4章,我们还会探讨一些类似的方法,看看这些方法什么时候可能有效,又是怎样发挥作用的。 囚徒困境的故事还体现了一个普遍的现象:大多数经济的、政治的或社会的博弈游戏都跟类似橄榄球或扑克这样的博弈游戏不同。橄榄球和扑克是零和博弈:一个人的得就是另一个人的失。但在囚徒困境里,有可能出现共同利益,也有可能出现利益冲突;不招供的结果对两个囚徒都是有利的,而不是相反。与此相仿,在劳资双方的讨价还价中,虽然存在利益冲突,一方希望降低工资,而另一方要求提高工资,不过,大家都知道,假如谈判破裂而导致罢工,双方都将遭受更大的损失。任何一个关于博弈的有用的分析,都应该考虑到怎样处理冲突与利益同时存在的情形。我们通常将博弈游戏的参加者称为“对立者”,不过,你也要记住,有时候,策略可能将原本毫不相干的人变成一条绳上相互依存的两只蚂蚱。 4 .我将坚持到底 天主教会要求马丁·路德(Martin Luther)公开悔过,收回他抨击教皇及其顾问班子的主张。他拒绝公开认错:“我不会收回任何一点主张,因为违背良心做事既不正确,也不安全。”而且他也不打算寻求妥协:“我将坚持到底,我不能屈服。”[3]路德拒不让步的态度是以他自己的立场的神学性为基础的。在确定什么才是正确的问题上,根本没有妥协的余地。长期来看,他的坚定立场产生了深远的影响;他的抨击最后引发了新教改革运动,从根本上改变了中世纪的天主教会。① 与此相仿,查尔斯·戴高乐(Charles de Gaulle)也借助拒不妥协的力量,在国际关系竞技场上成为一个强有力的参与者。正如他的传记作者唐·库克(Don Cook)描述的那样,“(戴高乐)单凭自己的正直、智慧、人格和使命感就能创造力量”[4]。不过,说到底,他的力量是“拒不妥协的力量”。第二次世界大战期间,他作为从一个战败且被占领的国家逃亡出来的自封的领导人,在与罗斯福(Roosevelt)和邱吉尔(Churchill)的谈判中仍然坚守着自己的立场。20世纪60年代,他作为总统说出的“不!”迫使欧洲经济共同体多次按照法国的意愿修改决策。 ① 路德的声望远远超出了教会的范畴,还延伸到“铁幕”的另一边。比如,民主德国自己生产的小汽车瓦特伯格(Wartburg)就被开玩笑似的称为“路德”;很显然,意思是说这种小汽车会变得跟路德一样死硬,拒不动弹。 在讨价还价当中,他的拒不妥协态度究竟是怎样赋予他力量的呢?一旦戴高乐下定决心坚守一个立场,其他各方只有两个选择:要么接受,要么放弃。比如,他曾经单方面宣布要将英国拒于欧共体之外,一次是1963 年,一次是1968年;其他国家不得不从接受戴高乐的否决票和分裂欧共体两条出路当中做出选择。当然,戴高乐非常谨慎地衡量过自己的立场,以确保这一立场会被接受。不过,他这么做往往使法国独占了大部分战利品,很不公平。戴高乐的拒不妥协剥夺了另一方重新考虑整个局面、提出一个可被接受的相反建议的机会。 在实践中,“坚持到底,拒不妥协”说起来容易做起来难,理由有二。第一个理由在于,讨价还价通常会将今天谈判桌上的议题以外的事项牵扯进来。大家知道你一直以来都是贪得无厌的,因此以后不大愿意跟你进行谈判。又或者,下一次他们可能采取一种更加坚定的态度,力求挽回他们认为自己将要输掉的东西。在个人层面上,一次不公平的胜利很可能破坏商业关系,甚至破坏人际关系。实际上,传记作者戴维·舍恩布伦(David Schoenribrun)这样批评戴高乐的盲目的爱国主义:“在人际关系当中,不愿给予爱的人不会得到爱;不愿做别人朋友的人到头来会一个朋友也没有。戴高乐拒绝建立友谊,最后受伤的还是法国。”[5]一个短期妥协可能从长期来看会是一个更好的策略。 第二个理由在于达到必要程度的拒不妥协并不容易。路德和戴高乐通过他们的个性做到了这一点。不过这样做是要付出代价的。一种顽固死硬的个性可不是你想有就有,想改变就能改变的。尽管有些时候顽固死硬的个性可能拖垮一个对立者,迫使他做出让步,但同样可能使小损失变成大灾难。 费迪南德·德雷赛布(Ferdinand de Lesseps)是一个能力中等的工程师,具有非同寻常的远见和决心。他由于在外人看来几乎不可能的情况下建成了苏伊士运河而名噪一时。他并不认同不可能的说法,因此完成了这一伟业。后来,他照搬同样的思路,试图建设巴拿马运河,结果演变成一场大灾难。① 尽管尼罗河的沙子让他备感得心应手,热带瘴气却打了他一个措手不及。德雷赛布的问题在于他顽固死硬的个性不允许他承认失败,哪怕战役早已输掉。 我们怎样才能做到有选择的顽固死硬呢?虽然我们没有一个理想的解决方案,却有几个办法可以帮助达成约定,并且维持下去;这是第6章将要谈到的内容。 5 .给猫拴个铃挡 童话故事里有一个给猫拴铃挡的故事,大意是这样:老鼠们意识到,假如可以在猫脖子上拴一个铃挡,那么,它们的小命就会大有保障。问题在于,谁会愿意冒赔掉小命的风险给猫拴上铃档呢? 这个问题同样摆在老鼠和人类面前。占据支配地位的党派或独裁暴君怎样才能通过规模相对较小的军队长期控制数目很大的一个人群呢?整架飞机的众多乘客为什么只要出现一个持枪劫机者就会显得无计可施,束手就擒?在这两个例子里,只要大多数人同时采取行动,就很容易取得成功。不过,统一行动少不了沟通与合作,偏偏沟通与合作在这个时候变得非常困难,而压迫者由于深知群众的力量有多大,还会采取特殊的措施,阻挠他们进行沟通与合作。一旦人们不得不单独行动,希望聚沙成塔,集腋成裘,问题就出来了:“谁该第一个采取行动?”担当这个任务的领头人意味着要付出重大代价,甚至可能付出生命。他得到的回报则会是死后的光荣或受人感激。确实有人在想到责任或荣誉的时候会感到热血沸腾,挺身而出,但大多数人还是认为这么做的代价超出了得益。 在苏共第二十次代表大会上,赫鲁晓夫首次谴责斯大林的大清洗运动。他那充满戏剧性的讲话刚刚结束,听众里就有人大叫起来,质问赫鲁晓夫自己那个时候又在做什么。赫鲁晓夫的反应是请提问者站起来,报出自己的姓名。听众一片沉默。赫鲁晓夫答道:“当时我也是这么做的。” 从某种意义上讲,我们以前都见过这样的例子。这只不过是涉及超过两个人的囚徒困境;你也可以把它称为“人质困境”。现在我们要用这个困境阐述一个不同的观点,确切地说,就是惩罚经常压倒回报而处于上风。独裁者可以通过向大众提供物质乃至精神安慰保持局势稳定,不过,这个做法可能需要付出高昂代价。建立在人质困境之上的压迫和恐吓可能是一种代价小得多的替代选择。 ① 苏伊士运河是一条位于海平面的通道。由于土地本来已经较低,又是沙漠,挖掘起来相对容易许多。巴拿马的海拔要高得多,沿途分布着许多湖泊和茂密的原始森林。德雷赛布打算一直挖到海平面高度的计划落空了。又过了很久,美国陆军工程兵采取一种完全不同的思路,建起一系列船闸,充分利用沿途的湖泊,最终取得成功。 这一原理有很多例子。在一个大型出租车队里,汽车经常是由调度员派给司机的。车队里既有好车,也有年久失修的老爷车。调度员可以利用他的调度权向每个司机收取一点贿赂。谁若是拒绝行贿,就一定会得到一部老爷车,而那些愿意合作的司机就会“抽到”上上好签。① 这么一来,调度员是发达了,但司机们作为一个群体,面对的还是他们就算不贿赂调度员也能得到的同样一些汽车。假如司机们联合起来,也许可以结束这种被迫行贿的日子,间题在于怎样才能组织起来采取行动。问题的关键不是调度员能从行贿者那里得到多少好处,而是他可以严厉惩罚那些不肯行贿的人。 将租户从实行房租控制的公寓中赶出去是另外一个类似的例子。假如某人在纽约买了这么一幢房子,他有权赶走一个租户,这样自己就能住进去。不过,这个规定最后却变成了赶走全部租户的权利。一个新房东可以对住在1A房间的租户说:“我有权住在自己的房子里。因此,我打算把你赶走,搬进你的房间。不过,假如你肯合作,自愿离开,我会给你5000美元作为报答。”对于一幢实行房租控制的房子的价格而言,这个数目只是九牛一毛(虽然这笔钱确实可以在纽约买一堆地铁票)。租户面临两个选择,一是拿着5000美元走人,二是什么也得不到,还是要走人,当然他选择前者。接下来,房东向1B1 的租户说同样的话,直到所有租户都搬家走人。 汽车制造业工人工会在跟汽车制造商一个接一个进行谈判的时候也占有类似的优势。单是一场针对福特汽车公司的罢工就会使福特处于非常不利的地位,因为通用汽车公司和克莱斯勒公司继续对工会采取合作态度,因此,福特很有可能迅速采纳对工会有利的条件,达成和解。这么一场罢工在工会这边看来代价也是较小的,毕竟只有1/3 的工会成员失去工作。赢得福特一役之后,工会转而会跟通用谈判,接着是克莱斯勒,引用前面各次战役的胜利作为先例,进一步壮大自己的声威。日本工会则另有一套做法,因为日本工会是由公司组织的,在公司里占有很大的利润份额。假如丰田的工会罢工,其成员的薪水就会随着丰田的利润下跌而下跌,他们以前的努力什么也得不到。 ① 哪怕大家都交钱,一些司机最后还是会分配到一辆老爷车。不过,假如老爷车是随机分配的,也就不会出现哪个司机比较容易得到老爷车的情况。相反,带头拒绝交钱的司机通常都会得到老爷车。 我们倒不是说上述任何一个或所有例子都是好的结局或理想的政策。在某些情况下,可能引起强烈的争议,要求避免我们所描述的那种结果。不过,要想使我们所做的努力奏效,我们必须看清问题产生的机制,即“手风琴效应”,每一个折叠都会推动或拉动邻近一个折叠。这一现象虽然一再发生,其实又是可以克服的,我们将在第9章告诉各位怎样可以做到这一点。 6 .楔子的尖端 许多国家运用关税、配额以及其他方法限制进口,保护本土产业。这样的政策会抬高价格,损害国内所有使用受保护产品的消费者的利益。经济学家估计,假如美国运用进口配额保护钢铁、纺织或制糖产业,导致大家不得不购买价格更高的产品,换算过来,相当于每保住这些产业一个职位,美国国内其他人就要付出10万美元的代价。[6]为什么会这样,极少数人的得益怎么总是会压倒更大多数人的损失而得到优先考虑呢? 秘诀在于一次提出一件事情。首先,美国制鞋产业的1万个职位面临着威胁。要想挽救这些职位,国内其他人就得付出10亿美元,或人均付出4美元。谁不愿意付出4美元保住1万个职位呢?即便素昧平生的陌生人也会愿意的吧,尤其是在可以把所谓不择手段的外国人当做现成的诅咒目标之际。接着就轮到服装产业、钢铁产业、汽车产业,等等。没等我们明白过来,我们已经点头同意付出500多亿美元,相当于人均付出200多美元,或每个家庭付出1000多美元。假如我们事前可以看穿整个过程,我们大概会想,这个代价是不是太高了,继而坚持要让上述各个产业的工人自己承担国际贸易带来的风险,就像他们承担任何其他经济风险一样。就个案逐项进行决策可能导致全部结果都与我们的意愿南辕北辙。实际上,一项决定即便获得多数人投票赞成,仍然有可能导致一个在每个人看来都比现状更糟的结果。 1985-1986年间的所得税改革之所以几乎走向崩溃,原因就在于参议院一开始采取的是对提案逐个解决的思路。在财政委员会第一轮条款讨论会上,财政部提案已被修改到带有太多特别利益条款而变得不堪重负,最后不得不宣告无效。参议员们意识到,他们面对有组织的院外集团的游说活动时简直是“软弱无力”,根本不可能阻止这些游说者谋求特殊待遇。要命的是,这些游说者若是联合起来,最终很可能毁灭这个法案,比干脆不推出任何法案更糟糕。于是,委员会主席、参议员帕克伍德(Packwood)进行了他自己的游说活动:他劝说委员会大多数成员投票反对任何一个针对所得税法案的修正案,哪怕这个修正案特别有利于他们的选民也在所不惜。本次改革终于得以立法通过。不过,已经有人发起了要求增加特殊条款的反击,每次提出一两条要求修正。 按照同样的思路,逐项否决权使总统可以有选择地否决法案。假如一个法案授权拨款资助学校提供午餐和建造一架新的航天飞机,总统本可以选择两个都否定、只批准其中一个或两个都批准,但是目前却只有两个选择,即两个都否定或者两个都批准。虽然第一反应可能是这将赋予总统更大的权力,控制立法过程,但若是反过来,结果可能是国会将更有选择性地看待有待它通过的法案。① 逐项否决权虽然一般被认为违反宪法,不过究竟是否如此,还是留给高等法院裁决为好。 之所以出现这些问题,是因为短视的决策者没能看远一点,他们看不到全局。在所得税改革的例子里,参议院勉强来得及恢复自己的远见;但在保护主义的老问题上,依旧未能取得突破。第2章将会建立一个体系,有助于改善长期策略远见。 7 .三思而后行 人们陷入某种境地而发现从此难以脱身的情况实在是太普遍了。比如,一旦你在某个城市找到一份工作,那么,换一个地方重新安置下来的代价就会变得很高;一旦你买了一台电脑,学会了怎样使用其操作系统,那么,学会另一种操作系统,改写你的全部程序,其代价就会变得很高。同样,参加了一家航空公司的里程积分计划的旅行者若想搭乘另 ① 哥伦比亚大学教授道格拉斯·霍尔茨-埃金(Douglas Holtz-Eakin)研究过州一级逐项否决权的影响。他的结论是看不出在具有逐项否决权的地方,财政支出会有什么区别。我们将在讨论投票策略的第10章对这个问题进行更详细的案例分析。 一家航空公司的飞机,付出的代价也会更高。还有,当然了,从婚姻围城中逃脱出来的代价也很高。 问题在于,一旦你作出了类似的承诺,比如接受了工作或结了婚,你的讨价还价地位就会被削弱。公司大可以利用其职员预期的搬家成本高,向他们支付较低薪水或降低加薪幅度。电脑公司可以给新出的可兼容的外围设备标出更高的价码,因为它们知道,它们的消费者不会轻易转向同样是新出的却不兼容的技术。至于航空公司,一旦找到数目庞大的里程积分计划参加者,就不大愿意参与价格战了。夫妻签订的平均分担家务的协议一旦遇到小孩出生,就不得不重新谈判一番。 能够预见到上述后果的策略家会赶在他们的讨价还价能力仍然存在的时候充分利用,换句话说就是在他们订下契约之前。一般情况是采取预先支付酬劳再签约的形式。潜在的利益谋取者相互竞争会导致同样的结果。比如,公司不得不提供更具吸引力的起薪;电脑制造商不得不为它们生产的中央处理器(CPU)标出足够低的价格;而航空公司的里程积分计划也不得不为登记参加者提供更多的积分奖励以吸引他们。至于结了婚的夫妇,其对各自利益的谋取可能会变成一场两个人玩的博弈游戏。 同样的深谋远虑也使许多好奇却又理智的人不至于亲身尝试会上瘾的毒品,比如海洛因。汤姆·莱勒(Tom Lehrer)写的一首歌这样描述毒品贩子的策略: 他给孩子赠送免费样品, 因为他实在太了解, 今天仍然天真无邪的面孔, 明天就会变成他的新客户。 聪明的孩子也了解这一点,所以拒绝了那些免费样品。 8 .多管齐下 现在让我们回到体育世界。在橄榄球比赛里,每一次贴身争抢之前,攻方都会在传球或带球突破之中择其一,而守方则会把赌注押在其中一个选择上,做好准备进行反击。在网球比赛里,发球一方可能选择接球一方的正手或反手,而接球一方则准备在回击的时候选择打对角线或直线。在这两个例子里,每一方都对自己的优点和对方的弱点有所了解。假如他们的选择可以同时考虑到怎样利用对方所有的弱点,而不是仅仅瞄准其中一个弱点,那么,这个选择应该算是上上之策。球员和球迷一样都很明白,必须多管齐下,来些出其不意的奇袭。理由在于,假如你每次都做同样的事情,对方就能集中全部力量最大限度地还击你的单一策略,还击效果也会更好。 多管齐下并不等于说要按照一个可以预计的模式交替使用你的策略。若是那样的话,你的对手就会通过观察得出一个模式,从而最大限度地利用这个模式还击,其效果几乎跟你使用单一策略一样好。实施多管齐下策略,诀窍在于不可预测性。 设想一下,假如存在一些人人都知道的公式,用来确定谁将受到美国国税局(IRS)的审计,在你填写报税单的时候,你就会套用这些公式看看自己会不会受到审计。假如预计到你会受到审计,而你又找到一个办法“修改”你的报税单,使其不再符合那些公式以避免被审计,很可能你已经动手这样做了。假如被审计已经无法避免,你大概会选择如实相告。国税局的审计行动若是具有完全可预见性,结果将会把审计目标确定在错误的人群身上。所有那些被审计的人早就预见到自己的命运,早就选择了如实相告,而对于那些逃过审计的人,能够看管他们的就只有他们自己的良心了。假如国税局的审计公式在一定程度上是模糊而笼统的,大家都有那么一点面临审计的风险,人们也就会更加倾向于选择诚实。 商界也有类似的现象。设想一下剃须刀市场的竞争情况。假设吉列定期举行购物券优惠活动,比如每隔一个月的第一个星期天进行,那么毕克(Bic)可以通过提前一个星期举行购物券优惠活动的方式予以反击。当然,这么一来毕克的路数就会变得具有可预见性,吉列可以照搬毕克的策略,相应将自己的优惠活动提前到毕克前面去。这种做法最终导致刺刀见红的残酷竞争,双方的利润都会下跌。不过,假如双方都采用一种难以预见或者多管齐下的混合策略,那么很可能会一起降低竞争的惨烈程度。 随机策略的重要性是博弈论早期提出的一个深谋远虑的观点。这个观点本身既简单,又直观,不过,要想在实践当中发挥作用,我们还得做一些细致的设计。比如,对于网球运动员,光是知道应该多管齐下,时而攻击对方的正手,时而攻击对方的反手,这还不够。他还必须知道他应该将30%的时间还是64%的时间用于攻击对方的正手,以及应该怎样根据双方的力量对比做出选择。在第7章我们会介绍一些可以解答上述问题的方法。 9.别跟笨蛋对等打赌 在《红男绿女》(Guys and Dolls)一片中,赌棍斯凯·马斯特森(Sky Masterson)想起他父亲给他提的这个很有价值的建议: 孩子,在你的旅途中,总有一天会遇到有一个家伙走上前来,在你面前拿出一副漂亮的新扑克,连塑料包装纸都没有拆掉的那种;这个家伙打算跟你打一个赌,赌他有办法让梅花J从扑克牌里跳出来,并把苹果汁溅到你的耳朵里。不过,孩子,千万别跟这个家伙打赌,因为就跟你确确实实站在那里一样,最后你确确实实会落得苹果汁溅到耳朵里的下场。 这个故事的背景是,内森·底特律(Nathan Detroit)要跟斯凯·马斯特森打赌,看看明迪糕饼店的苹果酥和奶酪蛋糕哪一样卖得比较好。正好,内森刚刚发现了答案(苹果酥!)。他当然愿意打赌,只要斯凯把赌注押在奶酪蛋糕上。 这个例子听上去也许有些极端。当然没有人会打这么一个愚蠢的赌。不过,仔细看看芝加哥交易所的期货合同市场吧。假如一个交易者提出要卖给你一份期货合同,那他只会在你损失的情况下得益。这个交易是一宗零和博弈,就跟体育比赛一样,一方的胜利意味着另一方的失败。因此,假如有人愿意卖给你一份期货合同,你绝对不应该买下来。反过来也是如此。 其中的策略意义在于,其他人的行动向我们提示了他们究竟知道什么,我们应该利用这些信息指导我们自己的行动。当然,我们应该将这些信息连同我们自己有关这个问题的信息综合起来加以利用,运用全部策略机制,尽可能从其他人那里获取整个事情的真相。 在前面提到的《红男绿女》 的例子里,存在这一类型的一个简单机制。斯凯应该问一下内森,看他在什么情况下愿意把赌注押在奶酪蛋糕上。假如回答是“无论什么情况都不会”,那么斯凯就能推断答案一定是苹果酥。假如内森回答说他下注在苹果酥和奶酪蛋糕上的可能性一样大,他显然是在隐瞒自己知道的信息,甘愿冒让斯凯在赌博中可能猜中的风险。 在股票市场、外汇市场和其他金融市场,人们可以像这个例子所描述的那样自行决定应该把赌注押在哪一边。实际上,在一些有组织的交易市场,包括伦敦股票市场,只要你询问一只股票的价格,按照规定,证券商必须在他知道你打算买入还是卖出之前同时告诉你买入价和卖出价。假如缺少这么一个监察机制,证券商就有可能单凭自己掌握的信息赚上一笔,而由于外面的投资者担心受骗上当,很可能最终导致整个市场崩溃。买入价和卖出价并不完全一致;两者之间存在一个价差(bid-ask spread)。在流动资金市场,这个差额非常小,意味着无论哪一份买入或卖出的订单,其中包含的信息都是微乎其微的。另一方面,内森·底特律愿意不惜一切代价把赌注押在苹果酥上,坚决不要奶酪蛋糕,他的价差则是无限大。千万当心这样的证券商。 在这里我们应该补充一点:斯凯没有认真听取他父亲的教诲。一分钟后他就跟内森打赌说内森不知道他的蝴蝶领结是什么颜色。斯凯无论如何赢不了:假如内森知道是什么颜色,他一定愿意打赌,并且取胜;假如他不知道,他一定不愿意打赌,也就不会输。 10 .博弈论可能危害你的健康 一天深夜,耶路撒冷举行的一个会议结束之后,两名美国经济学家找了一辆有牌照的出租车,告诉司机应该怎么去他们的酒店。司机几乎立即认出他们是美国观光客,因此拒绝打表,并声称自己热爱美国,许诺会给他们一个低于打表数目的更好的价钱。自然,两人对这样的许诺颇有点将信将疑。在他们表示愿意按照打表数目付钱的前提下,这个陌生的司机为什么还要提出这么一个奇怪的少收一点的许诺呢?他们怎么才能知道自己有没有多付车钱呢?① ① 假如这个司机想要证明他确实打算少收车钱,他完全可以按乘客的要求打表,等到了目的地之后再按打表数字收取80%的车钱。但他没有按乘客的要求打表,这其实已经扭曲了他的真实动机。参看前面提到的斯凯·马斯特森的故事。 另一方面,此前他们除了答应按照打表数目付钱之外,并没有许诺再向司机支付其他报酬。假如他们打算跟司机讨价还价,而这场谈判又破裂了,那么他们就得另找一辆出租汽车。他们的思路是,一旦他们到达酒店,他们的讨价还价地位将会大大改善。何况,此时此刻再找一辆出租车实在很不容易。 于是他们坐车出发,顺利到达酒店。司机要求他们支付以色列币2500谢克尔(相当于2.75美元)。谁知道什么样的价钱才是合理的呢?因为在以色列,讨价还价非常普遍,所以他们还价2200 谢克尔。司机生气了。他嚷嚷着说从那边来到酒店,这点钱根本不够用。他不等对方说话就用自动装置锁死了全部车门,按照原路没命地开车往回走,一路上完全没把交通灯和行人放在心上。两位经济学家是不是被绑架到贝鲁特去了?不是。司机开车回到出发点,非常粗暴地把他们扔出车外,一边大叫:“现在你们自己去看看你们那2200 谢克尔能走多远吧!" 他们又找了一辆出租车。这名司机开始打表,跳到2200谢克尔的时候,他们也回到了酒店。 毫无疑问,花这么多时间折腾对于两位经济学家来说还值不到300谢克尔。另一方面,这个故事却很有价值。它描述了跟那些没有读过我们这本书的人讨价还价可能存在什么样的危险。更普遍的情况是,我们不能忽略自尊和失去理性这两种要素。有时候,假如总共只不过要多花20美分,更明智的选择可能是到达目的地之后乖乖付钱。① ① 两位亲身参与了这一幕惊险闹剧,并且侥幸活着回来讲这个故事的经济学家分别是耶普大学的约翰·吉纳科普洛斯(John Geanakoplos)以及本书作者之一巴里· 奈尔伯夫。 这个故事还有第二个教训。设想一下,假如两位经济学家是在下车之后再来讨论价钱问题,他们的讨价还价地位该有多大的改善。(当然了,若是租一辆出租车,思路应该与此完全相反。假如你在上车之前告诉司机你要到哪里去,那么,你很有可能眼巴巴看着出租车弃你而去,另找更好的主顾。记住,你最好先上车,然后告诉司机你要到哪里去。) 11.未来的模样 前面的例子让我们初步领略了指导策略决策的原理。我们可以借助这些故事的寓意将这些原理进行归纳。 妙手传说告诉我们,在策略里,就跟在物理学当中一样,“我们所采取的每一个行动,都会引发一个反行动”。我们并非生活在一个真空世界,也不是在一个真空世界里举止行事。因此,我们不可以假定说,虽然我们改变了自己的行为,其他事情还会保持原样。 戴高乐在谈判桌上获得成功,这表明“只有卡住的轮子才能得到润滑油”① 。不过,坚持顽固强硬并非总是轻而易举,尤其在你遇到一个同样顽固强硬的对手而不得不表现得比对方更加顽固强硬的时候更难做到。 ① 有些读者可能还听过这个成语的另一个版本,说的是“咯吱作响的车轮才能得到润滑油”,意思是一样的,因为卡住的轮子需要更多的润滑油。当然,有时候它会被换掉。 古拉格的笑话以及给猫拴铃档的故事刻画了需要协调和个人牺牲才能有所收获的事情做起来可能具有的难度。贸易政策的故事则强调了逐个解决问题的危险性。在技术竞赛当中,就跟在帆船比赛中差不多,追踪而来的新公司总是倾向于采用更加具有创新性的策略,而龙头老大们则愿意模仿跟在自己后面的公司。 网球和税务审计的故事指出,策略的优势在于不可预测性。不可预测的行为可能还有一个好处,就是使人生变得更加有趣了。 我们当然可以再讲几个故事,借助这些故事再讲一些道理,不过,这不是系统思考策略博弈的最佳方法。从一个不同角度研究同一个主题会更见效。我们每次讲一个原理,比如承诺、合作和多管齐下。在每一个章节,我们还会介绍一些以这个主题为核心的故事,直到说清整个原理为止。然后,读者可以在每章后面所附“案例分析”中运用这个原理。 12 .案例分析之一:红色算我赢,黑色算你输 虽然我们两位作者也许永远没有机会担当美洲杯帆船赛的船长,但其中一位却遇到了一个非常接近的情形。巴里毕业的时候,为了庆祝一番,参加了剑桥大学的五月舞会(这是英国版本的大学正式舞会)。庆祝活动的一部分包括在一个赌场下注。每人都得到相当于20美元的筹码,截至舞会结束之时,收获最大的一位将免费获得下一年度舞会的人场券。到了准备最后一轮轮盘赌的时候,纯粹是出于一个令人愉快的巧合,巴里手里已经有了相当于700美元的筹码,独占鳌头,第二位是一名拥有300美元筹码的英国女子。其他参加者实际上已经被淘汰出局。就在最后一次下注之前,那个女子提出分享下一年舞会的人场券,但是巴里拒绝了。他占有那么大的优势,怎么可能满足于得到一半的奖赏呢? 为了帮助大家更好地理解接下去的策略行动,我们先来简单介绍一下轮盘赌的规则。轮盘赌的输赢取决于轮盘停止转动时小球落在什么地方。典型情况是,轮盘上刻有从0到36的37个格子。假如小球落在0处,就算庄家赢了。玩轮盘赌最可靠的玩法就是赌小球落在偶数还是奇数格子(分别用黑色和红色表示)。这种玩法的赔率是一赔一,比如一美元赌注变成两美元,不过取胜的机会只有18/37 。在这种情况下,即便那名英国女子把全部筹码押上,也不可能稳操胜券;因此,她被迫选择一种风险更大的玩法。她把全部筹码押在小球落在3的倍数上。这种玩法的赔率是二赔一(假如她赢了,她的300美元就会变成900美元), 但取胜的机会只有12/37 。现在,那名女子把她的筹码摆上桌面,表示她已经下注,不能反悔。那么,巴里应该怎么办? 案例讨论 巴里应该模仿那名女子的做法,同样把300美元筹码押在小球落在3的倍数上。这么做可以确保他领先对方400美元,最终赢得那张入场券:假如他们都输了这一轮,巴里将以400:0取胜;假如他们都赢了,巴里将以1300:900 取胜。那名女子根本没有其他选择。即使她不赌这一轮,她还是会输,因为巴里会和她一样退出这一轮,照样取胜。① 她的惟一希望在于巴里先赌。假如巴里先在黑色下注200美元,她应该怎么做?她应该把她的300美元押在红色。把她的筹码押在黑色对她没有半点好处,因为只有巴里取胜,她才能取胜(而她将是亚军,只有600美元,排在巴里的900美元后面)。自己取胜而巴里失败就是她惟一的反败为胜的希望所在,这就意味着她应该在红色下注。 这个故事的策略寓意与马丁·路德和戴高乐的故事恰恰相反。在这个关于轮盘赌的故事里,先行者处于不利地位。由于那名女子先下注,巴里可以选择一个确保胜利的策略。假如巴里先下注,那名女子就可以选择一个具有同样取胜机会的赌注。这里需要说明的是,在博弈游戏里,抢占先机、率先出手并不总是好事。因为这么做会暴露你的行动,其他参与者可以利用这一点占你的便宜。第二个出手可能使你处于更有利的策略地位。 ① 如果一定要说实话,这是巴里事后懊悔自己没有采取的策略。当时是凌晨3点,他已经喝了太多香槟,再也没有办法保持头脑清醒了。结果,他把200美元押在偶数上,心里嘀咕他输掉冠军宝座的惟一可能性就是这一轮他输并且她赢,而这种可能性的发生几率只有1:5 ,所以形势对他非常有利。当然,几率为1:5 的事情有时也会发生,这里讲的就是其中的一个例子:她赢了。 第2章 准备接招 1 .轮到你了,查理·布朗 连环漫画《花生》里有一个反复出现的主题,说的是露西(Lucy)将一个橄榄球按住,竖在地上,招呼查理·布朗(Charlie Brown)过去踢那个球。不过,每次到了最后一刻,露西总要拿走橄榄球,查理·布朗因为一脚踢空,仰天跌一跤,心怀不轨的露西就会高兴得不得了(如图2-1所示)。 任何人都会劝告查理·布朗不要上露西的当。即便露西去年(以及前年和再前一年)没有在他身上玩过这个花招,他也应该从其他事情了解她的性格,完全有可能预见她会采取什么行动。 就在查理盘算要不要接受露西的邀请跑去踢球的时候,她的行动还没有发生。不过,单凭她的行动还没有发生这一点,并不意味着查理就应该把这个行动看做是不确定性的。他应该知道,在两种可能的结果——让他踢中那个球以及让他仰天跌一跤——当中,露西倾向于后者。因此,他应该预见到,一旦时机到了,她就会拿走橄榄球。从逻辑推理得出的露西会让他踢中那个球的可能性实际上已经毫无影响。对这么一种可能性仍然抱有信心,套用约翰逊(Johnson)博士描述的再婚的特征,是希望压倒经验的胜利。查理不应该那样想,而应预见到接受露西的邀请最终会让自己仰天跌一跤。他应该拒绝露西的邀请。 2 .两种策略互动 策略博弈的精髓在于参与者的决策相互依存。这种相互影响或互动通过两种方式体现出来。第一种方式是相继发生,比如查理·布朗的故事。参与者轮流出招。每个参与者在轮到自己的时候,必须展望一下他的这一步行动将会给其他人以后的行动造成什么影响,反过来又会对自己以后的行动造成什么影响。 第二种互动方式是同时发生,比如第1章囚徒困境故事的情节。参与者同时出招,完全不理会其他人刚刚走了哪一步。不过,每个人必须心中有数,知道这个博弈游戏存在其他参与者,而这些人反过来也非常清楚这一点,如此类推。因此,每个人必须设想一下若是自己处在其他人的位置,会做出什么反应,从而预计自己这一步会带来什么结果。他选择的最佳策略也是这一全盘考虑的一个组成部分。 一旦你发现自己正在玩一个策略博弈,你必须确定其中的互动究竟是相继发生的还是同时发生的。有些博弈,比如橄榄球,同时具备上述两种互动元素。这时候你必须确保自己的策略符合整个环境的要求。在这一章,我们将粗略介绍一些有助于你玩相继发生的互动的博弈的概念和规则;而同时发生的互动的博弈将是第3章的主题。我们从非常简单、有时候是设计出来的例子开始,比如查理·布朗的故事。我们有意这么做,毕竟,这些故事本身并不十分重要,而正确的策略通常也是通过简单的直觉就能发现的,这么一来,可以更加清晰地凸显其中蕴涵的概念。我们用到的例子会在案例分析以及以后的章节里变得越来越接近现实生活,也越来越复杂。 3 .策略的第一法则 相继出招的博弈有一个总的原则,就是每一个参与者必须预计其他参与者接下来会有什么反应,据此盘算自己的最佳招数。这一点非常重要,值得确立为策略行为的一个基本法则。 法则1:向前展望,倒后推理。 展望你的最初决策最后可能导致什么结果,利用这个信息确定自己的最佳选择。 在查理·布朗的故事里,做到这点对所有人来说应该都是不费吹灰之力的,只有查理·布朗除外。他只有两个选择,其中一个导致露西在两个可能的招数之间选择了一个。大多数策略情况都会涉及一系列更长的决策结果,每个结果都有几种选择,单是口头上进行推理实在是无法表述清楚。要想成功地运用这个向前展望、倒后推理的法则,我们需要一个更好的视觉辅助工具。一个涵盖了博弈当中全部选择的“树状图”就是这么一个工具。现在我们就来演示一下怎么使用这些树。 4 .决策树与博弈树 一系列需要向前展望、倒后推理的决策,甚至有可能出现在一个孤立的决策者面前,而这个人并非置身于一个有其他人参加的策略博弈中。对于走在黄树林里的罗伯特·弗罗斯特(Robert Frost) : 两条路在树林里分岔,而我 我选择人迹罕至的那一条, 从此一切变了样。[1] 我们可以画出这样一幅示意图(如图2-2 所示)。 许多人走的路 黄树林 人迹罕至的路 到此未必就不用再选择了。每一条路后面可能还会有分岔,图2-2 相应也会变得越来越复杂。以下就是我们亲身经历的一个例子。 从普林斯顿到纽约旅行会遇到几次选择。第一个决策点是选择旅行的方式:乘公共汽车、乘火车还是自己开车。选择自己开车的人接下来就要选择走费拉扎诺·奈罗斯桥、荷兰隧道、林肯隧道还是乔治·华盛顿桥。选择搭乘火车者必须决定是在纽瓦克(Newark)换乘PATH列车"还是直达纽约宾夕法尼亚车站。等到进入纽约,搭乘火车或公共汽车的人还必须决定怎样抵达自己的最后目的地,是步行、乘地铁(是本地地铁还是高速地铁)、乘公共汽车还是乘出租车。最佳决策取决于多种因素,包括价格、速度、难以避免的交通堵塞、纽约城里的最终目的地所在以及对泽西收费公路上的空气污染的厌恶程度,等等。 图2-3 描述了你在每一个岔道口面临的选择,看上去就像一棵枝叶繁茂的大树,所以称为“决策树”。如何正确使用这样一张图或这么一棵树呢?绝对不是选择第一个岔道口看上去最好的分枝,然后等到下一个岔道口出现再去思考接下来应该怎么办;相反,你应该预计到以后将面临的选择,利用这些信息倒过头来确定前面几个岔道口你应该怎么决断。举个例子,假设你要去华尔街,乘PATH火车就好于开车,因为这条铁路从纽瓦克直达华尔街。 公共汽车 市内交通 在纽瓦克换乘PATH列车 市内交通 普林斯顿 火车 直达宾夕法尼亚车站 市内交通 费拉扎诺·奈罗斯桥 小汽车 荷兰隧道 林肯隧道 乔治·华盛顿桥 我们可以通过一棵这样的树描述一个策略博弈当中的选择,不过,现在出现了一个新的元素。我们遇到一个有两个人或更多人参与的博弈。沿着这棵树出发,后面许多分枝可能是几个参与者轮流决策。每个参与者在前一个分枝做决策时必须向前展望,而且考察的范围不应仅局限于他自己的决策,还要包括其他参与者的决策。他必须对其他人的下一步决策进行预计,办法就是置身于其他参与者的地位,按照他们的思维方式进行思考。为了强调一下这个做法与前面一个做法的区别,我们把一棵反映一场策略博弈当中的决策次序的树称为“博弈树”,而把“决策树”留做描述只有一个人参加的情形。 虽然查理·布朗的故事简单得简直令人难以置信,不过,你还是可以通过将这个故事放进一棵博弈树,开始熟悉博弈树的概念。这个博弈从露西发出邀请开始,查理·布朗面临的选择是要不要接受邀请。假如查理拒绝邀请,那么这个博弈到此为止。假如他接受,露西就有两个选择,一是让查理踢中那个橄榄球,二是把球拿走。我们可以通过添加一个分枝的方法描绘这个故事。 正如我们在前面说过的那样,露西有两个选择,即图2-4中的上下两个分枝,查理应该预计到她一定会选择上面那个分枝。因此,他应该置身于她的地位,从这棵树上剪掉下面那个分枝。现在,回到他自己的两个选择,也是上下两个分枝,假如他选择上面那个分枝,结果一定是仰天跌一大跤。因此,相比之下,他更好的选择是沿着下面的分枝前进。 把球拿走 露西 接受 查理 让查理踢 拒绝 图2-4 为了进一步了解这个思路,我们不妨设想一个包含同样一棵博弈树的商界中的例子。我们不想惹恼任何一个真实存在的公司,在此先向格雷厄姆·格林(Graham Greene)道歉,我们借用的是他的例子:假设在卡斯特罗执政之前的古巴,吸尘器市场由一家名为“快洁”的公司独占,一家名为“新洁”的新公司正在考虑要不要进军这个市场。假如‘新洁”决定进入,“快洁”将面临两个选择:一是接纳“新洁”,和平共处,满足于一个与以前相比降低了的市场份额,二是打一场价格战。① 假设“快洁”接纳“新洁”;后者就可以赚得10万美元利润,但是,假如“快洁”发动一场价格战,就将给“新洁”造成20万美元的损失。假如“新洁”决定留在市场外而不进入,那么它的利润当然为零。下面我们画出这棵博弈树(如图2-5 所示),标明每一种结果会带来什么样的利润。 ① 在格林(Greene)写的《我们在哈瓦那的人》(Our Man in Havana)一书中,为这两家公司当中一家工作的销售员决定打仗,只不过用的是毒药而不是价格。 接纳 新洁得10万美元 快洁 打价格战 新洁亏20万美元 进入 新洁 不进入 新洁得0 美元 图2-5 “新洁”应该怎么办?这是决策分析员需要解决的问题,也是商学院里讲授的问题。他们会画出一幅非常相似的图,却称之为“决策树”。理由是,他们通常把“接纳”和“打价格战”两种选择方案的结果看做偶然现象。因此他们会标出两者的出现概率。比如,假如他们认为接纳与打价格战出现的机会一样大,那么两者的概率同为1/2。接着,他们可以计算出“新洁”进人市场会得到多少利润,方法是将盈利和损失分别乘以相应的概率再相加。他们得到 1/2*$100000-1/2*$200000=-$50000 由于这是一个亏损数字,商业分析员们就会根据这些概率下结论说“新洁”不应该进军古巴市场。 以上的估计数字是从哪里来的呢?博弈论提供了答案:它们来自“新洁”自己对“快洁”在各种情形下的利润情况的估计。要估计“快洁”会怎么做,“新洁”首先应该估计“快洁”在不同情形下会得到多少利润。然后通过向前展望、倒后推理,预计对方会怎么做。进一步分析这个例子:我们假设“快洁”作为一个垄断者,有能力赚取30万美元利润。与“新洁”分享市场则意味着自己的利润降为10万美元。另外,从“快洁”这边估计,发动一场价格战的代价是10万美元。现在我们可以在这棵树上添加这些结果(如图2-6 所示)。 接纳 新洁得10万美元快洁得10万美元 快洁 打价格战 新洁亏20万美元快洁亏10万美元 进入 新洁 不进入 新洁得O美元快洁得30万美元 图2-6 我们利用这棵树包含的信息预计以后的全部招数。由于具体招数可以由这个博弈的结果确定,这棵树完全适合看做一棵博弈树,而不是一棵决策树。比如,要预计“快洁”对“新洁”进入的反应,我们知道,“快洁”接纳“新洁”的话仍会有10万美元利润,发动价格战则会损失10万美元;“新洁”应该预计到“快洁”会选择前者。向这个方向展望,同时倒后推理,“新洁”应该在盘算的时候先把打价格战这个分枝去掉。它应该进入这个市场,因为预计它可以赚到10万美元。 若是换了其他环境,最后的决策可能发生变化。比如,假设“新洁”下一步有可能继续进军“快洁”早已建立市场的其他岛屿,“快洁”大约会觉得有必要在这个新来者面前摆出一副不好对付的样子,宁可在古巴损失10万美元也要发动一场价格战。“新洁”应该看到,这意味着自己注定会损失20万美元,最后决定还是留在外面,不要硬闯的好。 “新洁”可以看出任何一个得失数字都会转化为相应的行动。不过,它自己可能并不知道“快洁”在这棵树的顶端会得到什么样的回报。这种利润的不确定性将会转化为行动的不确定性。比如,“新洁”可能认为,有33.3%的机会“快洁”会在一场价格战中损失10 万美元,有33.3%的机会双方会打个平手(利润为零),最后还有33.3%的机会“快洁”即便打价格战也能赚到12万美元。若遇到这种情况,“向前展望,倒后推理”会认为,有2/3 的概率“快洁”会选择接纳“新洁”——赚到10万美元总比损失10万美元或双方打个平手要好,只比不上赚到12万美元。因此,发动一场价格战的可能性是33.3%。要弄清究竟会发生什么情况,惟一途径就是进军市场。不过,基于上述可能性,“新洁”有2/3 的概率赚到10万美元,1/3 的概率损失20万美元,因此,它的预计利润实际为零,根本没有理由进军市场。 在这个例子里,“新洁”对于“快洁”的得失的不确定性直接转化为对“快洁”会有什么反应的概率估计。不过,我们必须注意应该在哪里加人这种不确定性。正确的地方是在树的末端。现在就来看看,假如我们在考虑的时候企图跳到前面去会犯什么错:平均而言,“快洁”可以在一场价格战当中赚到$6667(即1/3*$120000+1/3*$0-1/3*$100000 )。但这并不意味着“快洁”就一定想打价格战。愿意打价格战的可能性不是100%。而且这种不确定性并不表示我们就应该猜测“快洁”愿意打价格战的可能性是50%。对“新洁”而言,分析这个问题的正确思路是从这个博弈的终点着手,预计“快洁”每一步会怎么做。 5 .更加复杂的树 在现实生活里,你会遇到的博弈远比上述我们用来进行形象描述的例子复杂。不过,即便这些“小树苗”长成“大树”,同样的原理也依然管用。象棋(国际象棋)可能是最好的例子。虽然象棋的规则相对比较简单,却已经形成一种需要进行策略推理的博弈游戏。白棋先行,黑棋回应,双方依次相继移动。因此,象棋当中最“纯粹”的策略推理就包含着向前展望你自己这一步将会导致什么后果,就跟我们在前面看到的一样。其实例可能是这样:“假如我现在走兵,我的对手就会进马,威胁我的车。我在走兵之前必须用我的象护住那四个格子,不让对手的马得逞。” 象棋是一种相继出招的博弈游戏,我们可以用一棵树来表示。白方可以从20种开局方式中任选一种。[2]在图2-7 中,我们用这棵树的第一个决策点(或节点)表示白方拥有的第一个先行机会,标为W1。他可以选择的20种走法变成20个枝条,从这个节点发散出去。每一个枝条代表的行动方式就是这个枝条的标签:兵进K4 (P-K4 或代数标记法里的e4)、兵进Q4 ,等等。我们的目的只是描述普遍情况,因此,为了避免这幅图表变得枝节丛生,我们不会显示或标明所有枝条。每一个枝条都会引出下一个节点,代表黑方的第一次行动,标为B1。黑方同样可以从20种开局方式中任选一种,于是,同样会有20个枝条从每一个标明B1的节点发散出去。双方走完第一步,我们已经看到有400种可能性。从现在开始,枝条的数目就会取决于前面一步。举个例子:假如白方的第一步是P-K4 ,他的第二步就有许多选择,因为他的后以及王旁边的象现在都可以出动。然后你就会发现,建立这棵树所要运用的原理多么简单,而这棵树在实践中又会很快变得多么复杂。 我们可以选择这棵博弈树上每一个决策点(节点)的一个枝条,沿着这个枝条一路走下去。这表示这盘博弈继续下去的一种特定方式。象棋大师早在博弈初期(开局阶段)就盘算过许多这样的路径,考虑过这些路径会有什么结果。比如我们已经标出的路径,白方第一步是P-K4 ,黑方以P-QB4 回敬,就是预兆一场恶战的西西里防御。① ① 继续下去,就是第二步,N-KB3,P-Q3 ;第三步,R-Q4,PxP ;第四步,NxP , N-KB3;第五步,N-QB3 , P-QR3 ;第六步,B-KN5 , P-K3 ;第七步,P-KB4,Q-N3 ;第八步,Q-Q2,QxP 。这种走法称为毒兵变局(Poisoned pawn variation) ,听上去好像来自善于玩弄阴谋诡计的西班牙博尔吉亚家族(the Borgias)的宫廷,或是华尔街。 在许多博弈里,每一条这样的路径都会在有限次的选择之后到达终点。在体育或棋类比赛中,这可能是在一方取胜或双方打平的时候。更常见的情况是,博弈的最终结果可能是以给参与者货币回报、非货币回报或惩罚的形式出现。比如,商业对手之间的一场商界博弈可能给一家公司带来非常可观的利润,却使另一家公司破产。而核军备竞赛的博弈则可能达成一项成功的条约或导致两败俱伤。 假如一个博弈无论选择哪一条路径,都会在有限次的行动之后到达终点,我们在理论上就可以完全解决这个博弈。这意味着能找出谁将取胜以及他将怎样取胜。这是通过沿着这棵树倒后推理得出的。一旦我们走通了整棵树,我们就会发现我们究竟能不能取胜,还有,假如可以取胜,我们应该使用怎样的策略。对于任何一个相继选择并且数目有限的博弈,总是存在某种最佳策略。当然,存在一个最佳策略并不等于说我们总是可以轻而易举地找到这个最佳策略。象棋就是一个很好的例子。临到比赛结束之际,象棋大师在刻画最优策略方面一直做得非常出色。一旦棋盘上只剩下三四个棋子,大师级选手就能预见博弈的结局,(通过倒后推理)确定一方有没有一个万无一失的取胜策略,或另一方是否能迫使双方打平。接着,他们可以通过预计最后阶段的各种不同局势,评估中盘阶段的策略。问题在于,从来没有人可以一直倒后走通整棵树,直到开局的第一步。 一些简单的博弈可以用这样的方法得到完全解决。比如,3 x3 的连城游戏总是可以变成平局。① 这也是只有小孩才玩这个游戏而大人不屑一顾的原因。即便是西洋跳棋,也存在这个问题。大家都相信,第二个参与者总有办法达成平局,虽然这一结论尚未得到证明。为了保持大家对这种游戏的兴趣,西洋跳棋比赛让参与者从中局开始行动,在中局大家还看不出什么取胜或打平的策略。等到象棋也有可能用这种方法完全解决的那一天,象棋的规则大概也得进行修改了。 ① 你也许觉得连城游戏是一种简单的博弈,但你还是不要指望能画出这裸博弈树。请注意,没有一局能在第五次行动之前走完,因为直到这时其中一方才第一次有机会在棋盘上放下三颗棋子,而此时枝条的数目已经达到9x8x7x6x5 = 15120 。当然,即便如此,这个博弈还是可以轻易解决,因为大多数枝条从策略上看是一模一样的。举个例子:虽然第一步有9种可能的走法,但这个博弈的对称性使我们不难发现,实际上这里只有3种完全不同的走法,即角、边线或中间。正是这样的小诀窍使这棵博弈树变得易于处理。 而在目前阶段,象棋参与者都做了什么呢?他们做了我们大家将相继移动的策略运用到实践中去的时候都应该做的事情:将向前展望分析与价值判断结合在一起。他们会问:“这条路在四五步之后会使自己争得一个有利局面,抑或陷入一个不利局面?”他们假设现在比赛已经结束,由此判断每一个可能的结果的价值。然后,他们选择那个五步之后可以达到最大价值结果的策略,向前展望,倒后推理。倒后推理是相对容易的部分。难的是怎样确定中盘局面的价值。每一个子的价值都要计算在内,同时要在吃子与取势两方面的优势之间进行权衡取舍。保罗·霍夫曼(Paul Hoffman)在他的《阿基米德的报复》(Archimedes' Revenge)一书中描述了汉斯·伯利纳(Hans Berliner)的电脑象棋程序。伯利纳是以通讯方式进行的象棋比赛的世界冠军,研制了一台专门用于下象棋的电脑,可以在每一步棋限定的3分钟之内检查3000 万种备选方案。伯利纳还确定了一个很好的规则,用于评估中盘局面的价值。能林够击败这个电脑程序的人不超过300名。在十五子棋比赛中,伯利纳也开发了一个程序,该程序已经使世界冠军俯首称臣。 将倒后推理的清晰逻辑与基于实践经验确定的、评估中盘局面价值高低的最佳规则结合起来,是处理远比象棋复杂的博弈的一种有用方法。 6 .讨价还价 无论在商界还是在国际政坛,参与各方经常通过讨价还价或者谈判来决定总收益这个“蛋糕”应该怎样划分。我们将在第11章更详细地探讨这一现象。现在我们把它当做一个形象的例子,解释倒后推理这一方法怎样使我们得以预见相继行动的博弈的结果。 大多数人基于社会常识,预测一场谈判的结果就是妥协。这样做的好处是能够保证“公平”。我们可以证明,对于许多常见类型的谈判,一个50对50的妥协也是倒后推理的结果。 首先,我们必须认识讨价还价的两个普遍特征。我们必须知道谁向谁提出了一个什么条件,换言之,就是这个博弈的规则是什么;接着,我们还要知道,假如各方不能达成一个协定,将会导致什么后果。 不同的谈判按照不同的规则进行。在大多数零售店里,卖方会标出价钱,买方的惟一选择就是要么接受这个价格,要么到别的店里碰运气。① 这是一个简单的“接受或者放弃”的法则。而在工资谈判的例子中,工会首先提出一个价码,接着公司决定是不是接受。假如公司不接受,可以还一个价码,或者等待工会调整自己要求的价码。有些时候,相继行动的次序是由法律或者习俗决定的,还有些时候这一次序本身就具有策略意义。接下来,我们会探讨一个讨价还价的问题,在这个问题里,双方轮流提出条件。 ① 有些顾客似乎可以在任何地方(甚至包括西尔斯百货公司)讨价还价。在这方面,赫伯·科恩(Herbo Coben)的著作《你可以就任何事情讨价还价》(You Can Negotiate Anything)提供了许多有用的小提示。 谈判的一个必不可少的特征在于时间就是金钱。假如谈判越拉越长,蛋糕就会开始缩水。不过,这时各方仍然可能不愿意妥协,暗自希望只要谈成一个对自己更加有利的结果,其好处就将超过谈判的代价。查尔斯·狄更斯(Charles Dickens)的《荒凉山庄》(Bleak House)描述了一个极端的情形:围绕贾恩迪斯(Jarndyce)山庄展开的争执变得没完没了,以至于最后整个山庄不得不卖掉,用于支付律师们的费用。按照同样的思路,假如不能达成工资协定而引发罢工,那么公司就会失去利润,工人就会失去工作。假如各国陷人一轮旷日持久的贸易自由化谈判,它们就会在争吵收益分配的时候丧失贸易自由化带来的好处。这些例子的共同点在于,参与谈判的所有各方都愿意尽快达成协议。 在现实生活中,收益缩水的方式非常复杂,不同情况缩水比例也不同。不过,我们可以用一种非常简单的方法充分阐明这一点:假设每提出一个建议或反建议,蛋糕都会朝零的方向缩小同样大小;设想这是一个冰淇淋蛋糕,孩子们一边争吵怎么分配,蛋糕一边融化。 首先,假设整个过程总共只有一步。桌子上放了一个冰淇淋蛋糕;一个孩子(Ali ,阿里)向另一个孩子(Baba ,巴巴)提议应该如此这般分配。假如巴巴同意,他们就会按照提议分享这个蛋糕;假如巴巴不同意,蛋糕融化,谁也吃不到。 现在,阿里处于一个强有力的地位:她使巴巴面临有所收获和一无所获的选择。即便她提出自己独享整个蛋糕,只让巴巴在她吃完之后舔一舔切蛋糕的餐刀,巴巴的选择也只能是舔一舔,否则他什么也得不到。 当然,巴巴可以因为感到这么分配太不公平而生气,断然拒绝接受这一条件。又或者,他可能希望建立或者保持自己作为一个不好对付的讨价还价者的形象,从而为日后的讨价还价奠定基础,而日后的讨价还价可能是跟阿里进行,也可能是跟其他得知今天自己所作所为的孩子们进行。在实际操作当中,阿里同样需要考虑到这些问题,要向巴巴放出刚好足够的诱饵(比如一小片蛋糕?) ,引诱他上钩。为简化阐述过程,我们将所有这些复杂问题搁在一边,假设阿里可以拿走她所要求的100%的份额。实际上,我们还可以不考虑留给巴巴舔的餐刀,假定阿里有能力提出“接受或者放弃”的条件,她可以得到整个蛋糕。① ① 同样的简化做法还将用在我们对更多回合的建议和反建议的讨论上。读者可以很方便地将我们的分析套用到一个更接近现实、但也更庞大的决策过程中,这个过程可以将我们在这里忽略的复杂情况包含在内。 一旦出现第二轮谈判,局势就会大大偏向巴巴。不妨再设想一下,现在桌子上放了一个冰淇淋蛋糕,但是两轮谈判过后,整个蛋糕就会融化。假如巴巴拒绝接受阿里提出的条件,他可以提出一个反建议,不过,到这时,桌子上只剩下半个蛋糕了。假如阿里拒绝接受巴巴的反建议,剩下的半个蛋糕也会融化,双方都会一无所获。 现在,阿里必须向前展望她最初提出的条件会有什么后果。她知道,巴巴可以拒绝她的条件,从而占据有利地位,反过来就剩下的半个蛋糕提出“接受或者放弃”的分配方案。这实际上意味着巴巴已经将那半个蛋糕掌握在自己手里。因此,他不会接受任何低于阿里第一轮条件的反建议。假如阿里不能阻止这一幕发生,她将一无所获。一旦看清了这一点,她会从一开始就提出与巴巴平分这个蛋糕,这正是刚好足够引诱对方接受而又为自己保有一半收益的条件。于是他们会马上达成一致,平分这个蛋糕。 说到这里,个中原理已经非常清楚,我们的讨论还可以再进一步。分析结果是相同的,要么加速谈判进程,要么延缓蛋糕融化速度。随着谈判各方提出每个建议和反建议,蛋糕也在融化,从一个变成2/3再变成1/3,直到零,什么也剩不下。假如阿里提出最后一个建议,而蛋糕已经缩小到只有1/3,她就可以全部拥有。巴巴知道这一点,所以在轮到自己提条件的时候(这时蛋糕还剩下2/3)许诺分给她1/3。这么一来,巴巴可以得到的最好结果就是1/3 个蛋糕,即剩下的2/3的一半。阿里知道这一点,所以从一开始就许诺分给巴巴1/3 (刚好足够引诱对方接受),自己得到2/3 。 各得一半的分配方案存在什么规律吗?每一次的步骤数目都是偶数,且这一现象反复出现。更重要的是,即便步骤数目是奇数,随着步骤数目增加,双方也会越来越接近一半一半的分配方案。 若是四步,巴巴得以提出最后一个条件,从而得到这个时候桌子上剩下的1/4个蛋糕。因此,阿里必须在倒数第二轮提出分给巴巴1/4 个蛋糕,当时桌子上还剩下半个蛋糕。而在此前的一轮,巴巴可以让阿里接受分给她剩下的3/4个蛋糕中1/4个蛋糕的条件。因此,一路这么向前展望下去,在讨价还价一开始,阿里就应该提出分给巴巴半个蛋糕,自己得到另一半。 若是五步,阿里一开始可以提出分给巴巴2/5个蛋糕,自己得到3/5 。若是六步,那么分配方案又回到各得一半。若是七步,阿里得到4/7,巴巴得到3/7。更为普遍的情况是,假如步骤数目是偶数,各得一半。假如步骤数目n是奇数,阿里得到(n+l)/(2n),而巴巴得到 (n-1)/(2n)。等到步骤数目达到101,阿里可以先行提出条件的优势使她可以得到51/101个蛋糕,而巴巴得到50/101 个。 在这个典型的谈判过程里,蛋糕缓慢缩小,在全部消失之前有足够时间让人们提出许多建议和反建议。这表明,通常情况下,在一个漫长的讨价还价过程里,谁第一个提出条件并不重要。除非谈判长时间陷入僵持状态,胜方几乎什么都得不到了,否则妥协的解决方案看来还是难以避免的。不错,最后一个提出条件的人可以得到剩下的全部成果。不过,真要等到整个谈判过程结束,大概也没剩下什么可以赢取的了。得到了“全部”,但“全部”的意思却是什么也没有,这就是赢得了战役却输掉了战争。 我们必须看到很重要的一点:虽然我们考虑过许多可能的建议和反建议,预期结果却是阿里的第一个条件能够被对方接受。谈判过程的后期阶段不会再发生。不过,假如第一轮不能达成一致,这些步骤将不得不走下去,这一点在阿里盘算怎样提出一个刚好足够引诱对方接受的第一个条件时非常关键。 这个观察结果反过来提示了另一种讨价还价策略。向前展望、倒后推理的原理可能在整个过程开始之前就已经确定了最后结果。策略行动的时间可能提前,在确定谈判规则的时候就已经开始。 同样的观察结果还会引出一个谜。假如讨价还价的过程真像这里阐述的那样,应该不会出现罢工。当然,罢工的可能性会影响最终达成的协议,不过公司会把握第一个提条件的机会,提出一个刚好足以引诱对方接受的条件,工会也会这样做。罢工变成现实,或者更普遍的情况,即谈判破裂,一定是现实生活更微妙或者更复杂的特征引出的结果,而这些特征早已从上述这个简单的故事中排除出去,未予考虑。我们会在第11章探讨其中一些问题。 7 .战争与和平 倒后推理的另一个实例是怎样通过一系列双边谈判维护和平。我们举一个只有部分假设的例子:苏丹是一个相对弱小的国家,现在面临被其邻国利比亚人侵的危险。假如这两个国家在某种程度上都是与外界隔绝的,那么,要想阻止利比亚人侵并击败苏丹简直毫无可能。 尽管两个敌对邻居可能无法继续和平共处,但第三方的存在也许可以构成必要的制约。在利比亚与苏丹的例子里,这一原理可能会是“我的敌人的敌人就是我的朋友”。假如利比亚真要跟苏丹开战,那么,利比亚将不得不从东部与埃及接壤的边境抽调兵力。埃及当然不愿意贸然入侵一个全副武装的利比亚,不过,假如利比亚跟苏丹打仗而实力大减,埃及人也许会得到一个难以抗拒的大好机会,一举干掉这个麻烦的邻居。利比亚可以(或者至少应该)通过倒后推理,预计到一旦他们进攻苏丹,埃及就会人侵。表面看来,苏丹安全了。不过,在三个国家后面就停止继续思考这个问题,可能会造成一种虚假的安全感。 假如三个敌人可以达成稳定状态,四个又如何?现在加入以色列。假如埃及要打利比亚的主意,很有可能遭到以色列入侵。在萨达特(Sadat)和贝京(Begin)将双方关系正常化以前,这确实是埃及面临的一个严重威胁。在1978年以前,利比亚不必担心埃及入侵,就是因为埃及一想到以色列就战战兢兢,不敢大意。结果,苏丹不可能指望埃及来抑制利比亚的扩张野心。① 随着以色列与埃及关系改善,倒后推理的链条在埃及这里中断,而苏丹也安全了,至少目前是这样。 ① 由此我们知道“我的敌人的朋友不是我的朋友”。 这个关于制约因素的例子当然经过了必要的格式化,这样它更加切合我们讨论的主题。从表面看来,这个例子说明,一个国家究竟会不会遭到入侵,将取决于潜在侵略者链条的节点数目是奇数还是偶数。一个更加接近现实生活的情况分析可以把国与国之间的复杂关系考虑在内,从而得到更多细节,用于分析一国入侵别国的企图究竟有多大。不过,还有一个重要的结论:博弈的结果在很大程度上取决于参与者的人数。参与的人越多越好,参与的人越少越糟,即便在同一个博弈里也是如此。但是,两个敌对国家难以和平共处、三个敌对国家就能恢复稳定局面的结论并不意味着若有四个敌对国家就更好;在这个例子里,四个的结果跟两个是一样的。② ② 实际上,假如这个链条存在的国家数目是奇数,那么,A是安全的。假如这个链条的节点数目是偶数,那么B就会人侵A;B发动入侵之后,链条上的节点数目就会减为奇数,B就安全了。 为了进一步阐述这个制约因素的观点,我们请读者研究本书最后一章“案例分析”的“三方对决”一节。三个敌对者,实力各不相同,现在必须决定自己应该袭击哪一个。你可能会发现答案令人大吃一惊。 8 .英国人玩的博弈 本章我们讨论了有序行动或者有序移动的博弈。实际上,现实生活当中没有几个博弈存在清晰界定而参与者又必须遵守的行动规则。参与者自己制定自己的规则。那么,他们怎么才能向前展望、倒后推理呢?他们又怎么才能知道这个博弈究竟有没有行动次序呢? 我们借用1987年英国大选的情形说明这一点。玛格丽特·撒切尔(Margaret Thatcher)领导的执政保守党面对以尼尔·金诺克(Neil Kinnock)为首的工党的挑战。大选期间,双方都要选择是走平坦大道,即以就事论事为原则进行竞选,还是走崎岖小径,即进行人身攻击。选民当中很大一部分人对撒切尔夫人的政绩深表满意,因此,假如双方按照相仿的规矩拉票,将出现整个竞选一面倒的局面,撒切尔夫人就会取胜。 金诺克先生的惟一希望,在于他可以通过风格完全不同的拉票活动,建立一个足以超越对手的好印象。现在我们假设,撒切尔夫人选择平坦大道,而他选择崎岖小径,或者两者调换选择,他的成功概率都是一样的。假设他们私下里都愿意选择平坦大道,但这一想法必须让位给取胜这一目标。 哪一条才是“人迹罕至”的路呢?答案取决于双方做决定的次序。我们现在就来考察一些可能出现的情况。 假设撒切尔夫人首先选择竞选风格,这是因为,比如说,就传统而言都是执政党在反对党之前公布自己的竞选纲领。这样,她可以画出下面的博弈树(如图2-8 所示)。 通过向前展望和倒后推理,撒切尔夫人可以预计,假如她选择平坦大道,金诺克先生一定会选择崎岖小径,反之亦然。① 既然两个方案赋予她的取胜概率相同,她愿意选择平坦大道。 ① 苏格兰民歌《罗梦湖》(Loch Lomond)唱道:“噢,你走你的平坦大道,我走我的崎岖小径,我会比你早到苏格兰。”因此,我们必须指出,工党在苏格兰赢得了多数议席,虽然保守党以大比分赢得了整个英国大选。 撒切尔夫人先行会使她陷于不利,因为这么一来,金诺克先生就可以选择与其完全不同的道路。不过,她先行本身不会造成这个问题。现在我们在这个对局上做一个小小的修改。假设撒切尔夫人已经跟她的保守党顾问以及竞选宣传经理们开过会,确定了她的策略。但是这一决定“没有公开。金诺克先生也在开同样一个会议。他应该怎么做?他应不应该假设撒切尔夫人在先行的时候,是按照我们刚刚描述的方法进行推理的呢?那将意味着她已经选择了平坦大道,因此金诺克先生应该选择走崎岖小径。不过,假如撒切尔夫人想到金诺克先生也会这么想,她就会为自己选择崎岖小径的策略。金诺克先生并不确实知道她的选择,他若是忽略这么一种“第二层次”的思考,他就是一个大傻瓜。那么、他应不应该选择平坦大道呢?不一定,因为撒切尔夫人可以想到“第三层次”,如此类推。一个普遍的观点是若要运用向前展望、倒后推理的原理,不可缺少的前提是后行者可以观察到先行者的行动。 即便撒切尔夫人先行,而她的选择也是外人可以看到的,但如果她在竞选期间改变策略,又会发生什么情况呢?假设只有选民得到的最后印象才算数,而撒切尔夫人在第一次发表声明的时候说了什么无关紧要。金诺克先生绝不能信以为真,并据以制定自己的策略。反过来,撒切尔夫人在考虑自己应该怎么迈出第一步的时候,也不能指望金诺克先生只有一种反应方式。这样,我们就得到向前展望、倒后推理原理的另一个适用条件:策略必须是不可逆转的。 假如这两个条件有一个不符合,又会怎么样?即便两党是在不同时间做出各自的决定,就策略思维而言,这些决定就跟同时做出没有两样。从相继做出决定到同时做出决定的转变,可能对两党中的一方有利,也可能对双方都有利。实际上,在1987年的英国大选中,双方至少都改变了一次自己的策略。第3章将提出同时进行的博弈的行动规则。 关于相继行动与同时行动的博弈的区别,体育比赛提供了另一个例子。百码短跑是同时行动的博弈,因为根本没时间排出相继行动的次序。而在蝶泳比赛中,运动员也许有时间进行思考,却会发现看清对手的位置是非常困难的。马拉松比赛具有相继行动的博弈的组成成分:运动员们可以看到其他人的位置(以一点为基准),策略也是不可逆转的,因为不可能回头重新比赛早先跑过的路程。 结束这一章的时候,我们回到查理·布朗要不要踢那个橄榄球的问题。在橄榄球教练汤姆·奥斯本(Tom Osborne)指挥冠军争夺战的最后几分钟,这个问题真的出现了。我们同样认为他做了错误的选择。倒后推理可以揭示错误的原因。 9 .案例分析之二:汤姆·奥斯本与1984年橙碗球场决赛的故事 在1984年的橙碗球场决赛上,战无不胜的内布拉斯加打谷者队( Nebraska Cornhuskers)与曾有一次败绩的迈阿密旋风队(Miami Hurricanes)狭路相逢。因为内布拉斯加队晋身决赛的战绩高出一筹,只要打平,它就能以第一的排名结束整个赛季。 不过,在第四节,内布拉斯加打谷者队以17:31 落后。接着,他们发动了一次反击,成功触底得分,将比分追至23:31。这时,内布拉斯加队的教练汤姆·奥斯本面临一个重大的策略抉择。 在大学橄榄球比赛中,触底得分一方可以从距离入球得分线只有2 1/2码的标记处开球。该队可以选择带球突破或将球传到底线区,再得2分;或者采用一种不那么冒险的策略,将球直接踢过球门柱之间,再得1分。 奥斯本选择了安全至上,内布拉斯加队成功射门得分,比分改写为24:31 。该队继续全力反击。在比赛最后阶段,他们最后一次触底得分,比分变成30:31 。只要再得1 分,该队就能战平对手,取得冠军头衔。不过,这样取胜总不大过瘾。为了漂亮地拿下冠军争夺战,奥斯本认为他应该在本场比赛取胜。 内布拉斯加队决定要用得2分的策略取胜。欧文·弗赖尔(Irving Fryer)接到球,却没能得分。迈阿密队与内布拉斯加队以同样的胜负战绩结束全年比赛。由于迈阿密队击败内布拉斯加队,最终获得冠军的是迈阿密队。 假设你自己处于奥斯本教练的位置。你能不能做得比他更好? 案例讨论 星期一出版的许多橄榄球评论文章纷纷指责奥斯本不应该贸然求胜,没有稳妥求和。不过,这不是我们争论的核心问题。核心问题在于,在奥斯本甘愿冒更大的风险一心求胜的前提下,他选错了策略。他本来应该先尝试得2分的策略,然后,假如成功了,再尝试得1 分的策略,假如不成功,再尝试得2分的策略。 让我们更仔细地研究这个案例。在落后14分的时候,奥斯本知道他至少还要得到两个触底得分外加3分。他决定先尝试得1分的策略,再尝试得2分的策略。假如两个尝试都成功了,那么使用两个策略的先后次序则无关紧要。假如得1分的策略失败,而得2分的策略成功,先后次序则仍然无关紧要,比赛还是以平局告终,内布拉斯加队赢得冠军。先后次序影响战局的惟一可能性在于内布拉斯加队尝试得2分的策略没有成功。假如实施奥斯本的计划,这将导致输掉决赛以及冠军锦标。相反,假如他们先尝试得2分的策略,那么,即便尝试失败,他们仍然未必输掉这场比赛。他们仍然以23:31落后。等到他们下一次触底得分,比分就会改为29:31 。这时候,只要他们尝试得2分的策略得手,比赛就能打成平局,他们就能赢得冠军头衔!① ① 而且,这将是尝试取胜的努力失败之后导致的平局,因此没有人会批评奥斯本,说他一心想打成平局。 我们曾经听到有人反驳说,假如奥斯本先尝试得2分的策略,那么,如果没有成功,他的队将只能为打平对手而努力。但这么做不是那么鼓舞人心,并且他们很有可能不能第二次触底得分了。更重要的是,等到最后才来尝试这个已经变得生死攸关的得2分的策略,他的队将陷入成败取决于运气的局面。这种看法是错的,有几个理由。假如内布拉斯加队等到第二次触底得分才尝试得2分的策略,一旦失败,他们就会输掉这场比赛。假如他们第一次尝试得2分的策略失败,他们仍然有机会打平。即使这个机会可能非常渺茫,但有还是比没有强。激励效应的论点也站不住脚。这是因为,虽然内布拉斯加队的进攻可能在冠军决赛这样重大的场合突然加强,但迈阿密队的防守也会加强。这场比赛对双方是同样重要的。相反,假如奥斯本第一次触底得分之后就尝试得2分的策略,在一定程度上确实存在激励效应,提高第二次触底得分的概率。这也使他可以通过两个三分球打平。 从这个故事中可总结的教训之一在于,假如你不得不冒一点风险,通常都是越早冒险越好。这一点在网球选手看来再明显不过了:人人都知道应该在第一发球的时候冒风险,第二发球则必须谨慎。这么一来,就算你一发失误,比赛也不会就此结束。你仍然有时间考虑选择其他策略,并借此站稳脚跟,甚至一举领先。 第3章看穿对手的策略 每个星期,《时代》和《新闻周刊》都会暗自较劲,非要做出最引人注目的封面故事不可。一个富有戏剧性或者饶有趣味的封面,可以吸引站在报摊前的潜在买主的目光。因此,每个星期,《时代》的编辑们一定会举行闭门会议,选择下一个封面故事。他们这么做的时候,很清楚在某个什么地方,《新闻周刊》的编辑们也在关起门来开会,选择下一个封面故事。反过来,《新闻周刊》的编辑们也知道《时代》的编辑们正在做同样的事情,而《时代》的编辑们也知道《新闻周刊》的编辑们知道这一点…… 这两家新闻杂志投入了一场策略博弈,不过,这个博弈从本质上看跟我们已经讨论过的博弈存在很大差别。第2章讨论的博弈是由一系列相继进行的行动组成的。查理·布朗在选择要不要踢那个橄榄球时,心里明白露西现在还没有决定要不要拿走那个球;在象棋里,白方与黑方交替行动。相反,《时代》与《新闻周刊》的行动却是同时进行的。双方不得不在毫不知晓对手的决定的情况下采取行动。等到彼此发现对方做了什么,再想做什么改变就太迟了。当然,这个星期的输家下个星期很可能竭力反扑,不过,等到那时,在这个日新月异的世界上说不定已经出现了一个完全不同的新的故事模式,开始了一场完全不同的博弈。 这两种博弈所要用到的策略思维和行动在本质上存在天壤之别。对于第2章讨论的相继行动的博弈,每个参与者不得不向前展望,估计对手的反应,从而倒后推理,决定自己这一轮应该怎么走。这是一条线性的推理链:“假如我这么做,另一个参与者会那么做——若是那样,我会这么反击”,依此类推。 而在同时行动的博弈里,没有一个参与者可以在自己行动之前得知另一个参与者的整个计划。在这种情况下,互动推理不是通过观察对方的策略进行,而是必须通过看穿对手的策略才能展开。要想做到这一点,单单假设自己处于对手的位置会怎么做还不够。即便你那样做了,你又能发现什么?你只会发现,你的对手也在做同样的事情,即他也在假设自己处于你的位置会怎么做。因此,每一个人不得不同时担任两个角色,一个是自己,一个是对手,从而找出双方的最佳行动方式。与一条线性的推理链不同,这是一个循环——“假如我认为他认为我认为……”。诀窍在于怎样破解这个循环。 夏洛克·福尔摩斯(Sherlock Holmes)和他的死对头、罪恶魔头莫里亚蒂(M噢riarty)教授擅长这类推理,对此我们一点都不觉得惊讶。正如福尔摩斯在《最后的问题》里告诉华生(Watson)的: “我要说的其实已经在你的脑海闪过。”他说。 “那么我的答案大概也已经在你的脑海闪过。”我答道。 你就和华生医生一样,大概也在揣摩福尔摩斯怎么未卜先知。听完我们的解释,我们希望你会同意这其实相当简单。 你怎样才能看穿所有那些错综复杂而又看不见的策略呢?首先,你不要把其他参与者的未知行动视做天气那样,具有与个人无关的不确定性。上班之前,《时代》的编辑可能收听天气预报,知道今天下雨的概率是40%,他大概会利用这个信息去决定要不要带一把雨伞去上班。但《新闻 周刊》将会采用哪个特定主题作为封面故事的概率则完全是另外一回事。 区别在于,《时代》的编辑对《新闻周刊》有一个非常中肯的了解——另一个杂志的编辑与天气不同,他们是策略的博弈参与者,就跟《时代》的编辑自己一样。① 即便一个编辑不可能真的观察到另一个杂志的决定,他也可以通过另一个杂志的视角思考这个问题,尝试确定它现在一定在做什么。 ① 有些人相信,自然界也是一个策略博弈的参与者,而且心肠狠毒,整天想着怎样破坏我们早已定下的计划,以从中取乐。比如,当你听说下雨的概率是40%,这意味着,有六成概率是你带了雨伞上班而老天爷又没有下雨,另有四成机会则是你忘带雨伞而老天爷偏偏下起雨来。 在第2章,我们可以提供一个单一的、统一的原理,为相继行动的博弈确定最佳策略。这就是我们的法则1:向前展望,倒后推理。在这一章,事情不会那么简单。不过,关于同时行动必不可少的思维方式的思考可以总结为指导行动的三个简单法则。反过来,这些法则又基于两个简单概念:优势策略与均衡。与第2章一样,我们也会通过简单的例子解释这些概念和法则。 1 .优势策略 在棒球比赛里,假如一方已经有两个人出局,而又打出三个坏球和两个好球,那么,任何一名进攻上垒的球员都必须在下一次投球的时候跑向下一垒。这可以通过琢磨各种可能的情形得出来。在大多数情况下,攻垒球员怎么做无关紧要。假如击球手碰不到球,要么出现第四个坏球而攻垒球员成功上垒,要么出现第三个好球而这一局结束。假如投球手投出界外球,攻垒球员只消退回原先所在的垒。假如这是一个擦棒球而又被接住,那么这一局就结束了。不过,有一种情况跑动攻垒占有优势,即假如击球手将投球击到界外,那么攻垒球员就有很好的机会上垒或者得分。 我们认为,在这种局面下,跑动攻垒就是优势策略,即某些时候它胜于其他策略,且任何时候都不会比其他策略差。一般而言,假如一个球员有某一做法,无论其他球员怎么做,这个做法都会高出一筹,那么这个球员就有一个优势策略。假如一个球员拥有这么一个策略,他的决策就会变得非常简单;他可以选择这个优势策略,完全不必担心其他对手怎样行事。因此,寻找优势策略是每一个人的首要任务。 一旦你知道自己在找什么,你就会发现这个东西无所遁形,我们身边其实到处都是优势策略的有趣例子。比如印第安纳·琼斯(Indiana Jones)在电影《印第安纳·琼斯与最后的十字军东征》(Indiana Jones and the Last Crusade)的最紧张局势时所处的地位。印第安纳·琼斯、他的父亲以及纳粹分子全都聚集在安放圣杯的地方。眼看纳粹分子只差一步就要得到圣杯,琼斯父子却无论如何不愿意助封为虐。于是,纳粹分子打了琼斯父亲一枪。只有具备起死回生力量的圣杯才能救老琼斯博士的命。在这种情况下,琼斯只好引他们走向圣杯。不过,前面还有一个最后的挑战:琼斯必须在十几个杯子当中做出选择,选出耶稣基督用过的圣杯。圣杯可以使人永生不死,其他杯子却会致人于死地。纳粹头子迫不及待地拿起一个华丽的黄金杯,喝下里面的圣水,却突然倒地而死,因为他选错了,那不是圣杯。琼斯选了一个木头杯,那是一个木匠用的杯子。他一边大叫“只有一个办法可以证实”,一边将杯里的水倒出一点在圣水器上,自己先喝了下去,希望自己选中的就是生命之杯。当琼斯发现自己没搞错,立即把杯子送到他父亲那里,圣水果然治愈了致命的枪伤。 虽然这一幕增添了紧张气氛,但在一定程度上却让我们感到难堪,因为一个像印第安纳·琼斯博士那样了不起的教授,居然会看不到他的优势策略。他本来应该先把杯子递给他父亲,没有必要自己亲身尝试。假如琼斯确实选对了杯子,那他父亲就会得救。假如他选错了杯子,那他父亲就会丧命,却至少可以保全琼斯。在将杯子递给他父亲之前自己测试一下其实毫无用处,这是因为,假如琼斯选错了杯子,那就再也没有第二次机会了——琼斯将死于致命之水,而他父亲也会死于致命枪伤。① ① 这个例子同时指出博弈论的弱点:人们单凭行为导致的结果给行为打分,行为本身则变得无足轻重。比如,即便印第安纳·琼斯的父亲已经受了致命枪伤,琼斯可能还是不愿意为导致父亲死亡的行为承担责任,一定要亲身试饮那杯水。 相比之下,寻找优势策略会比寻找圣杯容易一些。不妨想想英国桂冠诗人艾尔弗雷德·丁尼生爵士(Alfred,Lord Tennyson)那令人耳熟能详的名句:“爱过之后失去总比从来没有爱过好。”[1]换言之,爱是一种优势策略。 2 .封面之战 回到《时代》与《新闻周刊》的竞争上来。假设有一个星期出了两桩大新闻:一是众议院和参议院就预算问题吵得不可开交;二是发布了一种据说对艾滋病有特效的新药。编辑们选择封面故事的时候,首要考虑的是哪一条新闻更能吸引报摊前的买主(订户则无论采用哪一条新闻做封面故事都会买这本杂志)。在报摊前的买主当中,假设30%的人对预算问题感兴趣,70%的人对艾滋病新药感兴趣。这些人只会在自己感兴趣的新闻变成封面故事的时候掏钱买杂志;假如两本杂志用了同一条新闻做封面故事,那么感兴趣的买主就会平分两组,一组买《时代》,另一组买《新闻周刊》 。 现在,《时代》的编辑可以进行如下推理:“假如《新闻周刊》采用艾滋病新药做封面故事,那么,假如我采用预算问题,我就会得到整个‘预算问题市场’(即全体读者的30% ) ,假如我采用艾滋病新药,我们两家就会平分‘艾滋病新药市场’(即我得到全体读者的35%) ,因此,艾滋病新药为我带来的收入就会超过预算问题。假如《新闻周刊》采用预算问题,那么,假如我采用同样的故事,我会得到15%的读者,假如我采用艾滋病新药,就会得到70%的读者;这一次,第二方案同样会为我带来更大的收入。因此,我有一个优势策略,就是采用艾滋病新药做封面。无论我的对手选择采用上述两个新闻当中的哪一个,这一策略都会比我的其他策略更胜一筹。” 我们可以借助一个简单的表格,更加迅速而清晰地看出这番推理的逻辑性。我们用图3-1 中的两列表示《 新闻周刊》的对应选择,用两行表示《时代》的对应选择。这时我们得到四个格子,每一个格子对应一组策略。格子里的数字代表《时代》的销量,用购买《时代》的读者数占全体潜在读者数的百分比显示。第一行显示的是假如《时代》选择艾滋病新药,它在《新闻周刊》选择艾滋病新药或者预算问题的两种情况下的销量。第二行显示的是假如《时代》选择预算问题,它在《新闻周刊》选择艾滋病新药或者预算问题的两种情况下的销量。比如说,在左下角或者西南方向的格子,《时代》选择预算问题,《新闻周刊》选择艾滋病新药,结果《时代》得到30%的市场。 这个优势策略很容易看出来。第一行的两个格子无一例外都比第二朋行对应的格子占优,因为第一行的两个数字都比排在同一列下面的数字大。这是优势地位的特征。通过这个表格,你可以很快就看出这个特征是不是符合。你可以想像自己用第一行覆盖在第二行上面,然后会发现,盖住第二行的是更大的两个数字。相比之下,这个表格在阐述前面一段话的时候具有压倒语言推理的直观优势,而这种优势随着博弈的复杂程度加大而越发明显。在复杂的博弈当中,各方都有好几个策略。 《 新闻周刊》 的选择艾滋病新药预算问题 图3-1《时代》的销售 同理,在这个博弈里,双方都有一个优势策略。为了解释这一点,我们为《新闻周刊》的销量也画了一个表格(如图3-2 所示)。第一列数字显示的是假如《新闻周刊》采用艾滋病新药,它在《时代》采用艾滋病新药或者预算问题的两种情况下各有多大销量。这一列的两个数字无一例外都比第二列对应的数字占优,你可以再次想像自己拿起第一列覆盖在第二列上时会发现什么。因此,艾滋病新药对《新闻周刊》来说也是优势策略。 《 新闻周刊》 的选择艾滋病新药预算问题 图3-2 《新闻周刊》的销售 以策略观点来看,各方均有一个优势策略的博弈是最简单的一种博弈。虽然其中存在策略互动,却有一个可以预见的结局:全体参与者都会选择自己的优势策略,完全不必理会其他人会怎么做。但这一点并不会降低参与或者思考这种博弈的趣味性。比如,在百码短跑中,优势策略是能跑多快就跑多快,但许多人还是很喜欢参加或者观看这种比赛。在第1章提到的捷尔任斯基广场牢房出现的囚徒困境中,两个参与者都有一个优势策略,只不过这股压倒一切的力量最终将他们引向了一起倒霉的结局。这就提出了一个很有意思的间题:参与者怎样合作才能取得一个更好的结果?我们会在下一章进行更详细的探讨。 有时候,某参与者有一个优势策略,其他参与者则没有。我们只要略微修改一下《时代》与《新闻周刊》的封面故事大战的例子,就可以描述这种情形。假设全体读者略偏向于选择《时代》。假如两个杂志选择同样的新闻做封面故事,喜欢这个新闻的潜在买主当中有60%的人选择《时代》,40%的人选择《新闻周刊》。现在,我们画出《时代》的销量表格(如图3-3 所示)。 图3-3《时代》的销售 对于《时代》,艾滋病新药仍然是优势策略,但对于《新闻周刊》,销量表格则变成下面这样(如图3-4 所示)。 假如你拿起第一列,覆盖在第二列上,你会发现,30被一个较小的数字(28)覆盖,而12却被一个较大的数字(70 覆盖。没有一个策略占有压倒优势。换言之,《新闻周刊》的最佳选择不再与《时代》的策略无关。假如《时代》选择艾滋病新药,《新闻周刊》选择预算问题就能得到更好的销量,反之亦然。对于《新闻周刊》,得到整个预算问题市场总比得到一个较小份额的艾滋病新药市场要好,虽然整个艾滋病新药市场比预算问题市场要大。 图3-4《新闻周刊》的销售 《新闻周刊》的编辑们不会知道《时代 的编辑们将会选择什么,不过他们可以分析出来。因为《时代》有一个优势策略,那一定就是他们的选择。因此,《新闻周刊 的编辑们可以很有把握地假定《时代》已经选了艾滋病新药,并据此选择自己的最佳策略,即预算问题。由此可见,只有一方拥有优势策略的博弈其实也非常简单。拥有优势策略的一方将采用其优势策略,另一方则针对这个策略采用自己的最佳策略。 现在,既然我们已经介绍了优势策略的概念,就有必要强调两点特征,这两点特征可用来确定什么不是优势策略。人们很容易就会弄糊涂,不知道优势策略的优势究竟是对什么而言的。 1981年,伦纳德·西尔克(L俄onard Silk)在撰写有关国会对《经济复苏税法》争论的新闻时这样概括:“里根先生(Mr.Reagan)早已料到共和党人拥有博弈论中称为‘优势策略’的东西,一个使参与者领先其对手的策略,无论这些对手采用什么策略,结局都是一样。”[2] 我们将在第5章更加仔细地介绍这个博弈,在这里想指出的是,西尔克对优势策略的定义并不正确。“优势策略”的优势是指你的这个策略对你的其他策略占有优势,而不是对你的对手的策略占有优势。无论对手采用什么策略,某个参与者如果采用优势策略,就能使自己获得比采用任何其他策略更好的结果。回顾封面大战的例子,《时代》和《新闻周刊》都有一个优势策略,但双方都不可能得到比对方更高的销量。 另一个常见的误解在于,一个优势策略必须满足一个条件,即采用优势策略得到的最坏结果也要比采用另外一个策略得到的最佳结果略胜一筹。在前面讲到的例子里,所有优势策略凑巧都满足这个条件。按照最初设定的条件,《时代》假如采用艾滋病新药做封面故事,最坏的结果是得到35%的市场份额;他们若采用预算问题做封面故事,可能得到的最佳结果是30%的市场份额。但这并非优势策略的一个普遍特征。 现在让我们想像一下《时代》和《新闻周刊》之间爆发了一场价格战。假设每本杂志的制作成本是1美元,且售价只有两个可能的价位选择,分别是3美元(意味着每本利润为2美元)和2美元(意味着每本利润为1美元)。假设顾客永远倾向于选择价格较低的杂志,且在杂志价格相同的时候两种杂志各得一半读者。杂志定价3美元的时候,读者总数是500万;杂志价格降到2美元,读者总数将升到800 万。这时,你可以轻易算出《时代》在4种可能出现的价格组合里将会获得多少利润,并由此得出图3-5 。 图3-5《时代》的利润 《时代》的优势策略是定价2美元(《新闻周刊》亦如此)。《时代》采用这个优势策略可能得到的最坏结果是赢利400万美元。但是,采用另外一个策略可能得到的最佳结果将超过这一数字,达到500万美元。问题是比较这两个数字毫无意义。500万美元的数字是在两本杂志同时定价3美元的时候出现的;不过,假如这时《时代》把价格降到2美元,利润还会更高,达到800 美元。 我们可以把这些例子归纳为一个指导同时行动的博弈的法则。 法则2:假如你有一个优势策略,请照办。 不要担心你的对手会怎么做。假如你没有一个优势策略,但你的对手有,那么就当他会采用这个优势策略,相应选择你自己最好的做法。提醒一句:我们已经确立了同时行动的博弈的优势策略的概念。若是换了相继行动的博弈,采用优势策略的时候就要格外留神。因为策略互动的本质已经改变,优势策略的概念也会完全不同。假设我们说你有一个优势策略,无论你的对手选择怎么做,你按照这个策略做都比采用其他策略更好。若是相继行动,而你的对手先行,你就应该一直选择自己的优势策略。正如我们已经说过的那样,这是你对你的对手每一个行动的最佳对策,因此也是对现在他选择的这个特定行动的最佳对策。但是,假如你先行,你就不会知道你的对手将会采取什么行动。他会观察你的选择,同时做出自己的决定,因此你有机会影响他的行动。某些情况下,若是采用优势策略以外的策略,你可能更有效地施加这种影响。我们将在第6章讨论承诺的时候全面分析这个问题。 3 .劣势策略 不是所有博弈都有优势策略,哪怕这个博弈只有一个参与者。实际上,优势与其说是一种规律,不如说是一种例外。虽然出现一个优势策略可以大大简化行动的规则,但这些规则却并不适用于大多数现实生活中的博弈。这时候我们必须用到其他原理。 一个优势策略优于其他任何策略,同样,一个劣势策略则劣于其他任何策略。假如你有一个优势策略,你可以选择采用,并且知道你的对手若是有一个优势策略他也会照办;同样,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。 假如你只有两个策略可以选择,其中一个是劣势,那么另一个一定是优势策略。因此,与选择优势策略做法完全不同的规避劣势策略做法,必须建立在至少一方拥有至少三个策略的博弈的基础之上。现在就让我们看一个这种类型的简单例子。 设想一场橄榄球比赛的一次对抗。攻方一门心思竭尽全力向前推进,能跑几码算几码,而守方则全力以赴阻挡对方向前移动,寸步不让。举个例子:当比赛只剩下很少时间,攻方可能希望尽力推进,使自己更容易得到一个射门得分的机会。 假如攻方只有两个策略,即带球跑动或者传球,而守方则有三个策略——拦截带球跑动,拦截传球以及闪击四分卫(blitz the quarterback)。我们可以计算出全部六种策略组合分别能使攻方向前推进多少码的距离。以守方选择闪击四分卫而攻方打算传球为例。假设四分卫被撞得倒退10码的概率是10% ,迅速传球传出10码的概率是70% ,而传球传出更远达到20码的概率是20%。那么,平均值就是 0.1l*(-10)+0.7*10+0.2*20 =-1+7+4 =10 显而易见,这些数字本应该以两队拥有或者缺少的特殊技能为基础;我们只不过为了描述方便而选择了一些非常独特的技巧。① ① 在这个例子里,攻方善于传球,不善于带球跑动。因此,即便是在对方集中防御传球的时候,选择传球还是会比带球跑动更好。带球之所以比闪击四分卫更好,是因为防守后卫不在他们的位置上。 我们用图3-6 显示所有六种策略组合将会得出怎样的计算结果。 图3-6攻方期望得到的码数 如图3-6所示,攻方竭力要得到最大数目,守方则尽量压低这个数目,因此,我们没有必要分开列表确定他们的行动。① ① 所有零和博弈都会出现这样的情况,而零和博弈是指一方所得等于另一方所失。 双方都没有一个优势策略:没有一行的数字完全高于另一行,也没有一列的数字完全低于另一列。不过,守方倒是有一个劣势策略,就是闪击四分卫。闪击四分卫的结果是无论如何都会拱手让出较大的码数,因此,这一策略对于守方而言会比它采用其他可能的策略都更糟糕。因此,守方不应该闪击四分卫,攻方也可以非常自信地认定对手不会那么做。 至此,这场推导尚未结束。闪击策略可能从守方教练的笔记本中删除了,整个比赛可以被视为双方各有两个策略。在这场经过简化的比赛中,攻方有一个优势策略,就是传球。其数字分别是9和8,都大于带球跑动策略的数字,分别是3和 。传球之所以不是原来的比赛的优势策略,原因在于,带球跑动的结果在守方采取闪击策略的时候会有一个比较理想的结果(因为带球者可能趁守方闪击四分卫而分身无术时,顺利突人开阔地带),而现在闪击策略已经不予考虑。因此,攻方将会选择传球。反过来,守方也会想到这一点,选择自己的最佳策略,即防守传球。 这里涉及的普遍适用的概念可以归纳为一个指导相继移动的博弈的行动法则。 法则3 :剔除所有劣势策略,不予考虑,如此一步一步做下去。 假如在这么做的过程当中,在较小的博弈里出现了优势策略,应该一步一步挑选出来。假如这个过程以一个独一无二的结果告终,那就意味着你找到了参与者的行动指南以及这个博弈的结果。即便这个过程不会以一个独一无二的结果告终,它也会缩刁整个博弈的规模,降低博弈的复杂程度。 我们以一个虚构的波斯湾海军对峙局势具体描述逐步剔除劣势策略的做法。② 图3-7 所示的格栅代表战斗舰艇的方位以及可能的选择。I点的一艘伊拉克舰艇准备发射一枚导弹,企图击毁A点的一艘美国舰艇。这枚导弹的路径已经由电脑程序在发射的时候确定,可以直线前进,也可以每隔20秒大幅转动一个直角。假如这枚伊拉克导弹笔直从I点飞向A点,美国导弹防御系统可以非常轻易地进行拦截。因此,伊拉克一定会尝试带点拐弯的路径。所有能从I点通向A点的路径已经由下面的格栅显示出来。每条边的长度,比如IF的长度,等于这枚导 ②这个故事是J.D.威廉斯(J.D.Williams)在《完全策略大师》(The Compleat Strategyst)一书中描绘的猫捉老鼠游戏的一个更新版本。猫可能指的就是波斯人。弹20 秒之内可以走过的距离。 那艘美国舰艇的雷达会监测到伊拉克舰艇发射的这枚导弹,因此电脑会马上发射一枚反导弹。反导弹的速度和伊拉克导弹相同,也可以做同样的90度拐弯。于是,这枚反导弹的路径也可以用同样的格栅表示,只不过这次是由A点出发。但是,为了填装足够撞毁一枚导弹的爆炸物,反导弹不得不少装燃料,装的燃料只够它飞行1分钟,因此,它只能走过三个节点(比如,从A 到B点,B点到C点,然后再从C点到F点,这一路径我们用ABCF表示)。 图3-7 假如在这1分钟开始之前或者结束之际,我们的反导弹将与来犯的导弹相遇,那么,反导弹就会爆炸,消除伊拉克导弹的威胁,否则伊拉克导弹就会击中我们的舰艇。问题是,应该怎样选择两枚导弹的路径?在这个博弈里,值得关注的只有第1分钟的路径。各方必须事先想好三个20秒时间段应该怎么走。将每个时间段的可能选择加起来,双方各有8条可能的路径,共有64种组合方式。我们现在就来考察全部64种组合方式,计算哪些方式下反导弹和导弹会迎头相撞,哪些方式下不会相撞。 举个例子:假设伊拉克选择IFCB,即头两个时间段直线从I点经F点到C点,然后转90度到B。对照美国的ABCF策略,可见,反导弹和导弹将在两个时间段(即40秒)之后在C点相遇,因此这一组合的结果是相撞。假如伊拉克还是采取IFCB策略,而美国却选择ABEF迎击,反导弹和导弹就不会相撞。表面上看来,上述弹道都经过B点和F点,但反导弹和导弹是在不同时间达到这些点;比如美国反导弹20秒后到达B点,而伊拉克导弹则要在60秒后到达。 图3-8显示了所有这样的组合。伊拉克的8个策略分别标为I1到I8,同时标出具体路径,比如I1表示IFCB。同样地,美国的策略用A1到A8表示。相撞的结果记做H,不会相撞的结果记做O。 图3-8 击中与错过图 图3-8看起来好像很复杂,但只要借助消除劣势策略的法则,就能将其大大简化。美国反导弹的目标在于得到相撞的结果,因此在美国人看来,H强于O。不难看出,对于美国人,A2策略与A4策略相比处于劣势:假如你将A4行举起,盖在A2行上面,你会发现,只要是A2 得到H的地方,A4也会得到H,而且A4还多一个H,即对应伊拉克巧策略的地方。对全部可能性进行这样的分析,可以知道A2、A3、A6和A7策略与A4和A8策略相比处于劣势,A1不及A8, A8又不及A4。因此,伊拉克人可以确信美国人只会采取A4或者A8策略。伊拉克人把注意力集中在这两行,一心想避免反导弹和导弹相撞,因此在他们看来,I2、I3、I4、I6、I7和I8策略与I1或者I5策略相比处于劣势。划掉劣势策略所在的行和列之后,整个博弈就简化为图3-10 。* *简化过程详见图3-9。——译者注 我们的两个法则不可能将图3-10进一步简化了,因为这里已经没有任何优势策略或者劣势策略可言。不过,我们已经做得很不错了。看一看表格里剩下的策略,我们发现,伊拉克导弹应该沿着格栅外围前进,而美国反导弹则应该小步曲折前进。这样,我们很快就能看到双方应该怎样从各自拥有的两个方案中进行抉择了。 图3-9,击中与错过图 图3-10,简化的击中与错过图 4 .均衡策略 利用优势策略方法与劣势策略方法进行简化之后,整个博弈的复杂程度已经降到最低限度,不能继续简化,而我们也不得不面对循环推理的问题。你的最佳策略要以对手的最佳策略为基础,反过来从你的对手的角度分析也是一样。接下来我们将会介绍解开这个循环的技巧,最终走出这个循环。 为了说明这一点,我们首先回到《时代》与《新闻周刊》的价格战,不过这次不会假设备选价格只有2美元和3美元两种,而是一系列价格。现在,《时代》的管理层必须针对《新闻周刊》可能选择的每一个价格确定最佳对策。假设每种杂志都有一群忠实读者,也有一群可能受到价格竞争影响的流动读者。如果出于某种原因,《新闻周刊》的管理层把价格定在1美元的水平,也就是制作成本的水平,那么,《时代》的管理层一定不会跟随这个毫无盈利的价格策略,而会定出一个较高的价格,杂志仍然可以卖给忠实读者而获得一定利润。如果《新闻周刊》提价,那么《时代》也会提价,只不过幅度较小,从而为自己赢得一定的竞争优势。假定《新闻周刊》每提价1美元,《时代》的最佳对策是提价50美分,于是,我们可以用图3-11表示《时代》针对《新闻周刊》可能选择的每一个定价而确定的最佳对策。 我们假定两本杂志的成本一样,具有同等大小的忠实读者群以及同样的吸引流动读者群的能力。那么,《新闻周刊》针对《时代》可能选择的每一个定价而确定的最佳对策将与图3-11完全一致。 现在我们可以想像两种杂志的经理正各自埋头琢磨。《时代》的经理说:“如果他卖1美元,我就卖2美元。不过,他因为知道我这么想,所以不会真的卖1美元,而是执行他在我卖2美元时的最佳对策,即2.50 美元。那样的话我就不能卖2美元,而是采用我在他卖2.50 美元时的最佳对策,卖2.75 美元。不过,他因为知道我这么想…… ”这样一层一层分析下去,究竟有完没完呢? 有的,结局是3美元。假如这位《时代》经理认为《新闻周刊》会卖3美元,那么他自己的最佳对策就是也卖3美元,反过来,从《新闻周刊》的角度分析也是一样。整个循环推理最后将聚成一点。 我们可以用图3-12 来显示这个结果,该图同时反映了两者的对策。可以看到,两条线在两家都卖3美元的一点相交。 图3-ll 图3-12 我们已经找到了一个策略组合,其中,各方的行动就是针对对方行动而确定的最佳对策。一旦知道对方在做什么,就没人愿意改变自己的做法。博弈论学者把这么一个结果称为“均衡”。这个概念是由普林斯顿大学数学家约翰·纳什(John Nash)提出的。纳什的想法成为我们指导同时行动博弈的最后一个法则的基础。这个法则如下。 法则4:走完寻找优势策略和剔除劣势策略的捷径之后,下一步就是寻找这个博弈的均衡。 这一定就是夏洛克·福尔摩斯和莫里亚蒂教授曾经用来看穿对方心思的秘诀。 我们还要解释一下这个法则。为什么一个博弈的参与者非得达到这么一个结局呢?我们可以说出好几个理由。没有一个理由本身就有足够的说服力,不过,只要把几个理由结合起来,就能形成一个有力的答案。 首先,存在避免循环推理的必要,因为循环推理帮不上忙。均衡在没完没了的“我知道他知道我知道…… ”的循环里是稳定不变的,这使参与者对其他人的行动的估计能保持连贯性。各方正确预计别人的行动,并且确定自己的最佳对策。 均衡策略的第二个好处出现在零和博弈中。在这种博弈里,参与者的利益严格相悖。你的对手不能通过引诱你采取一个均衡策略而得到任何好处。你已经充分考虑到他们对你正在做的事情会有什么样的最佳对策。 第三个理由是,均衡方法注重实效。要想证明一个东西是布丁,就要吃一吃。综观全书,我们将会利用均衡方法讨论许多博弈。我们希望读者来检验它对博弈结果的预测以及这种思维方式产生的行为指导方针。我们相信,这么做会使我们提供的案例更有意思,比抽象地讨论均衡方法的优点更有意义。[3] 最后,可能存在一个对均衡概念的误解,我们希望各位可以避免。当我们说博弈的结果是均衡,并不自动意味着这就是对博弈的全体参与者最有利的结果,更不意味着是对整个社会作为一个整体而言最有利的结果。有利或者不利的评价永远属于另外一个问题,答案视各个案例的具体情况而各有不同。在第4章和第9章,我们会谈到这两种例子。 5 .盛宴还是饥荒 盛宴 均衡的概念是不是同时行动的博弈中循环推理问题的一个完全解?老天爷,不是的。有些博弈存在好几个均衡,有些博弈却一个均衡也没有,而在另外一些博弈里,均衡的概念还会由于接纳新型策略而变得更加微妙。我们现在就来描述和解释这几点。 开车的时候你应该走哪一边?这个问题不能通过运用优势策略或者劣势策略理论予以回答。不过,即便如此,答案却显得很简单。假如别人都靠右行驶,你也会留在右边。套用“假如我认为他认为”的框架进行分析,假如每个人都认为其他人认为每个人都会靠右行驶,那么每个人都会靠右行驶,而他们的预计也全都确切无误。靠右行驶将成为一个均衡。 不过,靠左行驶也是一个均衡,正如在英国、澳大利亚和日本出现的情况。这个博弈有两个均衡。均衡的概念没有告诉我们哪一个更好或者哪一个应该更好。假如一个博弈具有多个均衡,所有参与者必须就应该选择哪一个达成共识,否则就会导致困惑。 在开车行驶的例子里,一条早已制定的规则给了你答案。不过,若是遇到彼得和波拉打电话打到一半突然断了的事,你该怎么办?假如彼得马上再给波拉打电话,那么波拉应该留在电话旁(且不要给彼得打电话),好把自家电话的线路空出来。另一方面,假如波拉等待彼得给她打电话,而彼得也在等待,那么他们的聊天就永远没有机会继续下去。一方的最佳策略取决于另一方会采取什么行动。这里又有两个均衡,一个是彼得打电话而波拉等在一边,另一个则是恰好相反。 这两个人需要进行一次谈话,以帮助他们确定彼此一致的策略,也就是就应该选择哪一个均衡达成共识。一个解决方案是,原来打电话的一方再次负责打电话,而原来接电话的一方则继续等待电话铃响。这么做的好处是原来打电话的一方知道另一方的电话号码,反过来却未必是这样。另一种可能性是,假如一方可以免费打电话,而另一方不可以(比如彼得是在办公室而波拉用的是收费电话),那么,解决方案是拥有免费电话的一方应该负责第二次打电话。 为了检验读者协调达成一个均衡的能力,请思考下面的问题:明天某个时候你要在纽约市会见某人。他已被告知要与你会面。不过,双方都没有更多信息,不知道究竟何时或者在哪里会面。那么,你应该于何时去何地? 托马斯·谢林(Thomas Schelling)在他的《冲突策略》一书里使这个问题家喻户晓。这个问题只有通常最常见的答案,除此之外没有任何预先确定的正确答案。在我们的学生当中,正午时分在中央车站一直是最常见的答案。即便是普林斯顿的学生,虽然他们乘坐的到纽约的火车是在宾州车站而非中央车站停,他们的答案也是一样。① ① 也许最具创意的另一个答案来自加州大学圣迭戈分校教授塔妮亚·鲁尔曼(Tanya Luhrmann)。她的回答是:“纽约公立图书馆阅览室。”我们告诉她,这假如不是空前绝后的答案,也是相当少见的答案。她立即为她的选择进行了辩解。她说,这是因为,虽然她的成功机会可能很低,可她还是更有兴趣跟愿意选择纽约公立图书馆阅览室而非选择纽约中央车站的人见面! 饥荒 另一个复杂因素在于,并非所有博弈都有我们前面描述的那种均衡,哪怕是一个,在导弹截击的故事里,余下4个结果没有一个是均衡。举个例子,我们看看伊拉克I1策略遇到美国A4策略的情况。这一策略组合的结果是反导弹没能拦截导弹,假如美国转向A8策略,情况就会大不一样。不过,那样的话伊拉克就该转向I5策略,而美国反过来也要转向A4 策略,伊拉克则相应转向I1策略,如此类推。关键在于,如果一方坚守某种确定行为,另一方就会因此大占便宜。双方惟一明智的做法在于随机选择自己这一步怎么走。实际上,导弹截击问题具有很强的对称性,以至于正确的策略组合简直是显而易见的:美国的策略应该随机地“一分为二”,一半时间选择A4策略,另一半时间选择A8策略,伊拉克则以同样的概率选择I1和I5策略。 这种“混合策略”即便在双方打算合作的时候也会出现。在前面提到的打电话的例子中,设想双方都投硬币决定自己是不是应该给对方打电话,根据前面给出的条件,两人这种随机行动的组合成为第三个均衡:假如我打算给你打电话,我有一半机会可以打通(因为这时你恰巧在等我打电话),还有一半机会发现电话占线;假如我等你打电话,那么,我同样会有一半机会接到你的电话,因为你有一半机会主动给我打电话。每一个回合双方完全不知道对方将会采取什么行动,他们的做法实际上对彼此都最理想。因为我们只有一半机会重新开始被打断的电话聊天,我们知道我们(平均来说)要尝试两次才能成功接通。 而在其他博弈中,各方应该按照什么概率采取不同策略的答案却没有这么明显。在第7章我们会建立一套法则来确定什么时候需要采取混合策略,还会介绍一个找出正确的几率组合的方法。 我们现在简要回顾一下。在同时行动的博弈中,我们有三个行动法则:一是寻找和运用优势策略;二是寻找和避免劣势策略,与此同时假设你的对手也在这么做;三是寻找和运用均衡。本章结束之际,我们来看一个案例,这个案例向各位展示了这些指导法则是怎样转化为实际行动的。 6 .案例分析之三:莽汉软招 罗伯特·坎普(Robert Campeau)在第一次投标收购联盟商店(及其掌上明珠布鲁明代尔百货商店)的时候,运用了一个称为两阶段出价法的竞购方案。这个案例分析将会研究这种出价方案作为一个策略行动的效能。这一行动会不会让收购者占了便宜,从而违反公平原则了呢? 典型的两阶段出价法给先出让股份的股东支付的价格高,给后出让股份的股东支付的价格低。为避免复杂的计算,我们假设出价收购前的股价是每股100美元。收购者在第一阶段提出一个较高价格,即每股105美元,向先出让股份的股东支付,直到全部股份的一半出让为止。另一半待出让股份则进入第二阶段,收购者愿意支付的股价只有90美元。出于公平原则,股份不是按照股东出让的时间次序分属不同阶段。相反,每个人都会得到一个混合的价格:所有出让股份会按照一定比例均等划入两个阶段(假如招标成功,那些未出让自己股份的人就会发现他们的股份落入第二阶段)。① 我们可以用一个简单的代数表达式说明这些股份的平均支付价格。假如愿意出让的股份不超过50% ,每个人都会得到105美元的股价;假如这家公司的全部股份当中有X%愿意出让,且X%〉=50% ,那么,每股平均价格就是 $105*50/X+$90*(X-50/X)=90+15*50/X ① 拥有这家公司控制权的收购者有权将公司收为私有,然后悉数收购余下股份。按照法律,他必须向这些股东提供一个“公平市场”价格,以收购他们的股份。一般而言,在两阶段出价的竞购过程中,较低阶段的出价应该仍在可被接纳为公平市场价值的范围内。 值得注意的一点是,两阶段出价的竞购方案是无条件进行的;即便收购者没能得到公司的控制权,仍然应该按照第一阶段的价格收购全部愿意拍卖的股票。第二个特点在于,两阶段出价法的性质决定了假如所有人都愿意出让自己的股票,那么每股的平均价格只有97. 50美元。这个价格不仅低于收购者提出收购前的股价,也低于股东们在收购失败后可能得到的股价,这是因为,假如收购者被击败,股东们将会看到股价回到原来100美元的水平。因此,股东们希望要么收购者被击败,要么再出现一个收购者。 实际上,当时真的出现了另一个收购者,那就是梅西百货公司。现在就让我们假设梅西提出一个有条件的收购计划:它愿意用每股102 美元的价钱收购股份,前提是它能得到该公司大部分股份,那么,你将向哪一家出让你的股份,而你又觉得哪一家的计划会成功呢? 案例讨论 以两阶段出价的竞购方案来出让股份,是一种优势策略。为了证明这一点,我们会考察全部可能的情形。总共存在3种可能性,分别是: 两阶段出价的竞购方案吸引到的股份不足50% ,因而收购失败。 两阶段出价的竞购方案吸引到超过50%的股份,因而收购成功。 两阶段出价的竞购方案刚好吸引到50%的股份;假如这时你同意出让你的股份,收购就能成功,否则的话收购只能失败。 在第一种情形下,两阶段出价的竞购方案遭到失败,因此,股价要么回到100美元水平,要么达到102美元,后者是在竞争对手成功收购的条件下。不过,假如你出让自己的股份,你就能得到105美元的股价,比前面提到的两个结果都要好。在第二种情形下,假如你不出让你的股份,你能得到的股价只有90美元,而出让股份则至少能让你得到97.50 美元。因此,出让股份仍然是一个更好的选择。在第三种情形下,假如收购成功,别人得到的价格都不如以前,但你自己的结果却变好了。理由是,由于出让的股份刚好达到50% ,你将得到105美元的股价。这个价格值得出让。因此你愿意促成这桩收购。 因为出让是一种优势策略,我们可以预计人人都愿意出让自己的股份。一旦人人都出让股份,每股的平均混合价格可能低于收购前的价格,甚至可能低于预期收购失败后的价格。因此,两阶段出价的竞购方案可以使收购者以低于公司价值的价格收购成功。由此可见,股东们拥 有一个优势策略的事实并不意味着他们就能占先。收购者利用第二阶段的低价不公平地占到了便宜。通常,第二阶段的狡猾本质不会像在我们这里给出的例子那样赤裸裸地暴露出来,因为这一胁迫手段多多少少会被收购后红利的诱惑隐蔽起来。假如一家公司在收购之后的实际价值是每股110美元,收购者仍然可以通过一个低于110美元而又高于100美元的第二阶段出价占到便宜。律师们认为两阶段出价法具有胁迫性质,并且成功地利用这一点作为一个依据,在法庭上跟收购者打官司。在争夺布鲁明代尔的战役中,罗伯特·坎普取得最后胜利,但他却是通过一个修改了的出价达到目的的,其中并不包含任何阶段性的结构。 我们还会发现,一个有条件的竞购方案对于一个无条件的两阶段出价竞购方案不是一个有力的抵御策略。在我们给出的例子中,假如梅西许诺无条件支付每股102美元的话,那么它的竞购方案就会更难对付。梅西的无条件竞购将会破坏两阶段出价竞购方案取胜而达到的均衡。理由在于,假如人们认为两阶段出价竞购方案笃定取胜,他们将会得到的只是97.50 美元的平均混合价格,而这个数字显然低于他们把股份出让给梅西将会得到的股价。因此,不可能出现股东们希望两阶段出价竞购方案成功且又愿意向梅西出让股份的情况。① ①不幸的是,同样不可能出现一个梅西竞购成功的均衡点,因为若是这样,意味着两阶段出价的竞购方案吸引到不足50%的股份,那么股价仍将高于梅西愿意支付的价格。唉,这就是一个没有均衡点的例子。要想找出解决方案就必须用到随机策略,这一点我们将在第7章进行讨论。 1989 年年底,坎普由于负债累累而陷人经营困境。联盟商店按照《破产法》第十一条申请重组。当我们说坎普的策略很成功时,我们只想表明他的策略成功地达到了赢得竞购战的目的。成功经营一家公司完全是另外一场不同的博弈。 第1部分结语 我们在前三章借助商界、体育、政治等领域的例子作为辅助工具,介绍了许多概念和方法。在后面的章节,我们会实际运用这些概念和技巧。这里我们对这些概念和技巧进行回顾和总结,供读者参考。 博弈是一种策略的相互依存状况:你的选择(即策略)将会得到什么结果,取决于另一个或者另一群有目的的行动者的选择。处于一个博弈中的决策者称为参与者,而他们的选择称为行动。一个博弈当中的参与者的利益可能严格对立,一人所得永远等于另一人所失。这样的博弈称为零和博弈。不过,更常见的情况是,既有共同利益,也有利益冲突,从而可能出现导致共同受益或者共同受害的策略组合。但是,我们通常还是会把这个博弈当中的其他参与者称为一方的对手。 一个博弈的行动可能是相继进行,也可能是同时进行。在相继行动的博弈里,存在一条线性思维链:假如我这么做,我的对手可以那么做,反过来我应该这样应对…… 这种博弈通过描绘博弈树进行研究。只要遵循法则1:向前展望,倒后推理,就能找出最佳行动方式。 而在同时行动的博弈中,存在一个逻辑循环的推理过程:我认为他认为我认为…… 这个循环必须解开,一方必须看穿对手的行动,哪怕他在行动的时候并不知道这是怎么一回事。要想解开这么一种博弈,可以建立一张图,这张图能显示所有可能想像得到的策略组合将会相应产生什么结果。然后按照下列步骤进行分析。 首先看参与各方有没有优势策略,优势策略意味着,无论对手采取什么策略,这一策略都将胜过其他任何策略。这就引出法则2:假如你有一个优势策略,请照办。假如你没有优势策略,但你的对手有,那么,尽管认定他一定会照办吧,然后相应选择你自己的最佳策略。 接着,假如没有一方拥有优势策略,那就看看有没有人拥有一个劣势策略,劣势策略意味着无论对手采取什么策略,这一策略都将逊于其他任何策略。如果有,请遵循法则3:剔除劣势策略,不予考虑。如此一步一步做下去。假如在这么做的过程当中,在简化之后的博弈里出现了一个优势策略,应该采用这个优势策略。假如这个过程以一个独一无二的结果告终,那就意味着你找到了参与者的行动法则以及这个博弈的结果。即便这个过程可能不会导出一个独一无二的结果,这么做也可以缩小整个博弈的规模,使其变得更加容易控制。最后,假如既没有优势策略,又没有劣势策略,又或者这个博弈已经经过第二步进行了最大限度的简化,那么,请遵循法则4:寻找这个博弈的均衡,即一对策略,按照这对策略做,各个参与者的行动都是对对方行动的最佳回应。假如存在一个这样的独一无二的均衡,我们就有许多很好的证据证明为什么所有参与者都应该选择这个均衡。假如存在许多这样的均衡,你就需要用一个普遍认同的法则或者惯例做出取舍。假如并不存在这样的均衡,这通常意味着一切有规则可循的行为都有可能被对方加以利用,这时候你需要将你的策略混合运用。 在实践当中,博弈可能包含一些相继行动过程,也可能包含一些同时行动过程,因此须将上述技巧综合起来,灵活运用,思考和决定自己的最佳行动应该是什么。 第2部分 第4章走出囚徒困境 20世纪70年代,石油输出国组织(欧佩克)一直合谋提高原油价格,从1973年的每桶不足3美元提高到1980年的每桶超过30美元。每逢欧佩克召集定价会议,整个世界都会焦急不安地等待消息。20世纪70年代后期,一些能源专家已经预测,这么下去,等到20世纪末,石油价格将会涨到每桶超过100美元。不料,突然之间,这个卡特尔组织似乎就要崩溃了。石油价格开始下滑,1986年年初一度下跌至每桶10美元,1987年才逐步回升到每桶18美元。① 就在我们撰写本书的时候,伊拉克人侵科威特,油价又迅速上升到每桶35美元。专家们对欧佩克的前途莫衷一是。 ① 当然,我们必须同时记住一件事,即在1981-1985 年,美元对其他货币强劲升值。因此,不管是油价在20世纪80年代上半叶下跌,或者是之后收复失地,油价的变化用美元以外的其他货币结算,都不如用美元结算时看起来那么富有戏剧性。 究竟是什么因素主宰了这样一个卡特尔的成败?而在多数情况下,又是什么因素左右了从商界、政界乃至其他社会机构的合作与竞争之间的平衡?借助我们在第1章提到的发生在克格勃牢房的囚徒困境,这个问题至少可以部分得到解决。 欧佩克的故事就是这么一个博弈。当然,我们讲述的时候采用了戏剧化的叙事方式,强调了个中困境,抛开了许多历史细节。现在,我们从考察仅仅两个成员的产量决策开始,假设这两个国家是伊朗和伊拉克。为以后讲解方便,我们只允许每个国家各有两个产量水平可以选择,分别是每天200万桶原油或者400万桶原油。根据这两个国家的不同决策,输出到全球市场的总量将是每天400万桶、600万桶或者800万桶原油。与这组数字对应,假设价格分别是每桶25美元、15美元和10美元。在伊朗,原油提炼成本是每桶2美元,而在伊拉克则是每桶4美元。于是,我们可以用“百万美元/天”为单位,在图4-1上显示两个竞争对手的利润。每个格子的右上方是伊拉克每天可得的利润,左下方是伊朗的利润。① 图4-l 伊朗和伊拉克的利润图 ① 这种用同一个矩阵表示两个参与者的得失的做法来自托马斯·谢林。他用过分谦逊的笔触写道:“假如真有人问我有没有对博弈论做出一点贡献,我会回答有的。若问是什么,我会说我发明了用一个矩阵反映双方得失的做法…… 我不认为这个发明可以申请专利,所以我免费奉送,不过,除了我的学生,几乎没有人愿意利用这个便利。现在,我愿提供给各位免费使用。” 每个国家都有一个优势策略,即选择较高的产量水平进行生产。比如说,伊朗第四行对应产量的利润数字分别是52和32,全都高于第二行对应的数字46和26。假如两国全都选择各自的优势策略,它们的利润将分别达到每天3200万美元和2400万美元。这当然不是一个小数目,不过,假如它们合作,本来可以分别得到4600 万美元和4200 万美元。 这种情况称为“囚徒困境”。其显著特征在于,双方选择各自的优势策略,以使其收益达到最大,不过,与双方选择将其收益最小化的策略相比,最终的收益却更糟。那样的话,双方为什么不选择最小化的策略呢?回到伊朗和伊拉克的例子上来。即使伊朗愿意选择最小化的策略,每天生产200万桶,但伊拉克仍然有生产400万桶的动机,这么一来,结果就是对伊拉克最有利,而对伊朗最不利。假如伊朗不想合作,坚持生产400万桶,这时,伊拉克若是只生产200万桶,伊拉克就是傻瓜,白白牺牲自己的利润。这个卡特尔的问题在于,怎样才能在双方都面临诱惑、很想欺骗对方、从对方所失中获利的前提下,找到一个方法,维持一个低产量、高价格的策略,而这一策略能为双方都带来最高收益。 伊朗和伊拉克的情况与前面提到的克格勃的两个囚犯情况相仿。两个人都知道坦白才是优势策略:假如一方不坦白,另一方就会由于坦白而得到好处;假如一方坦白,另一方若不坦白就是傻瓜了。因此,无论一方怎么做,另一方还是想坦白。这一点对双方都适用。但一旦双方都坦白,各人都会遭到严厉的惩罚。我们再一次看到,谋求个人利益的私心最终导致了一个糟糕的结果。实际上,假如双方都不坦白,双方的结局都会更好一些。问题是,在双方暗自较劲希望为自己谋求一个更好的结果的时候,怎样才能达成这样的合作。 一个产业的几个竞争企业之间也会出现同样的问题。这个间题不仅让商人们苦恼不堪,也同样折磨着商学院的学生们。得克萨斯州A&M大学一位教授让自己班上的27名学生进行一个博弈,而这个博弈会把他们引人囚徒困境。[1]假设每一个学生都拥有一家企业,现在他必须决定自己应该生产1来帮助维持较高价格,还是生产2来通过别人所失换取自己所得。根据愿意选择1的学生总数,将收入按照表4-1 的方式分配给每个学生。 换用图4-2 ,我们可以看得更加清楚,效果也更加明显。 这是一个“事先设计好”的博弈,目的是确保每个选择2的学生总”比选择1的学生多得50美分,不过,选择2的人越多,他们的总收益 就会越少。假设全体27 名学生一开始都打算选择1,那么他们各得1.08 美元。假设有一个人打算偷偷改变决定,选择2,那么,选择1的学生就有26名,各得1.04 美元(比原来少了4美分),但那个改变主意的学生就能得到1.54 美元(比原来多了46美分)。实际上,不管最初选择1的学生总数是多少,结果都是一样,选择2是一个优势策略。每一个改选2的学生都会多得46美分,同时会使他的26个同学分别少得4美分,结果全班收人会少得58美分。等到全体学生一致选择自私的策略,尽可能使自己的收益达到最大,他们将各得50美分。反过来,假如他们联合起来,协同行动,不惜将个人的收益减到最小,他们将各得1.08 美元。你会怎么抉择? 表4-1 图4-2 演练这个博弈的时候,起初不允许集体讨论,后来允许一点讨论,以便达成“合谋”,结果愿意合作而选择1 的学生总数从3到14不等。在最后的一次带有协议的博弈里,选择1的学生总数是4,全体学生的总收益是15.82 美元,比全体学生成功合作可以得到的收益少了13.34 美元。“我这辈子再也不会相信任何人了。”领导合谋的学生这样嘟囔。那么,他自己又是怎么选择的呢?“噢,我选了2。”他答道。 这个情景使我们回想起尤塞里安(Yossarian在约瑟夫·海勒( Joseph Heller)的小说《第22 条军规》(Catch-22)当中的境遇。第二次世界大战胜利在望,尤塞里安不想成为胜利前夕最后一批牺牲者。他的上级军官问:“可是,假如我方士兵都这么想呢?”尤塞里安答道:“那我若是有别的想法岂不就成了一个大傻瓜?" 政治家们也会变成同样的困境中的囚徒。1984年,大多数人都很明白,美国联邦预算赤字实在太高了。裁减必要的巨额开支在政治上并不可行,因此,大幅增税应该是不可避免的。不过,谁愿意担当政治领导角色,带头主张这么做呢?民主党总统候选人沃尔特·蒙代尔( Walter Mondale)想要在自己的竞选活动当中为这么一个政策转变制造声势,却被罗纳德·里根(Ronald Reagan)打得落花流水,因为里根许诺绝不加税。1985年,这个议题陷人僵局,无论你怎么划分政治派别,民主党对共和党,众议院对参议院,还是政府对国会,各方都希望把提出加税的主动权推给对方。 从各方的角度看,最好的结果在于,对方有人提出加税和削减开支,并因此不得不付出政治代价。反过来,假如自己提出这样的政策,而对方坚守被动局面,并不附和,自己就会落得最糟糕的下场。双方都知道,联合起来共同倡议加税和削减开支,共同分享荣誉,分担谴责,与同时坚守被动,眼看巨额赤字上升而无所作为相比,显然会对整个国家更有利,即便对他们自己的政治生涯,从长期而言也会有好处。 我们可以画出一张常见的图(如图4-3所示),标明策略和结果,将这个情况变成一个博弈。双方分别是民主党和共和党。为了表示谁更加倾向于怎么做,我们把每个结果按照各方的眼光给出从1到4的排序,数字越低对自己越好。每个格子左下角是共和党给出的排序,右上角是民主党给出的排序。 显而易见,对每一方而言,保持被动是一个优势策略。而这正是真实发生的情况;第99届国会根本没有做出任何加税决定。此届国会确实通过了《格拉姆-拉德曼-霍林斯法》(Gralmm-Rudman-Hollings Act) ,这一法案规定以后必须实行削减赤字政策。不过,这只是一种伪装,好像采取了行动,实际却推迟了作出艰巨抉择的时间。这一目的与其说是通过限制财政支出的做法达成的,不如说是通过玩弄会计上的小把戏而实现的。 图4-3 共和党和民主党的排序 1 .如何达成合作 一旦陷入囚徒困境,人们就会想方设法逃脱,寻求大家一致愿意看到的合作的结果。圈外人则大约更愿意看到他们困在中间无法脱身。举个例子:某个产业的企业由于陷入囚徒困境而不能合谋抬高价格,买方得以从较低价格中受益。在这个例子中,社会希望阻挠这个产业合谋,不让其破解囚徒困境,反垄断法就是其中一道路障。但是,不管我们愿意寻求合谋或者是阻挠合谋,我们都必须了解有什么途径可以破解囚徒困境。只有这样,我们才能找出合适的对策,要么沿着这条路走下去,要么在上面设置路障。 一个根本的难题在于在任何协定下参与者都有作弊的动机。因此,中心问题是,怎样才能觉察这么一种作弊行为?什么样的惩罚才能阻止这种行为?现在我们逐一分析。 2 .觉察作弊 卡特尔作为一种企业联合组织,必须找出有效的办法,了解是不是出现了作弊行为,以及若是有作弊行为的话,确定是谁作弊。在我们已经讲过的例子中,觉察有人作弊通常都不是什么难事。比如在伊朗和伊拉克石油生产的例子中,石油价格只有在两国合作,每天生产200万桶原油的时候才会达到25美元一桶;只要价格低于每桶25美元,肯定有人作弊。在现实生活当中,情况更加复杂。价格下降可能有两个原因,一是需求下降,二是生产者之一作弊。除非一个卡特尔有本事区分这两种影响,确定价格下降的真实原因,不然的话,它就会在根本没人作弊的时候误以为有人作弊,并且采取惩罚措施,或者是反过来,有人作弊却没觉察。① 这些做法会降低准确性,使有关防范措施的效果大打折扣。一个妥协的解决方案是设置一个关键价格,或者称为“触发”(trigger)价格,一旦价格落到这个价格之下,卡特尔就可认定有人作弊,随即采取惩罚措施。 ① 统计文献将错误的肯定称为一类错误,而将错误的否定称为二类错误。最常见的错误却是三类错误:记不起来确切的是哪个。 不过,在现实生活当中还有一个复杂因素。这类博弈通常都有很多不同层面的抉择,觉察作弊的可能性在不同层面也有所不同。比如,企业之间会在价格、产品质量、售后服务以及其他许多方面进行竞争。价格相对而言算是比较容易观察的,虽然可能存在的秘而不宣的折扣或者定价策略的灵活性会使问题复杂化。而在产品质量方面,质量具有许多不同层面,很不好把握。因此,旨在合谋维持较高价格的卡特尔经常发现,企业不断地将竞争引向新的层面。这样的事情就发生在民航产业。在受到政府监管的时期,机票价格是固定的,新竞争者进入的通道实际上被堵死了。这就相当于航空公司在民航管理局的推动下结成卡特尔。但在卡特尔内部,航空公司之间却开始竞争,或者说是作弊。它们虽然不能降低机票价格,却可以提供更加超值的服务,比如可口的飞机餐和美丽的空中小姐。假如劳工法要求航空公司也要聘用男性乘务员,而且不能因为空中小姐超过30岁就解雇,竞争则可以转向其他层面,比如提供更多直飞航线、加大座位宽度以及增加座位前面伸展腿脚的空间。 这种发展趋势还有一个例子,出现在国际贸易政策领域。关税是最容易看出来的、用于限制贸易的工具,关贸总协定(GATT)通过连续多个回合的谈判,最终促使所有发达国家一起大幅下调关税。不过,各国仍然面临国内强大的特殊利益集团的政治压力,它们要求限制进口。因此,各国渐渐转向利用其他一些不那么容易看出来的手段,比如自愿限制协定、海关估价手续、标准、行政手段以及复杂的配额制度。① ① 比如,按照复合纤维协议确定的配额,其征税标准极其复杂,不同织物在不同国家就有不同做法。这套标准使人难以看出配额制度对提高任何一种特定商品的价格究竟有什么影响。尽管如此,有些经济学家仍然估算出了这种影响,而且发现价格可能提高100%的幅度——若是关税高到这个程度,恐怕就要引发广大消费者的强烈抗议了。 这些例子说明了一个共同主题,即合谋集中在比较透明的抉择层面,竟争则转向不那么容易看出来的层面,我们把这个现象称为“提高不透明度定律”。也许读者未必看得出来,但合谋仍然可能损害你的利益。比如,1981年开始实施日本汽车进口配额制度后,不仅包括日本车和美国车在内的全部汽车涨价了,而且大众化的日本车型也从市场上消失了。不透明的竞争后果更甚:不仅导致价格上升,产品组合的平衡也被扭曲了。 确认作弊者可能比觉察作弊更为艰巨。假如只有两个参与者,诚实的一方当然知道谁在作弊。即便如此,能不能让他承认错误可能又是一个未知数。假如出现不止两个参与者,我们可能知道有人作弊,却没人知道究竟是谁,只有作弊者自己心知肚明。遇到这种情况,用于惩罚作弊的手段必然显得莽撞生硬,它会同时影响到无辜者和作弊者。 最后一点,作弊行为可能表现为维持被动,拒绝出头,因此也就更难区分出来。我们前面讲过的不肯带头倡议加税的例子就属于这个情况。遇到这种情况,想要推测或者断定有没有作弊更是难上加难。一方面,积极的行动人人都看得见,另一方面,不作为的借口也有很多,比如还有更加亟须处理的事情,需要时间动员全部力量,诸如此类。 3 .对作弊者的惩罚 在每一个鼓励合作的良好计划里,通常都会包含某种惩罚作弊者的机制。一个坦白且供出合作伙伴的囚徒可能遭到这些人的朋友的报复。若是知道外面会有什么报应等着自己,尽快逃脱牢狱之灾的前景大概也就不会显得那么诱人了。人人都知道,警察会威胁毒品贩子说要释放他们以让其坦白。这种威胁的作用在于,一旦他们被释放,卖毒品给他们的人就会认定他们一定是招供了。 而在得克萨斯州A&M 大学教室进行的实验里,假如学生们觉察到究竟是谁拒绝按照合谋选择1,他们可能就会整个学期不再理会这个家伙。估计没有哪个学生愿意为了50美分而冒被抵制的风险。至于欧佩克的例子,由于20世纪70年代阿拉伯国家存在社会与政治合作,任何一个打算作弊的国家都担心有可能遭到抵制,因而最终放弃了作弊的想法。这些例子反映了在最初博弈之上增加惩罚机制的做法,其目的就是为了减少作弊的动机。 在博弈的结构里还存在其他类型的惩罚。一般而言,这种情况发生的原因在于这个博弈反复进行,这一回合作弊所得将导致其他回合所失。我们还是用伊朗和伊拉克之间的原油例子进行分析。 由于两个国家天天都在进行这个博弈,惩罚的可能性也就出现了。假设他们从相互信任的基础起步,各国每天生产200万桶,携手维持较高的价格。然而各国都会不断受到诱惑,很想偷偷作弊一把。回到每天的利润图上来。假如这天伊朗作弊且取得成功,伊拉克保持诚实,那么伊朗这天的利润将从原来的4600 万美元上升到5200 万美元,净增600万美元(如图4-4 所示)。 图4-4伊朗和伊拉克的利润图 问题在于,假如伊拉克发现出了事又会怎么样。一个似是而非的情景是,彼此之间的信任瓦解,双方从此进人高产量、低价格的结局。与彼此信任的时候相比,这使伊朗每天少得1400万美元(从4600万美元减少到3200万美元)。可见,作弊带来的短期好处根本无法弥补之后带来的损失:假设伊拉克需要1个月的时间才能觉察伊朗作弊,并且断然决定解除合作,那么,伊朗由于作弊一个月而多得的1.8亿美元,在两国合作破裂13天之后就会被损失抵消。当然,时间就是金钱,今天增加的利润会比明天失去的同样数目的利润更值钱,不过,上述计算看起来仍然很不利。对伊拉克来说,卡特尔破裂将会带来更糟糕的下场:假如它作弊而未被觉察,也没有受到惩罚,那么每天可以多得利润200万美元;假如合作破裂,则每天损失将达1800万美元。显然,在这个例子中,哪怕只有一点点担心两国的相互信任会破裂,也足以约束两个竞争者乖乖遵守协定。 信任破裂有很多原因。比如,若是伊朗和伊拉克开战,欧佩克就很难强迫这两个国家遵守产量配额。有能力对违反协定者进行惩罚是维持卡特尔配额的信任的基础。不过,对于两个已经在用炸弹和“人浪”攻势相互惩罚的国家,你还有什么样的惩罚手段可用呢?一旦战争停止,由于出现了受到惩罚的可能性,合作的可能性也会再度浮现。 归纳起来,在一个一次性的博弈当中没有办法达成互惠合作。只有在一种持续的关系中才能够体现惩罚的力度,并因此成为督促合作的木棒。合作破裂自然就会付出代价,这一代价会以日后利润损失的形式出现。假如这个代价足够大,作弊就会受阻,合作就会继续。上述基本原则包含一些警示。第一个警示出现在合作关系存在某种自然而然的终点的时候,比如一个当选政府的任期到期就会结束。这种情况下,博弈反复进行的次数是一定的。运用向前展望、倒后推理的原则,我们可以看到,一旦再也没有时间可以进行惩罚,合作就会告终。但是,谁也不愿意落在后面,在别人作弊的时候继续合作。假如真的有人仍然保持合作,最后他就会脱不了身。既然没人想当傻瓜,合作也就无从开始。实际上,无论一个博弈将会持续多长时间,只要大家知道终点在哪里,结果就一定是这样。 现在我们进一步考察这个论点。从一开始,两位参与者就应该向前展望,预计最后一步会是什么。在这最后一步,再也没有什么“以后”需要考虑,优势策略就是作弊。这最后一步的结果是一个不可避免的结论。既然没有办法影响这个博弈的最后一步,那么,在考虑对策的时候,倒数第二步实际上就会成为最后一步。 而在这一步,作弊再次成为优势策略。理由是,位于倒数第二的这一步对最后阶段的策略选择毫无影响。因此,倒数第二步可以视为孤立阶段,单独进行考虑。对于任何孤立阶段,作弊都是一种优势策略。 现在,最后两个阶段的情形已经确定。早期进行合作根本无济于事,因为两个参与者已经决心在最后两个阶段作弊。这么一来,在考虑对策的时候,倒数第三步实际上就会成为最后一步。遵循同样的推理,作弊仍是一种优势策略。这一论证一路倒推回去,不难发现,从一开始就不存在什么合作了。 这一论证的逻辑无懈可击,不过,在现实世界里我们仍然可以找到阶段性的成功合作。有几个方法可以解释这一现象。一是,不错,这个类型的所有真实博弈只会反复进行有限次,但具体数目却没人知道。既然不存在一个确定的结束时间,那么这种合作关系就永远有机会继续下去。同时,参与者会有某种动机维持这种合作,为的是万一将来遇到不测,需要别人帮忙;假如这个动机足够强烈,合作就可以维持下去。 二是,这个世界存在一些“善良的”人,不管作弊可能带来什么样的物质利益,他们仍然愿意合作。现在让我们假设你没有那么善良,看看会出现什么情况。假如你按照自己的私心行事,那么在一个反复进行有限次的囚徒困境博弈里,你会从一开始就作弊。而这会使其他参与者看清楚你的本质。于是,为了掩盖真相,或者是至少掩盖一会儿真相,你不得不装出善良的样子。为什么你会那么做呢?假设你一开始就按照善良人的方式行事,其他参与者就会认为你大约属于周围少有的几个善良人之一。合作一段时间将会带来实实在在的好处,而且其他参与者也会打算仿效你的善良人的做法,换取这些好处。这对你也有好处。当然,你和其他参与者一样,仍然打算在博弈接近尾声的时候偷偷作弊。但你们仍然会在最初一个阶段进行互利互惠的合作。因此,在各人假装善良等待占别人便宜的时机的当口,大家都会从这种共同欺骗中得到好处。 三是,能在一个反复进行的囚徒困境中使信任出现的条件是,作弊所得早于合作破裂产生的代价之前出现。这么一来,两者相比哪一个更重要,就取决于现在与将来相比哪一个更重要。在商界,比较现在与将来的利润的时候,会用一个合适的利率对将来的利润打折扣。而在政界,现在与将来的重要性比较更加带有主观色彩,不过,一般而言,下 一次竞选之后的时间看起来无关大局。这使合作变得难以达成。即便是在商界,若是遇到不景气的年份,整个产业处于崩溃边缘,管理层觉得已经走到山穷水尽,没有明天了,那么,竞争就有可能变得比正常年份更加激烈。同样地,由于战争迫在眉睫,伊朗和伊拉克会认为现在的利润会比将来的利润更重要,由此加深了欧佩克面临的困境。 4 .惩罚的保证 最巧妙的方式在于通过一个保证加以惩罚的承诺推行一个价格联盟,而且是以竞争的名义进行。现在我们将要看到的是纽约市及其立体声音响商店大战。疯狂埃迪(Crazy Eddie)已经打出了自己的口号:“我们不能积压产品。我们不会积压产品。我们的价格是最低的——保证如此!我们的价格是疯狂的。”它的主要竞争对手纽瓦克与刘易斯(Newark&Lewis) ,口号却没叫得那么野心勃勃。然而每次购物,你都会得到这个商店的“终生低价保证”。按照这一承诺,假如你在别的地方看到更低的价格,商店会按差价的双倍赔偿给你。 如果您在购物之后发现,在您购买产品的正常使用年限里,本地同一销售区域的其他商店同样型号的商品打出的价格或者实际销售的价格更低(必须附有打印的凭据),我们纽瓦克与刘易斯将很乐意向您(以支票方式)支付100%的差价,外加25%的差价,或者,假如您愿意,我们将赠送面值相当于差价200%的礼品券(包含100%的差价外加相当于100%的差价的礼品券)。 ——摘自纽瓦克与刘易斯的“终生低价保证” 不过,尽管这一家的政策听上去很有竞争力,这个非要击败对手不可的承诺却有可能加强一个操纵价格的卡特尔的内部约束。为什么会发生这样的事情呢? 假设一台录像机的批发价是150美元,现在疯狂埃迪和纽瓦克与刘易斯都卖300美元。疯狂埃迪偷偷作弊,减价为275美元。假如没有那个击败对手的承诺,疯狂埃迪完全有可能将一些原本打算在对手那边购物的顾客吸引过来,而这些顾客之所以要去纽瓦克与刘易斯那边购物,原因很多,可能是因为路途较短或者以前曾在那里买过东西。不幸的是,对疯狂埃迪而言,这回减价起了完全相反的效果。因为纽瓦克与刘易斯有那么一条价格保证,人们就想赚便宜,纷纷进来买一台录像机,然后要求赔偿50美元。这么一来,相当于纽瓦克与刘易斯的录像机自动减价为250美元,比疯狂埃迪减得还厉害。不过,当然了,纽瓦克与刘易斯一定不愿意就这么付出50美元。因此,它的对策就是降价至275美元。无论如何,疯狂埃迪的结果都不如原来。那又何必搞鬼作弊呢?价格还是保持在300美元好了。 虽然卡特尔在美国是非法的,疯狂埃迪与纽瓦克与刘易斯却还是结成了这么一个组织。读者可以看到,它们两家结成的这个心照不宣的卡特尔是怎样按照我们前面提过的卡特尔内部强制条件运行的:觉察作弊,并且惩罚作弊者。纽瓦克与刘易斯可以轻易觉察疯狂埃迪作弊。那些跑来说疯狂埃迪打出更低价格而要求赔偿的顾客,其实在毫不知情的情况下,扮演了这个卡特尔的执法侦探。惩罚的形式是价格协定破裂,结果导致利润下降。那则“击败竞争对手”的广告实际上自动而迅速地实施了惩罚。 联邦贸易委员会接过一个著名的反垄断案子,其中就涉及一种类似机制的利用,这种机制看上去会加剧竞争程度,其实却是一个卡特尔的约束机制。E.I.杜邦公司、乙烷基公司(Ethyl)和其他生产抗震汽油添加剂的公司被指控利用了一个“最优惠客户”条款。这个条款规定,这些最优惠客户将享受这些公司向所有客户提供的价格当中的最优惠价格。从表面上看,这些公司是在寻找它们的最优惠客户。不过,让我们深入考察一下。这个条款意味着这些公司不能展开竞争,不能通过提供一个带有选择性的折扣价格,将它的对手的顾客吸引过来,同时只能向它的熟客提供原来的较高价格。它们必须一起降价,而这么做的成本会大很多,因为它们卖出的所有产品的利润都下降了。读者可以看出这个条款对一个卡特尔有什么好处:作弊所得比作弊所失要小,因此卡特尔也更容易维持。 在评估这个“最优惠客户”条款的时候,联邦贸易委员会裁定其存在反竞争效果,禁止这些公司在它们与客户签订的合同里使用这么一个条款。① 假如现在的被告是疯狂埃迪和纽瓦克与刘易斯,你又会怎么判决呢?判断竞争激烈程度的一个标准是涨价幅度。许多所谓“廉价”立体声音响商店在定价的时候,差不多要在各个元件批发价之和的基础上再加100%。虽然很难看出哪一部分涨价是由库存和广告成本导致的,我们却可以发现一个表面上看来证据确凿的案例,说明疯狂埃迪究竟有多疯狂。 ① 这一裁决并非没有争议。委员会主席詹姆斯·米勒(James Miller)就不同意。他写道,这个条款“可以证明能够减少买方的搜索成本,使它们能够在众多买家里找到具有最佳价格价值比的顾客”。希望进一步了解这个案例的读者,请参阅“In the matter of Et hyl Corporation et al.” FTC Docket 9128,FTC Decisions, pp.425-686。 5 .惩罚方式的选择 如果存在几个不同的惩罚手段,可以阻止作弊和维持合作,我们应该怎样抉择呢?有几个标准可供参考。 惩罚手段最重要的特征也许在于简单明确,这样的话,任何一个打算作弊的参与者都能很方便也很精确地算出作弊的后果。举个例子:假如判断是不是有人作弊的方法是,在过去18个月的折扣利润低于同期产业资本平均真实回报率10个百分点,而这个方法对于绝大多数企业而言实在太复杂了,根本算不过来,那么,这就不是一个良好的阻止作弊的约束方式。 接下来应该考虑的是确定性。参与者应该有信心,相信作弊者将受到惩罚,合作将会得到回报。这在欧洲国家寻求推动关贸总协定的时候成了一个主要问题。如果遇到一个国家投诉说另一个国家在贸易协定上作弊,关贸总协定就会启动一个行政程序,且一搞就是几个月,甚至好几年。而在判决过程中,几乎没人会听案件本身的事实陈述,判决通常更受国际政治和外交政策的影响。这样的约束机制显然不可能发挥什么作用。 然后我们会问,惩罚应该有多严厉。大多数人的直觉反应是,惩罚应该“与罪行相抵”。不过,这也许并不足以阻止作弊。阻止作弊最可靠的方式在于使惩罚变得尽可能严厉。既然以惩罚进行威胁可以成功地维持合作,那么,惩罚本身有多严厉就无关紧要了。恐惧使大家不敢作弊,这么一来,实际上就不会出现违规行为,违规将要付出什么代价当然也就无关紧要了。 这一思路的问题在于,它忽略了出错的风险。侦察过程可能出错,如报告说卡特尔内部有人作弊,而真正导致价格下跌的罪魁却是一个完全不受控制的因素,比如需求下跌。假如惩罚尽可能严厉,那么这个错误的代价就会非常高昂。要想减小出错付出的代价,惩罚必须尽可能轻微,刚刚能阻止作弊就够了。最低限度的惩罚可以达到阻止作弊的目的,又不会在不可避免的差错出现时招致任何额外代价。 6 .以牙还牙 这里列出的一个惩罚机制应该具备的理想条件显得相当高不可攀。不过,密歇根大学的政治学学者罗伯特·阿克塞尔罗德(Robert A xelrod)指出,以牙还牙法则恰好符合这些条件。[2]以牙还牙其实是古老的“以眼还眼”行为法则的一种变形:人家对你怎么做,你也对他们怎么做。① 说得更精确一些,这个策略在开始阶段双方是合作的,以后则模仿对手在前一阶段的行动。 ① 在《旧约·出埃及记》(Exodus, 21:22 )中,我们看见,“人若彼此争斗,伤害有孕的妇人,甚至坠胎,随后却无伤害,那伤害她的总要按妇人的丈夫所要的,照审判官所断的受罚。若有别害,就要以命偿命,以眼还眼,以牙还牙,以手还手,以脚还脚,以烙还烙,以伤还伤,以打还打。”《新约》则提倡更具合作精神的行为。在《新约·马太福音)(Matthew, 5:38)中,我们读到,“你们听见有话说:‘以眼还眼,以牙还牙。’只是我告诉你们,不要与恶人作对。有人打你的右脸,连左脸也转过来由他打。”我们从“以其人之道还治其人之身”转为“你们愿意人怎样待你们,你们也要怎样待人”(《新约·路加福音》,Luke, 6:31)的金科玉律。假如人们当真遵循这一金科玉律,也就不会存在什么囚徒困境了。此外,只要我们看得更深远一些,不难发现,虽然合作可能在某一个特定博弈中降低你的收益,但是以后可能带来的回报却甚至足以使一个自私的人相信,合作应该算是一个理性策略。 阿克塞尔罗德认为,以牙还牙法则体现了任何一个行之有效的策略应该符合的四个原则:清晰、善意、刺激性和宽容性。再也没有什么字眼会比“以牙还牙”更加清晰、更加简单。这一法则不会引发作弊,所以是善意的。它也不会让作弊者逍遥法外,所以能够产生刺激。它还是宽容的,因为它不会长时间怀恨在心,而愿意恢复合作。 阿克塞尔罗德并未仅仅纸上谈兵,而是通过实验证明了以牙还牙法则的威力。他设计了一个二人囚徒困境博弈锦标赛。世界各地的博弈论学者以电脑程序的形式提交他们的策略。这些程序两两结对,反复进行150次囚徒困境博弈。参赛者按照最后总得分排定名次。 冠军是多伦多大学的数学教授阿纳托·拉波波特(Anatol Rapoport)。他的取胜策略就是以牙还牙。阿克塞尔罗德对此感到很惊讶。他又进行了一次锦标赛,这次有更多学者参赛。拉波波特再次提交了以牙还牙策略,并再次夺标。 以牙还牙策略一个非常引人注目的特征在于,它在整个比赛中取得了突出的成绩,虽然它实际上并没有(也不能)在一场正面较量中击败对手。其最好的结果是跟对手打成平局。因此,假如当初阿克塞尔罗德是按照“赢者通吃”的原则打分,以牙还牙策略的得分怎么也不会超过500 ,也不可能取得最后的胜利。 不过,阿克塞尔罗德并没有按照“赢者通吃”的原则给结对比赛的选手打分,只有比赛结束才算数。以牙还牙策略的一大优点在于它总是可以将比赛引向结束。其最坏的结果是遭到一次背叛,也就是说,让对方占了一次便宜,此后双方打成平局。以牙还牙策略之所以能赢得这次锦标赛,是因为它通常都会竭尽全力促成合作,同时避免相互背叛。其他参赛者则要么太轻信别人,一点也不会防范背叛,要么太咄咄逼人,一心要把对方踢出局。 不过,尽管如此,我们仍然认为以牙还牙策略是一个有缺陷的策略。只要有一丁点儿发生误解的可能性,以牙还牙策略的胜利就会土崩瓦解。这个缺陷在人工设计的电脑锦标赛中并不明显,因为此种情况下根本不会出现误解。但是,一旦将以牙还牙策略用于解决现实世界的问题,误解就难以避免,结局就可能是灾难性的。 举个例子:1987年,美国就苏联侦察和窃听美国驻莫斯科大使馆一事做出回应,宣布减少在美国工作的苏联外交官人数。苏联的回应是调走苏联在美国驻莫斯科大使馆的后勤人员,同时对美国外交使团的规模作出更加严格的限制。结果是双方都难以开展各自的外交工作。另一个引发一系列以牙还牙行动的例子出现在1988年,当时加拿大发现前来访问的苏联外交官从事侦察活动,当即宣布缩小苏联外交使团的规模,而苏联则以缩小加拿大在苏联的外交使团的规模作为回报。到了最后,两国关系恶化,此后的外交合作更是难上加难。 以牙还牙策略的问题在于,任何一个错误都会反复出现,犹如回声。一方对另一方的背叛行为进行惩罚,从而引发连锁反应。对手受到惩罚之后,不甘示弱,进行反击。这一反击又招致第二次惩罚。无论什么时候,这一策略都不会只接受惩罚而不作任何反击。以色列由于巴勒斯坦发动袭击而进行惩罚,巴勒斯坦拒绝忍气吞声,而采取报复行动。由此形成一个循环,惩罚与报复就这样自动而永久地持续下去。 哈特菲尔德家族(Hatfields)与麦科伊家族(McCoys)*的长期争斗,又或者是马克· 吐温(Mark Twain)笔下的格兰杰福特家族(Grangerfobrds) 与谢泼德森家族(Shepherdsons)的世代仇恨,给我们提供了另外两个例子,说明以牙还牙的行动是怎样导致两败俱伤的。不和各方一定不愿意停止争斗,除非他们觉得两家已经打平了。但是,就在这样持续不断的寻求打平的过程中,他们实际上是出手越来越重。最后他们甚至会为此送了命。几乎没有可能回到起点,重新谋求解决双方的不和了,因为,争斗一旦开始,就不会按照人们的意志发展。比如,当赫克·芬恩(Huck Finn)试图了解格兰杰福特家族与谢泼德森家族世仇的源头究竟是什么时,他却遇到了鸡生蛋还是蛋生鸡的难题。 “这究竟是为什么呢,巴克?——为了土地么?” “我估计是的——我不知道。” “那么,究竟是谁开的枪呢?是格兰杰福特家的人还是谢泼德森家的人?” “天哪,我怎么会知道呢?那是多久以前的事啊。” “有没有人知道呢?” “噢,有的,老爸知道,我估计,还有其他一些老头子,不过现在他们也不晓得当初究竟发生了什么事。” *哈特菲尔德家族与麦科伊家族是19世纪80年代美国肯塔基州的两大帮派,长期不和,以在肯塔基与西弗吉尼亚交界的山区地带持枪对射而闻名。当局虽然也会出动镇压,还逮捕滋事分子,无奈两大帮派根深蒂固,称霸一方,入狱者总是很快获得释放。如此僵持不下,直到1890年,两家争斗才渐渐平息下来。此事大大破坏了南北战争之后肯塔基州的形象。——译者注 以牙还牙策略缺少的是一个宣布“到此为止”的方法。因此,若将这一策略用于必然包含误解的情形,就会变得很危险。以牙还牙策略实在太容昌被激发起来。当某一作弊行为看上去像是一个错误而非常态举止的时候,你应该保持宽容之心。即便这一作弊是故意的,经过一个漫长的惩罚循环之后,也许到了该叫停并尝试重建合作的时候了。与此同时,你当然也不想太轻易地宽恕对方而被对方占了便宜。那么,你应该怎么取舍呢? 一个常见的评估策略的方法是衡量它有多大本事对付它自己。如果我们从发展的、演进的角度思考,就会发现“最符合情况的策略”是人们的优势策略。结果是,这些策略会经常相互较量。除非一个策略能够压倒自己,否则,任何最初阶段的成功都将转变为自我毁灭。 乍看上去,以牙还牙策略在对付自己的时候做得相当不错。两个以牙还牙者会从合作开始,然后,由于各方反应一致,合作似乎注定可以永久地持续下去。这种策略配对似乎可以彻底避免囚徒困境问题。 不过,若是有可能出现一方误解另一方行动的情况,又会怎么样呢?为了找出答案,我们仍然利用哈特菲尔德家族与麦科伊家族的例 子,因为他们就是用以牙还牙策略处理邻里关系的。起初他们和平相处(记作P) ,如图4-5所示。 图4-5 假设在第四轮,一个哈特菲尔德族人对一个麦科伊族人产生了误会。结果,虽然麦科伊家族真心维护和平,哈特菲尔德家族还是认为他们出现了侵略的举动(记作A) ,如图4-6所示。 图4-6 这么一个小小的误会犹如回声一般反复进行下去。在第五轮,哈特菲尔德家族以为麦科伊家族出现了侵略的举动而以侵略行动回敬,侵略从原来的想像变成现实。现在,两个以牙还牙的家族陷人了交替为前一次遭到报复而报复对方的情况。在第六轮,麦科伊家族为哈特菲尔德家族在第五轮的侵略而进行报复,导致对方在第七轮再次进行报复。如此类推。企图通过扳回一局而打成平手的做法根本行不通。 这一情况持续下去,直到出现第二个误会。此时有两种可能的发展方向。哈特菲尔德家族可能将和平误会为侵略,又或是将侵略误会为和平。① 假如侵略被误会为和平,整个争斗就会停止(至少可以维持到出现下一个误会之前)。 ① 同样地,这些误会也可能出现在麦科伊家族一边,其后果也是一样。 假如第二个误会是将和平当做侵略,双方还会继续相互报复。图4-7显示了第九轮的情况。图中惟一一条表示和平的线段被误会为侵略。结果,哈特菲尔德家族在第十一轮以报复予以回应。双方将继续为对方前一次惩罚自己而进行报复,直到下一个误会出现。虽然以牙还牙者可以出手报复,却不能忍受别人的报复。 图4-7 关于以牙还牙策略的运作,我们可以得出什么结论呢?只要有可能出现误会,长期而言,以牙还牙策略会有一半时间合作,一半时间背扳。理由是,一旦出现误会,双方将问题复杂化与澄清误会的可能性一样大。这么一来,以牙还牙策略其实就跟扔硬币决定合作还是背叛的策略差不多,因为后者选择合作和背叛的几率也是相同的。 在这一节的讨论中,我们似乎一直忽略了一个重要因素:出现误会的可能性。但实际上,我们的结论并不取决于这一可能性!不管出现误会的几率怎样微乎其微(即便是小到万亿分之一),长期而言,以牙还牙策略还是会有一半时间合作,一半时间背叛,就跟一个随机策略一样。如果出现误会的几率很小,那么出现麻烦的时间就会推迟。不过,反过来,一旦出现误会,就要花更长时间才能澄清。 存在出现误会的可能性意味着你必须有更宽宏的雅量,但只可记住,而不是简单地采取以牙还牙的报复行动。这在大家认为出现误会的几率很小,比如5%的时候是正确的。不过,假如处于一个有50%的几率出现误会的囚徒困境中,你又该怎么做呢?你该有多大的宽宏雅量呢? 一旦出现误会的几率达到50% ,再也没有可能在囚徒困境中达成合作。你应该永远背叛对方。为什么呢?设想两种极端情况。假设你永远选择合作,而你的对手有一半时间会误会你的行动,结果是他会认为你一半时间背叛,一半时间合作。假如你永远背叛又会怎样?这种情况下你仍然会有一半时间被误会,只不过这一次对你是有利的,因为对手认为你有一半时间是合作的。 不管你选择什么策略,你都不可能影响你的同伴的看法。这就好比你的同伴是靠扔硬币来决定自己认为你做了什么一样。一旦出现误会的可能性达到50% ,看法与现实将再也没有什么联系。既然你根本没有可能影响你的同伴接下来将要作出的抉择,你大约还是选择背叛的好。你会在每一个阶段得到较高的回报,将来也不会遭到什么损失。 关键在于,保持宽宏雅量直到某一阶段是值得的。假如出现误会的可能性变得太高,那么在囚徒困境里保持合作的可能性就会消失殆尽。合作实在是太容易破裂,以至于不可能加以利用。较高的出现误会的可能性使你根本没有办法通过自己的行动传达清晰的信息。由于缺乏通过行动沟通的能力,合作的希望也就不复存在。 出现误会的可能性达到50%是可能出现的最糟糕的情况。假如大家都知道误会一定会出现,就会把每一个信息理解成相反的意思,那么误会也就不会出现了。一个百发不中的股市预言者其实跟一个百发百中的股市预言者同样出色。只不过你要知道应该怎样解读这些预言罢了。 记住这一点。接下来我们会找一个办法,破解这个其中可能出现误会而出现误会的可能性又不是太高的困境。 7 .以牙还牙策略的一个替代选择 清晰、善意、刺激性和宽容性等基本性质看起来很可能恰好符合任何能将自己解脱出囚徒困境的行为准则的要求。不过,以牙还牙策略在惩罚一个有过合作历史的人时显得过于急躁了一些。我们必须找出一个更能区别对待的策略:这一策略应在背叛只是偶尔为之时显得宽容一些,而在背叛成为一种惯常行为时又能果断地实施惩罚。 读者可以考虑遵循以下指导原则,作为迈向这一方向的一步。(1) 开始合作。(2)继续合作。(3)计算在你合作的情况下对方看上去背叛了多少次。(4)假如这个百分比变得令人难以接受,转向以牙还牙策略。注意,与以前不同,此时的以牙还牙策略不是作为对良好行为的奖赏,相反,却是对企图占你便宜的另一方的惩罚。 要想确定令人难以接受的背叛的百分比是多少,你必须了解对方行为的短期、中期和长期历史。仅看长期历史是不够的。一个人合作了很本长时间并不意味着他不会在声誉开始下降的时候企图占你的便宜。你还要知道“最近你都对我做过什么”。 这里有这一策略的一个例子,更具善意,更宽容,又没有那么大的刺激性,比以牙还牙策略复杂一点。从合作开始,如此继续下去,直到情况符合下面4个检验中的1个。 ·第1印象:第一轮就背叛绝对不可接受。转向以牙还牙策略。 ·短期:任何3轮当中出现2次背叛也是不可接受的。转向以牙还牙策略。 ·中期:过去20轮当中出现3次背叛也是不可接受的,转向以牙还牙策略。 ·长期:过去100轮当中出现5次背叛也是不可接受的,转向以牙还牙策略。 用以牙还牙策略惩罚不必永远持续下去。记录对方符合上述4个测试的频率。出现第一次背叛之后,进行20轮如回声一般的以牙还牙的相互报复,然后改为合作。同时将对方置于观察期,严密监视。另将中期和长期测试当中可能允许出现的背叛次数减1。假如对方在观察期内的背叛次数没有达到这一数字的50% ,就可以将他的背叛记录清为零,重新开始计算。假如对方在观察期内犯规,那就采取以牙还牙策略,永不改变。 对于第一印象以及短期、中期和长期印象,其确切规则取决于错误或误会发生的几率、你对未来获益和目前损失的重要性的看法,等等。不过,在并不完美的现实世界里,这种策略很可能胜过以牙还牙策略。 必须记住的一个重要原则是,假如有可能出现误会,你不要对你看见的每一次背叛都进行惩罚。你必须猜测一下是不是出现了误会,不管这个误会来自你还是你的对手。这种额外的宽容固然可使别人对你稍加作弊,不过,假如他们真的作弊,他们的善意也就不会再有人相信了。最终误会出现时,你再也不会听之任之。所以,如果你的对手有投机倾向,他终将自食其果。 8 .案例分析之四:国会对联邦储备局 美国国会和联邦储备局经常在经济政策上发生冲突。为了解释这一争端是如何引发以及将会导致什么结果,我们在这里介绍一下普林斯顿大学经济学家艾伦·布林德(Alan Blinder)对这一争端所做的博弈论分析。[3]这两个机构各自拥有相当独立的制定经济政策的权力。制定财政政策(税收和政府支出)是国会的工作,而制定货币政策(货币供给和利率)则属联邦储备局负责。各方可以选择用扩张或紧缩的模式实施自己的政策。扩张的财政政策意味着高支出和低税收,这会降低失业率,却有引发通货膨胀的风险。扩张的货币政策意味着低利率及由此形成的更宽松的借贷条件,这同样有可能引发通货膨胀。 对于经济结果,这两个机构也有各自的好恶标准。选民喜欢政府支出给他们带来的好处,比如降低按揭,却不愿意交税。有鉴于此,国会倾向于采取扩张性的政策,除非通货膨胀已经迫在眉睫,而且非常严重。相反,联邦储备局看得更长远,认为通货膨胀才是更关键的问题,因此倾向于采取紧缩性的货币政策,即紧缩银根。 1981-1982年,国会一度不再把通货膨胀当做一个多么了不起的风险。他们觉得整个经济有能力承受一个扩张性的财政政策,想要联邦储备局加以配合,同时采取一个扩张性的货币政策。不过,保罗·沃尔克(Paul Volcker)领导的联邦储备局担心这么做只会重新引发通货膨胀。在联邦储备局看来,第一选择是财政政策和货币政策同时紧缩。换言之,国会认为最理想的政策在联邦储备局看来糟糕透顶,反之亦然。 国会与联邦储备局的利益却并非完全对立。为了达成妥协,双方就一个采取扩张政策,另一个采取紧缩政策的相对优点进行了辩论。不管谁采取扩张政策,谁采取紧缩政策,这一混合策略对一般就业和通货膨胀的影响都相差不大,区别在于其他重要方面。扩张的财政政策和紧缩的货币政策会产生庞大的预算赤字,同时会拉高利率,因为只有这样做才能募集必要的资金,以在货币政策紧缩的前提下支持这个赤字的财政政策的运行。高利率还会对一些重要的行业,比如汽车和建筑业,造成非常严重的伤害。而外国资本由于受到美国高利率的吸引,也会蜂拥而入。美元将会升值,美国的国际竞争力将因此受到削弱。 财政紧缩政策和货币扩张政策会导致相反的结果:利率降低,美元贬值,对我们的汽车和建筑行业大有好处,也使我们销售的产品更具竞争力。国会和联邦储备局在这两种选择面前一致倾向于采取后面这个混合政策。 这种情况下,你预计可能出现什么结果?你会怎样判断这个结果?而你又会觉得整个政策制定过程应当进行什么改革呢? 案例讨论 这是一个囚徒困境。不然的话,这个案例也不会出现在这一章了,不是吗?)让国会和联邦储备局对4种可能的政策混合模式排列名次,1表示最佳,4表示最差。于是我们可以得到图4-8。 图4-8 联储和国会对结果的排序 对于国会,高支出是一个优势策略;对于联邦储备局,优势策略是收紧银根。一旦双方这么想,而且各自选择自己倾向的策略,结果将是财政赤字和银根紧缩。这正是20世纪80年代初发生的事情。不过,其实还存在一个对双方都更加有利的结果,即预算盈余和银根放松。 究竟是什么使它们没能达成一个对彼此都更加有利的选择呢?答案又是决策的相互依存性。只有在双方一致选择单独看来不那么好的策略的时候,才会取得对于双方都更好的结果。国会必须限制支出,从而达到一个平衡的预算。不过,假如国会这样做了,谁能保证联邦储备局就不会报以一个收紧银根的政策呢?若是联邦储备局当真那么做,就会出现在国会看来最糟糕透顶的结果。国会不相信联邦储备局有能力抵御这样的诱惑。它们没有办法彼此许下值得信赖的承诺,正是这一事实堵死了通向双方都更愿意看到的结果的道路。 我们能不能提出一个走出这一困境的办法呢?双方有着一种持续的关系,合作可能出现在反复进行的博弈当中。不过,合作只有在双方都足够重视未来收益的时候才会出现。国会议员每隔两年就要谋求竞选连任,要他们以如此长远的目光行事,实在困难。 我们不妨从另一个角度审视这个间题。其实,联邦储备局本身就是国会的一项发明。在大多数其他国家,政府(财政部)对中央银行的控制权要大得多。假如美国也是这样,那么,国会完全可以强迫联邦储备局采取一个扩张的货币政策,从而达成国会最想看到的结果。当然,那些赞同联邦储备局的看法,认为通货膨胀才是重要问题的人,会觉得这实在令人感到遗憾。 看上去这是一个没有胜方的情况:协调财政和货币政策等同于国会短视的政治目标取得成功,可惜,由一个独立的联邦储备局开出的支票和结余却引出了一个囚徒困境。也许,一个解决的方案是让联邦储备局决定支出和税收,而让国会确定货币供给? 第5章策略行动 我们必须组织一场毫不留情的战斗。绝不能让敌人拿到一片面包或一升汽油。合作农场的农民必须将牲口赶到别处,将粮食转移到其他地方。无法转移的东西一律就地毁灭。桥梁和道路必须埋设地雷。森林和仓库都要烧毁。留给敌人的只能是难以忍受的局面。 ——斯大林在宣布苏联对抗纳粹的“焦土”防御政策时的讲话,1941年7月3日。 今天,在企业控制的战场上,仍然可以看见斯大林的战略。西太平洋(Western Pacific)打算吞并霍顿·米夫林(Houghton Mimin)出版公司,后者威胁说要清空自己的作者群。约翰·肯尼思·加尔布雷思(John Kenneth Galbraith)、阿奇博尔德·麦克利什(Archibald MacLeish)、小阿瑟·施莱辛格(Arthur Schiesinger ,Jr.)以及许多盈利可观的教科书的作者一致威胁说,假如霍顿· 米夫林被兼并,他们就会另投别处。“当西太平洋主席霍华德·(米基)·纽曼(Howard (Mickey) Newman)接到头几封作者寄来的抗议信的时候,他还觉得这是一个笑话,称之为‘捏造’。不过,当他接到更多这样的信件时,他开始意识到,‘我可能买下这个公司后却一无所获。’”[1]结果,西太平洋收回收购计划,霍顿·米夫林得以继续独立经营。 不过,这一策略并非总是管用。比如,当鲁拍特·默多克(Rupert Mudoch)有意收购《纽约》 杂志时,该杂志社肩负重任的管理层决心将他打回去。许多著名的作者威胁说,假如默多克夺得控制权,他们就即要离开《纽约》 杂志。但这并未吓倒默多克。他还是收购了《纽约》 杂志。作者们确实离开了,但是,广告客户并没有走。默多克得到了他想要的东西。作者们走错了方向。要想使焦土政策起作用,你就必须毁灭入侵者想要的一切,而这些东西未必是现在的主人最重视的。 我们倒不是有意暗示说,这么一个策略无论成功或失败,其本身或结果都是可取的。我们不难想像社会希望避免这么一种意味着巨大浪费的破坏行动的出现。我们的目的在于解释这些策略的本质,这样你就可以更好地运用它们,或者避免使用它们。 焦土防御只不过是被博弈论者称为策略行动的做法的一个例子。[2[ 一个策略行动的设计意图在于改变对方的看法和行动,使之变得对自己有利。其突出特征是刻意限制你的行动自由。这一点可以通过一种无条件的方式实现,比如一个总统候选人发誓说“不会提高税收,就是这样”。又或者,由于策略行动确定了一个怎样应付不同情况的规则,自由因此受到限制。比如,美国许多州都有强制性的制裁持枪犯罪的法律,这些规则实际上有意限制了司法裁判的自由。 你大约已经觉得,保留选择余地总归是有好处的。不过,在博弈论的王国里,这一点却不成立。你虽然少了自由,却在策略上得了益,因为这么做改变了其他参与者对你以后可能采取什么反应的预期,而你可以充分利用这一点,为自己谋利。其他人知道,只要你有行动的自由,你就有让步的自由。引用奥斯卡·王尔德(Oscar Wilde)的名言,就是:“我就是没法拒绝诱惑。”[3] 1 .无条件行动 设想美国和日本争先恐后发展高清晰度电视。虽然美国拥有技术方面的优势,却由于财政赤字越积越高,可以动用的资源实在非常有限。日本抓住美国这个短处,再次击败了它。不过,一个乍看上去可能进一步束缚美国的策略行动其实可以扭转整个局面。 在缺少无条件行动的前提下,华盛顿和东京同时开始选择各自的策略。每个国家都必须决定对研究开发的投入是高还是低;投入高,会大大缩短开发时间,当然产生的成本也更高。我们把这个情况看做一个博弈,画出它的得失图表(如图5-1所示)。每一方都有两个策略,因此会出现4个可能的结果。 我们假设双方都认为,投入高是一个最糟糕的结果,因为:在日本看来,美国很可能赢得一场全力以赴的比赛,自己的投入只会变成损失;而在美国看来,这么做的成本太高。把这个结果称为各方的1 。各方第二糟糕的结果(2)是自己的投人水平低,而对方却选择了高水平:这等于在毫无成功希望的前提下花钱。 图5-1 美日高清晰度电视竞赛的得益 日本最愿意看到的结果(4)是,自己选择高水平,美国却选择低水平;那样的话,它取胜的机会很大,而且资源成本问题在它看来也没那么严重。在美国看来,最理想的结果是双方同时选择低水平,那样的话,美国很有机会以较低成本打赢这一仗。 低水平是美国的优势策略。美国的问题在于,日本会早已料到这一点。日本的最佳对策是转向高水平。这个博弈的均衡点出现在右上方的格子里,在那里,美国得到的是自己第二糟糕的结果。要想改善这一局面,必须采取一个策略行动。 假设美国占了先机。日本还没来得及做出决定,美国已经抢先宣布自己无条件支持这一开发项目。这就使原本同时出招的博弈变成相继出招的博弈,而且还是美国先行。于是,上图5-1 也相应变成一棵树(如图5-2 所示)。① ① 要想把一棵树变成一张桌子(表格),非得借助一个聪明的木匠不可;一个聪明的策略家,知道怎样把一张表格变成一棵树。(在英语中,“表格”和“桌子”是同一个单词,作者在这里是用这个多义词开玩笑。——译者注) 图5-2 相继行动的博弈树及其得益(括号内第一个数字为美国的得益,第二个数字为日本的得益) 这个博弈可以通过向前展望、倒后推理解出。假如美国选择低水平,日本就会报以高水平,那么美国的结果就是2。假如美国选择高水平,日本报以低水平,那么美国的结果就是3。因此,美国应该宣布选择高水平,同时希望日本报以低水平。这就是这个相继出招的博弈的均衡点。这么做,美国可以得到3,胜于它在原来那个同时出招的博弈里得到的2。 这个使美国占得有利形势的策略行动,在于单方面、无条件地宣布自己的选择。这个选择不是美国在同时出招博弈里会做出的选择。引入策略思维的精彩之处,正在于此。美国若是宣布选择低水平,不会得到任何好处;在其没有作出任何声明的情况下,日本反正也是这么预期的。 要想策略地行动,你必须保证自己不要采取在同时出招博弈里的均衡策略。美国的这个策略行动改变了日本的预期,进而改变了它的行动。一旦相信美国会不惜一切代价选择高水平,日本就会选择低水平。当然了,等到日本拿定了主意,美国最好还是改变主意,同样回到低水平的道路上去。 这就提出了几个问题:为什么日本应该相信美国的声明?它难道就不会预计到美国会改变主意么?假如它料到美国会有这么一个改变,它还会选择高水平么? 换言之,美国走出的无条件行动的第一步的可信度值得怀疑。假如美国并不可信,那么这一招将毫无作用。大多数策略行动都会遇到这个可信度的问题。回顾本章开始提到的几个例子,虽然政治家们发誓不会加税,这是无条件的,却并非不可收回。一旦当选,他们常常可以找到借口加税。即便是有条件的规则,在特定的时候也会出现例外情况,比如一个精神科医生用一枝非法的手枪自卫,抵抗一名神经错乱的病人的袭击,那么强制判刑的条例就失去了效力。 为了使一个策略行动可信,你必须采取其他附加行动,使扭转这一行动变得代价高昂乃至完全没有可能。可信度要求对这个策略行动作出一个承诺。当斯大林威胁说要饿死他的敌人,烧毁田野的行动就使他的威胁变得非常可信。而在其他情况下,可信度是一个程度间题。(大多数时候)法律体系中的先例使强制判刑条例显得可信;至于政治家的承诺,例外情况反而更加常见。在高清晰度电视的竞赛里,美国可以划拨专项资金,专供有意参与开发计划的公司申请支取,从而使自己投人高水平研发力量的选择显得更加可信。 因此,策略行动包含两个要素:计划好的行动路线以及使这一路线显得可信的承诺。本章我们集中考察行动。我们将策略行动划分为不同类型,逐一进行解释,而暂时把怎样使这些行动变得可信的问题放在一边。打个比方,若说这是一个烹调过程,下一章我们会提供一个承诺的详细“食谱”,现在让我们继续研究行动的主“菜单”。 2 .威胁与许诺 一个无条件的行动可以使这个参与者获得策略上的优势,抢占先机,率先出招。即便你并未真的先行,仍然可以通过对一个回应规则作出一个承诺,获得相仿的策略优势。回应规则把你的行为视为对其他人行动的一种回应。虽然你是跟在别人后面行动,但这个回应规则必须在别人开始行动之前就实施。父母对孩子说,“除非你吃掉菠菜,否则没有甜品”,实际上就是在确立一个回应规则。毫无疑问,这个规则必须在这个孩子把自己那份菠菜喂了小狗之前就开始实施,并且明确宣布出来。 回应规则分为两大类:威胁与许诺。威胁是对不肯与你合作的人进行惩罚的一种回应规则。既有强迫性的威胁,比如恐怖分子劫持一架飞机,其确立的回应规则是假如他的要求不能得到满足,全体乘客都将死于非命;也有阻吓性的威胁,比如美国威胁说,假如苏联出兵攻击任何一个北约国家,它就会以核武器回敬。强迫性的威胁的用意在于促使某人采取行动,而阻吓性的威胁的目的在于阻止某人采取某种行动。两种威胁面临同样的结局:假如不得不实施威胁,双方都要大吃苦头。 第二大类的回应规则是许诺。这是对愿意与你合作的人提供回报的方式。为寻找证人,检察官会向一个被告许诺说,只要他愿意成为公诉方的证人,检举同案中的其他被告,他就会得到宽大处理。许诺同样可以分为强迫性的和阻吓性的两种。强迫性许诺的用意是促使某人采取对你有利的行动,比如让被告摇身一变成为公诉方的证人;阻吓性许诺的目的在于阻止某人采取对你不利的行动,比如黑帮分子许诺好好照顾证人,只要他答应保守秘密。相仿地,两种许诺也面临同样的结局:一旦采取(或者不采取)行动,总会出现说话不算数的动机。 有时候,威胁与许诺的界限非常模糊。一个朋友在纽约市被抢了钱,却得到下面这个许诺:只要你“借给”我20美元,我许诺一定不会伤害你。相比之下更加性命攸关的还是这个歹徒没有明说的威胁:假如我们这个朋友不肯“借给”他20美元,他就一定会受到伤害。 正如这个故事暗示的那样,威胁与许诺的界限只取决于你怎样称呼当前的情形。老派的歹徒会威胁说,假如你不给他一点银子,他就要伤害你。假如你没有给,他就会动手“修理”你,从而造成一种新的情形,而在这种新的形势下,他又会许诺说只要你给他一点银子,他马上就会住手。随着形势转变,一个强迫性的威胁会变得和一个阻吓性的许诺差不多;同样,一个阻吓性的威胁与一个强迫性的许诺的区别也只在于当时的情况。 3 .警告与保证 一切威胁与许诺的共同点在于:回应规则使你不会在没有回应规则的前提下采取行动。假如这个规则只是泛泛地指出,无论什么时候你都会采取最佳行动,那就跟没有规则差不多。由于别人对你以后的行动的预期毫无变化,这个规则也就产生不了任何影响。不过,说明什么事情会在没有规则的情况下发生,仍然具有一种公告天下的作用,这些说明称为警告与保证。 如果实践一个“威胁”对你有利,我们称之为警告。比如,假设总统警告说他会否决一个他不喜欢的法案,这只不过是表明了他自己的意图。假设他本来很愿意签署这个法案,但是为了促使国会提出更好的方案,他决定策略地指出要行使否决权,这就是一种威胁。 警告的用意在于告知其他人,他们的行动将会产生什么影响。父母警告孩子说炉子顶部很热,这只是一个事实陈述,不是策略。 如果实践一个“许诺”对你有利,我们称之为保证。孩子不理会关于炉子顶部很热的警告,结果烫伤了,这使父母得到某种保证,知道孩子以后再也不会这么干了。 我们强调这两对概念的区别是有理由的。威胁与许诺是真正的策略行动,而警告与保证更多的是起一个告知的作用。警告或者保证不会改变你为影响对方而设立的回应规则。实际上,你只不过告知他们,针对他们的行动,你打算采取怎样的措施作为回应。与此截然相反,威胁或者许诺一旦时机来临,就会改变你的回应规则,使之不再成为最佳选择。这么做不是为了告知,而是为了操纵。由于威胁和许诺表明你可能选择与自身利益冲突的行动,这就出现了一个可信度的问题。等到别人出招之后,你就有动机打破自己的威胁或者许诺。为确保可信度必须做出一个承诺。 我们用图5-3总结策略行动可能的选择。无条件的行动是你先行且行动一成不变的回应规则。威胁与许诺则在你第二个出招时出现。两者都是有条件的行动,因为这个回应是由取决于对方怎样做的规则所确定的。 一种策略行动总是抢占先机的行动。回应规则必须在对方行动之前实施。这意味着无论策略行动是什么,整个博弈都必须当做相继出招的博弈进行分析。如果你永不妥协,那么其他人就会针对你的无条件的行 动做出回应。借助威胁与许诺,你首先设立了一个回应规则,然后,其他人出招,而你按照自己的回应规则采取相应的行动。 策略行动 无条件的 有条件的 起初的 威胁 许诺 强迫性的阻吓性的 强迫性的阻吓性的 图5-3 结果是,对行动或者回应规则作出的承诺使原本同时出招的博弈变成相继出招的博弈。虽然得失情况不会改变,同一个博弈若是按照同时出招或者相继出招方式进行,有可能产生完全不同的结果。结果的差异来源于不同的博弈规则。我们通过美日争霸故事的一个无条件的行动说明了这一影响;现在,让我们来看一看美苏对峙以及民主党与共和党较量当中出现的威胁与许诺。 4 .核阻吓 曾经有超过40年的时间,北大西洋公约组织(简称北约)一直在努力寻求一种管用的阻吓手段,遏制苏联人侵西欧。北约军队的常规防御不大可能奏效。北约的阻吓手段的一个基本要素在于美国的核力量。不过,动用核武器进行回应意味着给整个世界带来毁灭性的打击。这可怎么办? 我们用一棵树表示这个博弈(如图5-4所示)。苏联拥有先行之便。假如它不发动攻击,结果是保持现状,双方各得0分。假如它进攻北约,而北约以常规防御回应,那么,苏联得1分,美国得-1分。假如动用核武器进行回应,那么双方各得-100分。 在这个博弈中,苏联向前展望,预计自己的进攻不会促使对方动用核力量反击。这样做的结果对美国不利。因此,进攻意味着它能得到1分,不进攻则什么也得不到,是0分。结果是它一定会进攻。 常规防御(l,-l) 北约 进攻 核武器(-100,-100) 苏联 保持现状(0,0) 图5-4 相继出招的博弈树及其得益(括号内第一个数字为苏联的得益,第二个数字为美国的得益) 假如你认为这种情况不可能出现,但北约在欧洲的成员国却一致觉得美国很有可能按照上述思路在它们需要援助的时候丢弃不管。它们希望美国作出一个可信的承诺,表明自己将在盟国遭到攻击的时候动用核武器。 我们暂时放下可信度的问题,首先考察这么一个威胁产生作用的机制。现在,美国拥有先行之便,也就是说它率先提出自己的回应规则。这个相关规则就是如下威胁:“假如苏联进攻西欧,我们的回应就是动用核武器。”假如美国不做这个威胁,这个博弈就会按照前面提到的方式进行。一旦实施威胁,进行常规防御的选择也就不复存在。完整的博弈树将如图5-5所示。 北约 进攻 核武器(-100,-100) 苏联 保持现状(0,0) 图5-5 存在威胁时相继出招博弈的得益(括号内第一个数字为苏联的得益,第二个数字为美国的得益) 一旦美国实施威胁,苏联向前展望,意识到进攻将会引发对方动用核武器,苏联的结局将是-100分。它宁可保持现状,也不会发动攻击。现在,拥有先行之便的美国向前一直展望到底,就会发现自己若是实施这个威胁,得分是0,若不实施这个威胁,得分是-1。可见,正是美国自身的利益,决定它要不要实施威胁。 再次提醒各位注意,美国的回应规则要求采取某种行动,而这一行动在从事之后判断显然不是最佳选择。其中的策略意图在于,以令人信服的方式改变苏联对美国事后采取什么回应的认识,可以使美国改变“这件事”——确切地说就是苏联要不要进攻西欧的决定。 这个规则必须在对方采取你打算加以影响的行动之前生效。一旦被人占了先机,不管是无条件的行动,抑或威胁与许诺,都将无济于事。 第一招一定要让对手观察得到或者推断得到,否则你就不能达到预期的策略效果。在影片《奇爱博士》(Dr.Strangelove )中,苏联在星期五就安装好了它的万无一失的阻吓装置——“末日毁灭机”,却非推迟到下星期一才告诉美国。偏偏就在这个周末,美国空军将领杰克·D·里泊(]ack D.Ripper)下令他的飞行中队发动了一场核攻击。就这样,苏联的阻吓装置由于对方毫不知晓而未起到任何作用。 能够观察到这一点并不像表面看来那么直截了当。假如一个行动本身可从结果推断出来,我们就不一定要观察到对方的这个行动。举个例子,假如我对有壳的水产品过敏,我不必真的看到你在厨房,照样可以觉察到你正在煮一盆虾。① ① 秘密投票的目的就是让投票者免受这样的影响。不过,我们再次发现,阻吓不必真要对方看到才起作用。我能看到你出招是不足够的,我还要有能力看懂你使的究竟是什么招数。虽然我的投票一定是秘密投入票箱的,最后的投票结果却不是秘密的。假如一个候选人贿赂了100个人,最后却只得到47票,他一定知道某些人(确切地说是53个人)欺骗了他。假如他决定惩罚他贿赂过的全部100个人,他这么做的时候一定可以找到他应该惩罚的人。这一方式虽然有点莽撞,却可以在每个选区只有少数投票者的情况下破解票箱的保密措施。 你的无条件行动若是打算用来影响对方,就一定要让对方看到,同样,假如你打算通过威胁或许诺影响他的行动,那么他的行动也应该可以让你看到。否则你不可能知道他是不是选择顺从,而他也明白这一点。 现在,既然你已经知道可信的无条件行动和威胁是怎样起作用的,你不必借助一棵非常具体细致的博弈树也可以分析这一类型的最简单情况。通常只要口头阐述就足够了。假如这真的不够,而你又怀疑单凭文字能不能正确讨论全部案例,那么你总是可以通过画博弈树检查自己的推理过程。 5 .时报的策略 1981年,罗纳德·里根初登总统宝座,广受欢迎。不过,他能不能实现自己的使命,让国会通过税收改革法案呢?在他提出第一份预算案的时候,战线就已经划分出来。民主党希望里根妥协,牺牲一部分税收改革法案,以换取一个较小的赤字。共和党则要求全面实行供方经济*。最后的结果取决于两党怎么进行这场博弈。 *促成有利于产品与服务生产者的条件的经济。——译者注 在参议院,民主党人附和里根的预算案,希望以此促成一些共和党人的妥协,使其支持自己的主张,从而达成两党合作。但共和党人并不领情,坚守原来的方案。现在,这一情形转移到众议院。民主党人有没有更好的策略呢? 《纽约时报》上两篇由伦纳德·西尔克撰写的专栏文章非常漂亮地说明了当时的策略可能性。[4]他在描述这些谈判的时候指出,两党各有两个选择,因此可能出现四种结果。以下我们再现了西尔克的博弈图表(如图5-6所示)。 图5-6民主党和共和党的结果排序 民主党人认为最佳结果是他们攻击里根的方案,而共和党人妥协,因为这样民主党人可以宣称自己已对预算尽心尽力,与此同时还能实施符合他们理想的预算案。而在共和党人这边,最佳结果出现在左上角,这种情况下,里根的预算案得到两党支持。假如民主党人发起进攻,而共和党人坚守原定方案,结果就会出现僵局,两党同时遭到失败。假如共和党人愿意妥协,那么民主党人也愿意缓和自己的进攻力度;两党都会得到各自的次佳结果。 民主党人的主要问题是:共和党人拥有一个优势策略——全力支持里根。假如民主党人大体支持里根,那么共和党人就应该全力支持里根,从而达成己方的最佳结果。假如民主党人攻击里根,共和党人就应该全力支持里根,以避免出现己方的最坏结果。不管民主党人怎么做,共和党人全力支持里根总能得到较好的结果。① 因此,共和党人的策略变得易于预测。民主党人应该料到共和党人会全力支持里根,而这时民主党人的最佳策略就是照办,即大体支持里根。而这正是参议院发生的事情。 到目前为止,结果仍然对共和党人有利。民主党人为了改善自身处境,必须实施某种策略行动。他们必须将整个局面转为相继出招的博弈,以抢占先机,让共和党人针对他们的策略做出回应。② 于是,我们就要考虑什么样的威胁、许诺或者其他行动可以扭转局面,使其有利于民主党人。 看上去没有一个基本策略帮得了民主党人的忙。无条件的行动、许诺乃至威胁统统不管用。只有同时实施威胁和许诺才能促使共和党人妥协。 ① 此外,西尔克还指出,不管民主党人选择什么策略,全力支持里根的做法都会使共和党人处于一个比民主党人更有利的地位。在左上角的方格,共和党人的第一位置比民主党人的第三位置更有利,而在左下角的方格,共和党人的第三位置又比民主党人的第四位置更有利。因此共和党人总是压倒对方,处于上风。不过,正如我们在第2章讨论过的那样,博弈的每一个参与者应该尽可能使自己的地位达到最佳水平,不应理会最后谁将处于上风。对于优势策路的正确理解在于,一个策略比其他策略对你更有利,而不是这一策略会使你得到比对手更好的结果。博弈的参与者在考虑各自的相对地位时,这些问题应该永远包含在内,成为这个表格里列出的排名或者得失的一部分。 ② 由于共和党人已经得到他们最理想的结果,他们也就没有什么办法可以继续加以改善自己的地位。他们的目标只不过是维持现状。阻止民主党人,不让他们实施任何可能改变这个博弈的结果的策略行动,这是符合共和党人利益的做法。 无条件行动的问题在于,它不能影响共和党人的地位。现在大家都认为民主党人应该支持里根。民主党人立下契约这么做并不能改变共和党人的预计,因此也只能得到同样的结果。惟一的策略可能性是民主党人无条件地攻击里根。若是这样,他们可以向前展望,推理得知共和党人的回应仍然是全力支持里根。(共和党人总是倾向于全力支持里根,这是他们的优势策略。)不过,假如民主党人发起攻击,共和党人全力支持里根,那么,民主党人得到的结果还比不上两党同时支持里根的结果。 民主党人想诱使共和党人从全力支持里根转向妥协。因此,他们也许可以许诺说假如共和党人妥协,他们就会支持里根。① 不过,这个许诺也帮不了他们。共和党人知道,假如他们完全不理会妥协这一选择,而是全力支持里根,那么民主党人的最佳回应就是支持里根。民主党人的许诺反而会换来他们最后无条件支持里根的结果。共和党人当然喜欢这个前景,并下定决心全力支持里根,力求得到他们的最佳结果。民主党人的许诺毫无意义。共和党人大可不必放在心上。 ① 假如共和党人同意做这笔交易,民主党人就会有一个反悔的动机。因此,要想使这个许诺产生作用,其本身必须是不可逆转的。 民主党人只有一个威胁可以用来阻止共和党人支持里根。他们可以威胁说假如共和党人全力支持里根,他们就要攻击他。但这个威胁是不够的。这个威胁的效果是民主党人有了一个无条件的契约,就是攻击里根。假如共和党人支持里根,民主党人就会实践他们的威胁,攻击里根;假如共和党人妥协,从最有利于民主党人的角度来看,他们还是应该攻击里根。既然无论共和党人采取什么行动,民主党人还是要攻击里根,那么共和党人就应该支持里根,以取得两种可能性当中的最佳结果。 许诺最后变成民主党人无条件支持里根,而威胁则变成民主党人无条件攻击里根。两者都不能有效改变共和党人的行动。 假如民主党人同时运用许诺和威胁,他们就可以为自己赢得较好的结果。他们应该许诺说,假如共和党人妥协,他们就会支持里根;同时威胁说,假如共和党人全力支持里根,他们就会攻击他。这一策略可以达成民主党人的目标。一旦实施这一组威胁和许诺,共和党人必须选择是妥协,从而赢得民主党人大体支持里根,还是全力支持里根,结果激起民主党人攻击他。在这两个选择当中,他们更愿意妥协。 真实的情况是,共和党人在参议院和众议院都是全力支持里根。民主党参议员跟随共和党参议员而与其达成一致。在众议院,民主党人最初的抵抗很快让位给一个第三策略:他们在减税的博弈中比里根还要里根。结果达成了一个两党都同意的“圣诞树”大优惠式的减税法案。眼看这一经济法案就要到期,摆脱这一难题的谈判正在演变成为新的策略博弈。 6 .更多的策略行动 除了前面提到的三种基本的策略行动,还有更多更加复杂的选择。你不一定直接建立一个回应规则,相反,你可以故意让别人利用这些策略当中的一个。这些选择包括: ·你可以任由别人在你做出回应之前采取一个无条件行动。 ·你可以等待别人发出一个威胁,然后再采取行动。 ·你可以等待别人提出一个许诺,然后再采取行动。 有些时候,本来可以先行的一方放弃这一便利,让对方做出一个无条件的行动,反而能取得更好的结果,这样的例子我们已经探讨过了。若是在跟随比带头更好的关头,这么做当然是明智选择,比如我们前面讲过的美洲杯帆船赛以及剑桥学生舞会的故事。不过,虽然放弃先行之便可能更加有利,但这么做却并非一个基本规则。有时候你的目的可能是阻止你的对手作出一个无条件的承诺。中国古代战略家孙子曾经给过这样的提示:“围师遗阙” [5]。只要留下出口,敌人就会认定还有逃生机会。假如敌人看不到任何逃跑的出口,就会迸发破釜沉舟般的勇气,顽抗到底。孙子的目的就是不给敌人对自己作出一个拼死战斗的非常可信的承诺的机会。 让别人有机会对你发出一个威胁永远不是好事。你大可以选择按照对方的希望行动,却没有必要等到听见一个威胁。不错,你若不听话,别人就不会给你好果子吃,但这一事实并不能作为你坐等对方发出一个威胁的借口。注意,这句格言只限于允许对方发出威胁而已。假如对方同时作出威胁和许诺,那么双方都会得到更好的结果。 7 .杀鸡焉用牛刀? 显而易见,在你作出一个许诺的时候,你不应让自己的许诺超过必要的范围。假如这个许诺成功地影响了对方的行为,你就要准备实践自己的诺言。这件事做起来应该是代价越小越好,因此也意味着许诺的时候只要达到必要的最低限度就行了。 不那么容易看到的是,适度原则其实同样适用于威胁。你不应让自己的威胁超过必要的范围。这么做的理由相当微妙。 为什么美国不会威胁日本说,假如日本不同意进口更多的美国大米、牛肉和柑橘,美国就要动武呢?① 虽然动武的想法有可能博得美国一些农场主和政治家的欢心,但同时却存在几个很好的理由,说明不能这么做。 ① 实际上,这么一个威胁曾在1853年使用过。美国海军上将马修·C·佩里(Matthew C.Perry)的黑漆漆的庞大战舰编队成功地说服了日本幕府时代的将军,使后者同意向美国商界开放日本市场。今天,日本把美国由于要求开放日本市场而施加的过分压力称为“黑色舰队再次到访”。 (1)没有人会相信这么一个威胁,因此这个威胁不会奏效。 (2)哪怕这个威胁真的管用,日本也不傻,一定会重新揣摩美国究竟是不是它的盟友。 (3)假如日本不肯进口更多柑橘,美国说到做到,当真实践自己的威胁,其他国家就会谴责美国选择了一个很不恰当的惩罚方式,日本更会怒不可遏。不过,假如美国不实践自己的威胁,又会让自己日后的信誉大打折扣。无论是不是实践自己的威胁,美国都将遭到失败。 (4)这个威胁由于引入了一个本来毫不相干的因素——武力——而使原来的问题变得模糊不清。 上述各点的核心在于,这个威胁大而不当,对方难以置信,而自己又不能说到做到,更别说进一步确立自己的信誉了。 博弈的参与者发出威胁的时候,首先考虑的问题可能恰恰相反,认为威胁必须足够大,大到足以阻吓或者强迫对方的地步。接下来要考虑的则是可信度,即能不能让对方相信,假如他不肯从命,一定逃脱不了已经明说的下场。若是在理想状况下,再没有别的需要考虑的相关因素了。假如受到威胁的参与者知道反抗的下场,并且感到害怕,他就会乖乖就范。那么,我们为什么还要担心若实践这个威胁,会有多么可怕的情况发生呢? 问题在于,在这个方面,我们永远不会遇到理想状况。只要我们仔细考察美国不能威胁动武的理由,我们就会看得更清楚,现实与理想状况究竟有什么区别。 首先,发出威胁的行动本身就可能代价不菲。国家、企业乃至个人都参加着许多不同的博弈,他们在一个博弈中的行动会对所有其他博弈产生影响。比如美国若是威胁对日本动武,就会影响到美国日后与日本的关系、目前和日后与其他国家的关系,而美国用过这么一个大而不当威胁的事情也会留在别人的记忆里。别人在和美国打交道时就会犹豫不决,美国则会失去许多其他贸易和伙伴关系带来的好处。 其次,一个大而不当的威胁即便当真实践了,也可能产生相反的作用。日本会惊慌失措地高举双手投降,请求世界舆论声援,谴责美国人民,从而将大大推迟有关谈判的进度;美国本来希望迫使它尽快开放国内市场,结果却适得其反。 第三,所谓一个成功的威胁完全不必实践的理论,只在我们绝对有把握不会发生不可预见的错误的前提下成立。假设美国错误地判断了日本农场主的势力,而他们宁可让国家投人战争也不愿失去自己受到保护的市场。又或者,假设日本同意美国的条件,可是美军某指挥官想起自己当初不幸沦为战俘的惨痛经历,咬牙切齿要进行报复,就会抓住这个机会贸然发动攻击。面对发生诸如此类错误的可能性,美国应该三思而后行,在考虑作出一个很大的威胁的时候更应如此。 最后,在讨论过以上几点后,我们可以看到,一个威胁可能由于过大而丧失可信度。假如日本不相信美国当真愿意实践这个威胁,这个威胁就不可能影响它的行动。 结论是,能奏效的最小而又最恰当的威胁应该成为美国的首要选择,务必使惩罚与罪行相适应。如果美国希望刺激日本多买柑橘,就应该选择一个更具互惠性质的威胁,使惩罚与不肯多买柑橘的做法更加匹配。比如,美国可以威胁说要削减日本汽车或者电器的进口配额。 有些时候,一个合适的威胁简直得来全不费工夫。而在其他时候,我们眼前只存在大而不当的威胁,必须缩小其范围才能考虑加以采纳。边缘政策可能是这类用于缩小范围的机制当中最管用的一个,我们会在第9章进行讨论。 8 .案例分析之五:波音、波音,完蛋了? 开发一种新型商用飞机简直可以说是一场豪赌。单是设计一个新引擎的成本就可能高达20亿美元。我们可以毫不夸张地说,开发一种新更好的飞机实际上等于“把公司作为赌注押上去”, [6]。难怪政府会被牵涉进去,竭力要为本国企业谋求更大的市场。 这里我们研究一下可以承载150位乘客的中程喷气式客机市场,这两种客机分别是波音727和空中客车320。波音首先开发出波音727。这时,空中客车闯入这个市场是不是明智呢? 这类客机的主要市场是美国及欧共体各成员国。我们假设,对于一个垄断企业,美国和欧共体市场各值9亿美元。假如出现两个企业发生正面竞争,总利润就会从9亿美元跌到6亿美元,且由两家平分。竞争虽然导致利润下跌了,却带来了更廉价的飞机和更便宜的机票,于是消费者得益不浅。两个市场的消费者分别得到7亿美元的好处。 空中客车公司估计,开发空中客车320的成本是10亿美元。假如它没有得到政府支持而独立实施这一开发计划,它将在美国和欧共体市场分别创造3亿美元利润,总值6亿美元,这还不够弥补开发的成本。 欧共体各国政府没有能力以提供补贴的方式直接支持这一计划,因为它们的预算早已承诺要用来补贴农民。在传统的“要大炮还是要黄油”的抉择面前,欧共体早就选择了要黄油,没给大炮或者空中客车留下什么位置。 现在,布鲁塞尔要召见你,就欧共体是不是应该通过建立一个受到保护的市场的方式支持空中客车的问题征询你的意见,其中保护的意思是要求欧洲航空公司购买空中客车320,不要购买波音727。你会怎么说呢?你预计美国政府又会怎样回应呢? 案例讨论 假如欧共体选择保护本土市场,而美国市场继续保持开放,空中客车就能作为欧洲市场的惟一垄断企业以及美国市场的双寡头垄断企业之一,分别在欧洲和美国赚到9亿美元和3亿美元。这就足以弥补10亿美元的开发成本。 这一政策是不是符合作为一个整体的欧共体的利益呢?我们必须同时比较空中客车之得与欧洲消费者之失。假如没有受到保护的市场,空中客车就不会实施开发计划,加入竞争。波音将在欧洲取得垄断地位。消费者不会得到什么好处。因此,消费者本身不会有什么损失。然而,欧共体作为一个整体,其经济得益与空中客车的利润是挂钩的。看起来,欧共体应该通过许诺造就一个受到保护的市场,支持空中客车投资开发新型客机。 欧共体承诺采取保护主义政策这一点非常重要。假设它还没有拿定主意,空中客车就进人这个市场。在这个当口,欧共体没有保护空中客车的动机。保持市场开放将使空中客车的预计利润减少6亿美元(从净赚2亿美元变成亏损4亿美元),但是,来自波音的竞争将使欧共体消费者的得益增加7亿美元。一旦意识到这一点,空中客车就不会进人这个市场,因为它没能得到欧共体各国政府的承诺,答应继续保护本土市场。 那么,美国方面又会怎样回应呢?假如美国人迅速采取措施,他们同样可以抢在空中客车开始生产之前承诺保护本国市场。现在就让我们向前展望,倒后推理。假如美国市场继续开放,情形就和前面讨论过的一样。波音被挡在欧洲市场之外,在美国又要与空中客车竞争,只能得到3亿美元利润。美国消费者则从竞争当中得益7亿美元。因此,对于美国经济而言,市场继续开放意味着总得益达到10 亿美元。 假设美国进行针锋相对的反击,同样要求美国航空公司购买波音727,而不能购买空中客车320。若是这样,即便空中客车在欧洲取得垄断地位,其利润9亿美元还是不够弥补开发的成本。因此,空中客车320也就永远不会开工制造。波音将在两个市场取得垄断地位,总利润达到18亿美元。这一经济得益远远高于市场继续开放时的数字。[7] 可见,美国可以通过采取针锋相对的保护主义措施,击败欧共体对空中客车的支持。这么做符合美国自身的利益。 第6章可信的承诺 大多数情况下,只有口头许诺是不能当真的。正如制片人萨姆·戈尔德温(Sam Goldwyn)形容的那样,“口头合同还比不上把它记录下来用的白纸值钱呢。”[l]在由戈尔德温的竞争对手华纳兄弟公司拍摄的影片《马耳他之鹰》(The Maltese Falcon)里,汉弗莱·博加特(HUrnphrey Bogart)扮演萨姆·斯佩德(Sam Spade) ,悉尼·格林斯特里特(Sydney Greenstreet)扮演古特曼(Gutman) ,其中有一幕同样生动地描绘了这一点。古特曼递给萨姆·斯佩德一个信封,里头装着10000美元。 斯佩德抬起头来,微微一笑。他平静地说:“我们原先说好的数目可比这多得多呢。”“是的,先生,”古德曼表示同意,“不过,那时我们只是说说而已。这可是货真价实的钞票,如假包换的银子。只要这样的1块钱,你就能买到比说说而已的10块钱更多的东西。[2] 这一教训可以一直追溯到托马斯·霍布斯*(Thomas Hobbes)的名言:“言语的束缚实在软弱无力,根本抑制不了人们(男人)的贪婪。”[3] 李尔王(King Lear)则发现,其实女人也一样。 *英国政治哲学家、机械唯物主义者。——译者注 对于所有策略行动,可信度都是一个问题。假如你的无条件行动、威胁或许诺只停留在口头上,而采取行动加以实践其实并不符合你的利益,你为什么要这么做呢?不过话说回来,别人可以向前展望、倒后推理,预测到你根本没有动机加以实践,那么你的策略行动就不会取得理想效果。 第5章描述的全部策略的根本目的在于,改变对手对你就他的行动可能做出什么回应的预计。假如他相信你不会实践你作出的威胁或许诺,这一目的就会落空。假如你不能影响他的预期,你就不能影响他的行动。 一项可能改变的行动在一个懂得策略思维的对手面前根本起不了任何策略作用。他知道你的言行未必一致,因而会特别警惕战术诈骗。 罗思柴尔德家族(the Rothschilds)在滑铁卢战役之后有过一个著名的表里不一的例子。据说罗思柴尔德家族懂得用信鸽报信,因此可以首先得知战役胜负的结果。当他们发现英国取胜,就马上公开抛售英国债券,好让其他人以为英国输了,纷纷仿效,抛售英国债券。结果导致英国政府债券价格直线下跌。不过,在大众得知真相之前,他们却悄悄地用跌到最低的价格购人了远比抛售数目更大的英国债券。① ① 关于这个故事里的信鸽通讯是不是后世杜撰的细节,还有一定争议。弗雷德里克·莫顿(Frederic Morton)在他的著作(罗思柴尔德家族》(The Rothschilds)中指出:" 1815年6月19日,傍晚时分,罗思柴尔德家族一位名叫罗思沃斯(Rothworth)的经纪人跳上奥斯坦德河的一条小船。他的手里握着一份还带着印刷机湿气的荷兰报纸。6月20日黎明,内森·罗思柴尔德(Nathan Rothschild)站在福克斯通港,以一目十行的速度飞快地浏览这份报纸。不一会儿他就起程直奔伦敦,比威灵顿(Wellington)的信使早到了好几个小时,并抢先向英国政府报告说拿破仑已被击溃。接下来他才去了伦敦股票交易市场。” 假如伦敦证券交易所的其他投资者早已认识到罗思柴尔德家族可能这样全盘扭转自己的行动,他们一定会料到这是战术诈骗,这一招也就不会奏效。一个保持清醒的策略头脑的对手应该预计你可能有意误导他,因此,对那些他认为专门做出来显得对他有利的行动也就不会为之所动。 建立策略意义上的可信度意味着你必须让别人相信你确实会实践你的无条件行动,你会信守许诺,也会实践你的威胁。你和罗思柴尔德家族不同,你没有办法可以愚弄大家。人们不会按照表面意思领会一个承诺的内容。你的承诺可能遭受检验。可信度需要努力争取。 可信度要求找到一个办法,有效阻止你反悔。假如没有明天,今天的承诺就不能反悔。临终证词之所以会被法庭高度重视,就是因为这样的证词没有反悔推翻的机会。更常见的情况却是,明天(以及后天)仍会来临,因此,我们必须彻底考察长期而言怎样才能使承诺可信的问题。“今天饱餐一顿,因为明天我们要绝食斋戒”,这是将明天可能失去的东西抢在今天享受的借口。 1 .建立可信度的八正道 要让你的策略行动显得很可信,其实并不容易,却也不是完全没有可能。我们在第5 章第一次提到这个问题的时候曾经说过,要想使一个策略行动显得很可信,你必须同时采取一个附加或从属的行动。我们把后一种行动称为承诺。 现在,我们提供八种手段,以助于建立可信的承诺。正如佛教开出的涅槃指示,建立可信度同样也有“八正道”。在不同情况下,这些手段中会有一种或多种能够证明对你是有帮助的。而在这套手段后面,有三个重要原则。 第一个原则是改变博弈的结果,意思是说,务必使遵守你的承诺成为符合你自身利益的选择:把威胁变成警告,把许诺变成保证。要做到这一点,有多种方法。 (1)建立和利用一种信誉。 (2)写下合同。 这两种手段都能使破坏承诺的代价高于遵守承诺的代价。 第二个原则是改变博弈,使你背弃承诺的能力大受限制。在这方面,我们考察三种可能性。最极端的做法莫过于剥夺自己反悔的机会,比如禁止自己走到反悔的地步,或断绝一切反悔的后路。甚至还有一种可能性,就是离开决策位置,听天由命。 (3)切断沟通。 (4)破釜沉舟。 (5)让后果超出你的控制。 以上两个原则合并起来就是:可能的行动及其结果都有可能改变。假如一个大的承诺被分割为许多小的承诺,那么,违背其中一个小的承诺的得益很可能并不足以抵消失去余下承诺的损失。因此我们说 (6)小步前进。 第三个原则是充分利用别人,帮助自己遵守承诺。一个团队也许会比单独一个人更容易建立可信度。又或者,你可以考虑雇用其他人来做你的代表。 (7)通过团队合作建立可信度。 (8)雇用谈判代理人。 信誉 假如你在博弈当中尝试了一个策略行动,然后反悔,你可能就会丧失可信度方面的信誉。若是遇到百年一遇、千载难逢的情况,信誉有可能显得不那么重要,因此也没有多大的承诺价值。不过,一般情况下,你都会在同一时间跟不同对手进行多个博弈。因此你就有建立信誉的动机,而这就相当于作出一个承诺,以使自己的策略行动显得可信。 1961年柏林危机期间,约翰·F·肯尼迪(John F·Kennedy)曾这样解释美国的信誉的重要性: 假如我们不能遵守我们对柏林的承诺,日后我们怎能有立足之地?假如我们不能言出必行,那么,我们在共同安全方面已经取得的成果,那些完全依赖于这些言语的成果,也就变得毫无意义。[4] 另一个例子是以色列的一贯原则:坚决不跟恐怖分子谈判。这是一个威胁,意在阻吓恐怖分子,打消他们企图劫持人质,以此索取赎金或者要求释放犯人的念头。假如这个决不谈判的威胁是可信的,那么,恐怖分子就会意识到他们的行动注定徒劳无功。与此同时,以色列的决心也会经受考验。每一次,一旦这个威胁必须实践,以色列总会吃苦头;拒绝妥协可能使以色列人质命丧黄泉。每一次只要遭遇恐怖分子,以色列的信誉和可信度就会面临考验。屈服一次的意义绝不仅仅是满足眼下这批恐怖分子的要求那么简单,还会给以后的恐怖行动增添诱人的魅力。① ① 甚至以色列本身态度强硬的信誉也会遭受损失。他们愿意释放3000名阿拉伯犯人以换取3名本国空军飞行员的做法已经暗示,例外情况确实有可能出现。 对于承诺而言,信誉的影响是一把双刃剑。有时候,破坏信誉可能为达成一个承诺铺设道路。破坏你的信誉这一行动会使你跟你自己达成一个承诺,决心以后不再采取任何在你预计当中并不符合自己最佳利益的行动。 要不要跟劫机者谈判的问题有助于说明这个观点。在任何具体劫机事件发生前,政府可以做出决定,通过威胁说决不谈判,对劫机行动进行阻吓。不过,劫机者预计到,一旦他们夺取飞机,政府就会发现它根本不可能坚守绝不谈判的立场。政府怎样才能剥夺自己跟劫机者谈判的能力呢? 一个答案是破坏其许诺的可信度。设想一下,在双方谈判达成协议后,政府却突然背弃自己的承诺,向劫机者发动攻击。这么做的结果是,政府对劫机者的处理方式值得信赖的信誉将会丧失殆尽。政府失去了作出一个可信的许诺的能力,同时不可逆转地断绝了自己对劫机者发出的威胁进行回应的后路。这种破坏许诺的可信度的做法将使决不谈判的威胁变得非常可信。 美国国会在税收特赦计划方面也遇到了类似的保持前后一致性的问题。这种计划允许以前欠缴税款者补足差额而不必支付罚金。表面看来,这是一个不费分毫即可增加国库收人的办法。那些想过要在报税单上做手脚的人都会乖乖地向政府补缴他们欠下的数目。不过,实际情况是,只有在国会用一种非常可信的方式告诉大家,再也不会有下次特赦,国会才能不费分毫地增加国库收人。但是,假如特赦真是一个如此好的主意,为什么不在几年后再试一次呢?什么也阻止不了国会会相当定期地提出一次特赦。于是问题就出来了:在报税单上做手脚的做法变得很有吸引力,因为日后你总有可能获得特赦。 国会必须找到一个办法,阻止自己反复使用这个特赦计划。在《华尔街日报》的一篇文章里,罗伯特·巴罗和艾伦·斯托克曼(Robert and Alan Stockman)提议说,政府不妨宣布进行一次税收特赦,然后反过来,起诉那些乖乖补缴税款的人。[5]这会比单纯实行一次特赦更能增加国库收人。一旦政府在自己的特赦计划里做手脚,下次政府再实行特赦计划的时候,还有谁会相信呢?政府通过破坏自己的可信度,可以作出一个非常可信的承诺,表明再也不会有下次特赦。 你大概会想,这是一个荒谬的主意,而且你的理由也很充足。首先,这么做不会对具有策略头脑的人起作用。他们可以预计到,政府一定会出尔反尔,所以他们根本不会上这个特赦计划的当。第二,也是更重要的一点,逮住在报税单上做手脚的人并不是惟一一场正在进行的博弈。对这些人出尔反尔可能得到的好处,并不足以抵消政府在其他领域丧失信誉带来的损失。 关于如何建立信誉最引人注目的例子之一是五月花家具公司(Mayflower Furniture Company)。在马萨诸塞州收费公路上有一个巨大的广告牌,该公司在上面自豪地宣称自己创建127年来从未有过减价促销活动。(他们是不是还在等待自己的第一个顾客?)这种无条件的每日低价承诺可吸引一批稳定的客流。举办一场减价促销活动可能暂时提高利润,但是,你要等127年才能再次做出那样富于吸引力的广告。明年,我们将等着上面的数字从127变成128。随着这一信誉越来越有价值,它本身就能维持自己永生不朽。① ① 遗憾的是,我们不得不告诉各位,五月花家具公司最近举办了一次减价促销活动,是清仓结业那种减价促销。 在上述这些例子里,:博弈参与者是怀着非常直接而有意识的目标来培植信誉的,他一心想为自己日后的无条件行动、威胁和许诺创造可信度。不过,信誉也有可能出自非策略的理由,却同样有助于树立可信度。从不食言的自豪感就是一个例子。托马斯· 霍布斯写道,对言语的约束可以通过两种途径得到强化:一是对食言后果的恐惧,二是不食言的荣耀或自豪。这样的自豪感通常借助教育或者一般社会影响灌输到一个人的价值观中。其中甚至包含改善我们多方面日常人际关系可信度的愿望。不过,没有人告诉过我们,之所以要为自己拥有正直荣耀而感到自豪,原因在于这将带来策略上的好处,使我们的威胁或许诺变得可信;人们只是告诉我们,荣耀本事就是一件好事。 一个有着举止疯狂名声的人可以成功地发出威胁,但若是换了一个头脑正常、沉着冷静的人,当他作出同样的威胁时,人们就会觉得难以置信。从这个意义上讲,明显的不合理性可以变成良好的策略上的合理性。你甚至可以有意培育这么一种名声。由此说来,一个看起来疯狂的人也有可能是一个超级策略家,因为他的威胁总是更容易就使别人信以为真。卡扎菲(Ghadafi)上校和霍梅尼(Ayatollah Khomeini)会不会真的比跟他们打交道的西方国家的冷静而理性的首脑更明白这一点呢?我们不知道。不过,我们愿意打赌说,你的孩子若是由于太缺乏理性而毫不俱怕你的威胁,那么,你的孩子会是一个比你更出色的天生的策略家。 合同 要使你的承诺显得可信,一个直截了当的办法就是同意在你不能遵守承诺的时候接受某种惩罚。假如负责重新装修你的厨房的工人事先得到一大笔订金,他就会有动机减慢工程进度。不过,一份具体说明了酬金与工程进度有关,同时附有延误工期的惩罚条款的合同能使他意识到,严格遵守商定的时间表才是最符合自己利益的决定。这份合同就是确保承诺得以遵守的手段。 实际情况并不会像这个例子这么简单。设想一名正在节食减肥的男子悬赏500美元,谁若是发现他吃高热量食品,谁就能得到这笔赏金。于是,以后只要这名男子想起一道甜品,他就可以轻易判断出这东西不值500美元。不要以为这个例子不可信而嗤之以鼻;实际上,一份类似的合同已经由尼克·拉索(Nick Russo)先生提出,惟一的区别在于赏金高达25000 美元而已。根据《华尔街日报》的报道: 于是,受够了各种减肥计划的罪的拉索先生决定将自己的问题公布于天下。除了继续坚持每天1000卡路里的食谱,他还会为任何一个发现他在餐厅吃饭的人士提供一笔赏金,高达25000美元,这笔钱将捐献给对方指定的慈善机构。他已经告知附近的饮食店……张贴了他自己的照片,上面注明“悬赏缉拿”。[6] 不过,这份合同有一个致命的缺陷:没有防止再谈判的机制。拉索先生眼瞅着精致的法式小甜饼,嘴上却会争辩说,按照目前合同的承诺,没有人可以得到25000美元赏金,因为他永远不会违反这份合同的规定。因此,这份合同也就一文不值了。再谈判符合双方的共同利益。比如,拉索先生可能说他愿意请客,支付一轮酒水费用,以此换取在座各位放他一马。在饭店吃饭的人一定愿意免费享用一杯饮料,这无论如何总比一无所获更好,因此也就乐意让他暂时丢开那份合同。[7] 为使合同方式奏效,负责强迫执行承诺或者收取罚金的一方必须具 备某种独立的动机完成自己的任务。在减肥的问题上,拉索先生的家人大概也希望他变得苗条一点,因此,他们不会为区区一杯免费饮料就动了心。 合同方式更加适用于商业交易。违反合同一般都会造成破坏,因此,受害方一定不愿意善罢甘休。比如,一个制造商就可能要求一个没能按时送货的供应商支付罚金。这个制造商不会对供应商究竟有没有送货漠不关心。他更愿意得到的是自己订购的货物,而不是罚金。在这种情况下,对这份合同进行再谈判将不再是双方都觉得有意思的选择。 假如供应商使出那个正在减肥的先生的理论,又会怎么样?假设他打算再谈判,理由是罚金数目实在太大,因此人人都会遵守这份合同,那么制造商也就永远得不到罚金。不过,这正是制造商希望看到的结果,因此他不会有兴趣进行再谈判。合同奏效了,因为制造商并不单单对罚金有兴趣;他在乎的是人们在合同里许诺的行动。 立下合同的时候,也有可能加人中立方,负责强迫各方遵照合同行事。中立方的身份在于,合同能不能得到遵守并不牵涉他的个人利益。为使中立方的强迫执行作用显得可信,必须要求他通过建立一种信誉影响,让大家知道他确实关心这项承诺是否得到遵守。在某些例子里,假如合同监管人任凭别人重写合同,他就可能丢了自己的饭碗。托马斯·谢林为如何实施这些想法提供了一个绝妙的例子。[8 ]在丹佛,一家康复中心治疗富有的可卡因瘾君子的办法是,让他们写一份自首书,假如他们不能通过随机尿检,这份自首书就会被公告天下。许多人在自愿陷人这样的境况之后都会反悔,想方设法要赎回这份合同。不过,假如监管这些合同的人让他们重写合同,就会被炒鱿鱼;进而,假如该中心不能及时炒掉这个同意瘾君子们重写合同的员工,它的信誉也会大打折扣。 这个故事的窝意在于,单有合同并不能解决可信度的问题。若想奏效,还需要另外一些可信度工具,比如雇用对强迫执行或者他人信誉面临考验间题具有独立兴趣的人士。实际上,假如信誉影响足够大,可能根本没必要正式签订一份合同。这就是“一言既出,驯马难追”的意义。① ① 另一方面,在大学教授中间曾经有过这么一个说法:“商人之间握一握手已经足够。不过,若是你的大学教务长许诺你什么东西,最好还是请他写下来。” 切断沟通 切断沟通之所以可以成为一种管用的确保承诺可信的工具,原因在于它可使一个行动真正变得不可逆转。这一做法的一个极端形式是一份最后的遗嘱或者证词中的条款。一旦这一方死亡,再也没有进行再谈判的机会。(举个例子,英国国会就不得不专门通过一个法案,才得以修改塞西尔·罗兹(CecilR Rhodes)的遗嘱,从而为女性成为罗兹奖学金获得者打开了大门。)一般而言,只要有心,总有办法使你的策略变得可信。 比如,多数大学都会为捐赠教席定出一个价码。现行价码大约是150万美元。这些价码不会刻在石头上公告天下(当然也没有用常春藤遮掩起来)。人人都知道,为了接受已经去世的捐赠人的条件和捐款,假如其并未达到目前的价码要求,大学就会修改自己的规矩。 我们没有必要通过死亡的方法使自己的承诺显得可信。不可逆转性其实就站在每个邮箱旁担任警戒。谁没有寄过一封信,然后又觉得后悔,想把它拿回来?反过来也一样:谁没有接过一封信,然后又觉得后侮,但愿自己从来没有接到过?不过,一旦你打开这封信,你就不能把信寄回去,假装自己从来没有读过。 在这种邮政做法普遍推行之前,实现承诺的一个成功的工具就是,在用支票付款的时候,选择没贴邮票也没写回信地址的信封寄出自己的支票。寄出一封没有回信地址的信本身就是一个不可逆转的承诺。邮局1 朋过去常常投递这类信件,收信人只要支付邮资就能收到这封信。公共设施公司或者电话公司知道,这么一封信很可能装了一张支票。他们宁可支付邮资,也不愿再等一个收费周期才收到付款(或者另一封没贴邮票也没有回信地址的信)。 这些公司的代付邮资问题终于在邮局修改自身政策之后得到解决。邮局宣布,没贴邮票的信件不再投给收信人;若有回信地址就退回发信人处,若没有回信地址就不再发送。这样,这些公司可以宣布不再接收任何没有贴足邮票的信件了。 不过,假如你在回信人和收信人处都写上该公司的地址,又会怎样?这么一来,邮局就知道应该把信退给谁了。记住,你不是第一个听说这个主意的人。而且,假如这个做法开始流传开,可以肯定的是,邮局的政策还会进行修改,以后没贴邮票的信件甚至不会退回发信人处。 将切断沟通用做一个确保承诺遵守的工具,其中存在一个严重的问题。假如你被单独囚禁,与外界隔绝,那么,你要想确定对手是不是真的按照你的愿望行事,就算还不至于完全没可能,也是非常不容易的。你必须雇用其他人,确保合同得到遵守。比如,遗嘱就是由受托人而不是死者本人负责执行的。父母立下的禁止吸烟的规矩虽然在父母外出的时候仍然可能具有毋庸置疑的地位,却也不能强迫执行。 破釜沉舟 军队通常借助断绝自己后路的做法而达成遵守承诺的目标。这个策略至少可以回溯到1066年,当时,征服者威廉(William)的侵略大军 烧毁了自己的船只,从而立下了一个许战不许退的无条件承诺。西班牙殖民者科尔特斯(Cortes)在征服墨西哥的时候沿用了同一策略。他刚刚抵达墨西哥的坎波拉(Cempoalla)就下令烧毁和捣毁自己的全部船153只,只留下一条船。虽然他的士兵面对着数目大大超过自己的敌人,但他们已经别无选择,只有战而胜之。“假如(科尔特斯)输了,那么他的做法很可能被视为疯狂…… 不过,这是深思熟虑的结果……在他的心里除了取胜就是灭亡,再也没有其他选择。”[9] 破坏自己的船只使科尔特斯得到两个有利之处:首先,他自己的士兵团结起来了,每一个人都知道他们全体都会战斗到底,因为他们已经没有可能中途放弃(甚至逃跑);其次,也是更重要的一点,这一承诺对敌人产生了影响。他们知道科尔特斯要么取胜,要么灭亡,而他们自己则有撤退到后方的选择。他们选择了撤退,而不是跟这么一个已经横下一条心的敌人较量。要使这类承诺产生预期效果,光有作战室里的策略家们达成一致还不够,你必须让(你的以及敌人的)士兵们都有透彻的了解。因此,这个例子当中特别有意思的一点在于,“捣毁舰队虽然是科尔特斯的提议,但士兵们不仅知道,而且表示支持”[10]。 这个破釜沉舟的想法显示了策略思维随着时间流逝而不断发展的历程。特洛伊人似乎早在希腊人乘船前往特洛伊抢夺海伦(Helen)的时候已经通过倒推法了解了这一策略。① 当时的情况是,希腊人企图征服特洛伊,而特洛伊人打算烧毁希腊人的船只。不过,假如特洛伊人当真成功地烧毁了希腊人的船只,他们大约只会使希腊人变成更加坚定不移的敌人。实际上,特洛伊人没能烧毁希腊船只,而是眼看着希腊人败退回家。当然了,希腊人留下了一匹木马作为礼物,这一次轮到特洛伊人在接受这份礼物的时候显得匆忙草率了一些。[ll] ① 虽然特洛伊人很可能通过倒推法了解了这一策略,但希腊人却走在了这场博弈的前面。谢林将希腊将军色诺芬(Xenophon)当做这种策略思维的一个早期例子。虽然色诺芬没有当真切断自己的退路,他却在自己的著作里提到了破釜沉舟的优势。参见Schelling 眼的“Strategic Analysis and Social Problems” ,收录在他的论文选集。Choice and Consequence(Cambridge,Mass.:Harvard University Press,1984)中。 到了现代,这一策略不仅用于海路攻击,还用于陆路攻击。多年以来,埃德温·兰德(Edwin Land)的宝丽来公司一直有意拒绝关闭自己的快速成像业务。随着该公司渐渐将自己的全部筹码押在快速成像技术之上,它等于给自己立下承诺,必须竭尽全力打击闯入这个市场的侵略者。 1976年4月20日,在宝丽来公司独霸快速成像市场长达28年之后,柯达公司闯了进来:它推出了一款新的快速成像胶片和相机。宝丽来的反应咄咄逼人:它起诉柯达,说它侵犯了自己的专利权。埃德温·兰德作为该公司的创办人和主席,已经做好准备,决心捍卫自己的领地: 这是我们全心全意投入的领域。这是我们的整个生命所在。而在他们看来,这只不过是另一个领域罢了…… 我们一定要坚守我们的阵地,保卫这个阵地。[12] 马克·吐温在《傻瓜威尔逊》(Pudd’nhead Wilson)这篇小说里解释了这一哲学: 听好了…… ,傻瓜会说:“不要把你的鸡蛋全放在一个篮子里。”但是,智者会说:“把你的鸡蛋全放在一个篮子里,同时切记 看好那个篮子。’, [l3] 快速成像市场的战争于1990年10月12日结束,当时法庭判决柯达向宝丽来赔偿9.094亿美元。① 柯达被迫从市场上收回自己的快速成像胶片和相机。虽然宝丽来重新夺回了快速成像市场的垄断地位,却面临便携式摄影机以及只要1小时就能冲印普通胶卷的微型实验室的竞争而不得不步步退让。早已破釜沉舟的宝丽来终于开始意识到,自己陷人了一个下沉的岛屿,却没有办法逃跑。该公司果断改变经营哲学,尝试多元化经营,开始涉足录像胶片甚至普通胶片市场。 ① 宝丽来的股价实际上由于法庭宣布这一赔款数字而下跌,因为市场原本指望它能得到15亿美元赔偿。 人们没有必要按照字面意思当真烧毁桥梁或者连接各大洋的船只。人们可以通过采取一种可能惹恼某些选民的政治立场,从而象征性地切断自己的后路。沃尔特·蒙代尔在宣布接受民主党提名,成为该党1984年总统候选人的时候,曾经声称他一旦当选就会加税,这实际上就是立下了一个承诺。尽管信奉供方经济学的选民是无可挽回地失去了,却使蒙代尔的立场在那些支持加税减少赤字的选民看来更加可信。(对于蒙代尔来说)不幸的是,结果被惹恼的选民的数目实在太大了。 最后,建设而非烧毁桥梁也可能成为立下一个可信的承诺的办法。在1989年12月的东欧改革中,建桥意味着推倒隔离之墙。民主德国总理埃贡·克伦茨(Egon Krenz)面对大规模的示威抗议和移民潮,很想许诺改革,却又拿不出一个具体的计划。人民当然疑虑重重。凭什么他们应该相信改革的含糊许诺确实发自内心,并且影响深远?即便克伦茨真心支持改革,他也会失去人民的支持。拆除部分柏林墙有助于民主德国政府立下一个可信的立志改革的承诺,而不必提供什么具体细节。通过(重新)开放这一通向西方的桥梁,政府迫使自己一定要改革,否则就要冒人民大规模逃亡的风险。既然人们以后仍然可以逃亡国外,政府的改革许诺就会显得既可信,又值得等待。反正两德统一不到一年时间就要实现了。 让后果超出你的控制 在影片《奇爱博士》里,那台“末日毁灭机”是由埋藏在地下的巨大的原子弹组成的,一旦引爆就会释放巨量辐射,足以消灭地球上的所有生物。一旦苏联遭到入侵,这台机器就会自动引爆。当美国总统米尔顿·莫弗利(Milton* Muffley )询问这么一个自动引爆开关究竟有没有可能制造出来时,奇爱博士答道:“不仅有可能,而且不可缺少。” 这台机器是一个绝妙的阻吓手段,它会使一切入侵变成自杀。①本来,假如苏联遇到美国入侵,其总理迪米特里·基索夫(Dimitri Kissov) 很有可能犹豫,不愿意实施报复或者冒同归于尽的风险。只要苏联总理还有不作反应的自由,美国就有可能冒险发动进攻。现在有了这台“末日毁灭机”,苏联的反应将由这台机器自动做出,其阻吓的威胁也就变得可信了。 *影片中为Merkin,但原文如此。——译者注 ①显然,赫鲁晓夫曾经打算使用这种策略,他威胁说苏联的导弹会在柏林发生武装冲突的时候自动发射。参见Tom Schelling的Arms and Influence, p.39。 不过,这一策略并非毫无代价。比如,很有可能发生一个小事故或者未经政府授权的小规模人侵,而苏联人其实也不愿实施报复,但他们毫无选择,因为采取行动的权力已经不在他们的手里。这也正是《奇爱博士》里发生的事情。 要想减小出错的后果,你一定希望找到一个刚好足够阻吓对手而又不会过火的威胁。假如行动不可分割,比如一场核爆炸,你该怎么办?你可以使你的威胁变得缓和一点,办法是创造一种风险,而不是一种确定性,表明可怕的事情有可能发生。这就是托马斯·谢林的边缘政策想法。在其著作《冲突策略》里,他有这样的解释: 边缘政策是…… 故意创造一种可以辨认的风险,一种人们不能完全控制的风险。这一策略在于有意将形势变得多少有点难以把握,其原因只是这种难以把握的形势在对方看来可能难以承受,因而被迫忍耐下来。这等于将敌人置于一个双方共担的风险之下对他进行干拢和威胁,又相当于是告诉他,假如他采取敌对行动,我们可能大为不安,以至于不管我们是不是愿意,我们都会越过边缘界线,采取行动与他同归于尽,从而对他进行阻吓。[l4] 运用边缘政策成了美国核阻吓政策的基础。冷战期间,美国没有必要保证在苏联入侵欧洲的时候实施核报复。哪怕爆发核战争的可能性只有那么一点点,比如10% ,已经足以阻吓苏联不要轻举妄动。10%的可能性意味着十分之一的威胁,结果是只要一个相当微小的承诺就能建立可信度。即便苏联人不相信美国一定会报复,他们却没办法确定美国是不是一定不会报复。苏联因进攻而启动一个愈演愈烈的循环,最终闹得不可收拾的可能性总是存在。 这一简短介绍并不足以解释边缘政策。为了更好地认识边缘政策后面隐含的可能的威胁这一概念,我们将先在第7章阐明混合策略的作用,而在接下来的第8章,则会给边缘政策留出应有的篇幅予以充分解释。 小步前进 信任对方有时候意味着要冒很大的风险,在这种情况下,双方未必愿意互相信任对方。不过,假如承诺的问题可以减小到一个足够小的范围,那么,可信度的问题就能自动解决。威胁或许诺可以分解为许多小问题,每一个问题可单独解决。 假如江洋大盗每次只要信任对方一点点,相互之间的信誉就能继续存在。考察下面两种情况的区别:一是一次性用100万美元向另一个人购买1公斤可卡因,二是做同样数量的买卖,但分为1000次进行交易,每次交易不超过1000美元价值的可卡因。前一种情况可能使你觉得,假如可以赚取100万美元,那么,艇而走险欺骗你的“同伴”也是值得的,但在后一种情况下,欺骗你的“同伴”只能得到区区1000美元,显然不足以弥补由此导致的破坏一种有利可图关系的损失。 若是大的承诺不可行,我们应该选择一个小的承诺,并经常重复使用。住宅的主人与承建商之间相互怀疑。房主担心提前付款只会换来对方偷工减料或者粗制滥造。而承建商则担心一旦工程竣工,房主可能拒绝付款。因此,承建商是在每天(或者每周)结束之际按照工程进度领取报酬。双方面临的最大损失不过是一天(或者一周)的劳动而已。 就像边缘政策一样,小步前进缩小了威胁或许诺的规模,相应地缩小了承诺的规模。只有一点需要特别小心:深谙策略思维者懂得瞻前顾后,他们最担心最后一步。假如你预计自己会在最后一轮遭到欺骗,你应该提前一轮中止这一关系。不过,这么一来,倒数第二轮就会变成最后一轮,你还是没法摆脱上当受骗的问题。要想避免信任瓦解,千万不能出现任何确定无疑的最后一轮。只要仍然存在继续合作的机会,欺骗就不可取。因此,假如有一个可疑的家伙对你说,这是他在退休之前的最后一笔交易,你可得打起十二万分精神。 团队合作 其他人常常可以帮助我们立下可信的承诺。虽然每个人在独立行事的时候都有可能显得弱不禁风,但是大家团结起来就可以形成坚定的意志。成功运用同伴压力而立下承诺的著名例子来自匿名戒酒组织(Alcoholics Anonymous,AA)(以及节食减肥中心)。AA采用的办法改变了反悔食言的后果。它建立了一个社会组织,谁要是反悔食言,荣誉和自尊就会付诸东流。 有时候,团队合作可以超出社会压力的范畴,通过运用一个强有力的策略,迫使我们遵守自己的许诺。考察一支行进中的军队的前锋部队,它遇到的问题是,假如其他人全都勇往直前,那么,某个士兵只要稍稍落后一点就能大大增加他保住小命的机会,同时又不会显著降低部队进攻得手的可能性。但是,假如每一个士兵都这么想,那么进攻就会变成撤退。 这样的事情当然不会发生。这是因为,士兵早就受过训练,要为祖国增光、对同胞忠诚,并且相信一个严重到足以将他遣送回家、不能继续参与行动,却又没有严重到永远不能复原的创伤才是千金难买的光荣。[l5]对于那些缺乏意志与勇气的士兵,可以通过惩罚临阵脱逃者来激发他们的斗志。假如临阵脱逃终将遭受惩罚,并且意味着是一种无耻的死亡,那么,选择勇往直前就会显得更具吸引力。可惜,士兵们没有兴趣杀死自己的同胞,哪怕对方临阵脱逃。假如士兵们已经觉得立下一个进攻敌人的承诺相当困难,他们又怎能立下一个可信的承诺,杀死临阵脱逃的同胞呢? 古罗马军队曾对进攻当中的落后者判处死刑。按照这个规定,军队排成直线向前推进的时候,任何士兵,只要发现自己身边的士兵开始落后,就要立即处死这个临阵脱逃者。为使这个规定显得可信,未能处死临阵脱逃者的士兵同样会被判处死刑。这么一来,哪怕一个士兵本来宁可向前冲锋陷阵,也不愿意回头捉拿一个临阵脱逃者,现在他也不得不那么做,否则就有可能赔上自己的性命。① 罗马军队这一策略的精神直到今天仍然存在于西点军校的荣誉准则之中。该校的考试无人监考,作弊属于重大过失,作弊者会被立即开除。不过,由于学生们不愿意“告发”自己的同学,学校规定,发现作弊而未能及时告发同样违反荣誉准则。这一违规行为同样会导致开除。一旦发现有人违反荣誉准则,学生们就会举报,因为他们不想由于自己保持缄默而成为同样违规的同伙。与此相仿,刑法也将未能举报罪行者作为罪犯同谋予以处罚。 受托谈判代理人 假如一名工人声称自己不能接受任何低于5%的工资涨幅,凭什么老板应该相信他一定不肯退让而接受4%的工资涨幅呢?摆在桌面上的银子完全可以引诱人们回头再作一次谈判。 如果这名工人有别人代为谈判,他的地位就会有所改善。工会领袖担任谈判者的时候,其地位可能不够灵活。他可能被迫坚守自己的许诺,否则就会失去工会会员的支持。这名工会领袖要么从其会员那里得到一份有条件的委托,要么公开宣布自己的强硬立场而使自己的声望面临考验。实际上,工会领袖变成了一个受托谈判代理人。他作为一个谈判者的权威建立在他的地位之上。有时候他根本无权妥协,批准合同的必须是工人们,而非这名工会领袖。有时候,这名工会领袖若是作出妥协,可能导致他下台走人。 ① 假如临阵脱逃者得到授权,可以杀死那些站在他的身边却未能及时惩罚他的士兵,那么,惩罚临阵脱逃者的动机就会变得更加强烈。这么一来,假如一个士兵未能及时杀死一名临阵脱逃者,就有两个人有权对他实施惩罚:站在他身边的士兵以及临阵脱逃者,后者可以通过惩罚未能惩罚自己的士兵捡回一条小命。 在实践中,我们不仅关注承诺实现后的结果,同样关注其实现方法。假如一名工会领袖自愿用其声望换取某种地位,你应不应该(会不会)把他的这种屈辱行为当做受到外界压力而不得已为之的行为对待呢?将自己绑在铁轨上企图阻止列车前进的人,他能得到的同情可能比不上并非出于自愿而被别人绑在铁轨上的人得到的同情。 第二种受托谈判代理人是机器。没有多少人会跟一台自动售货机讨论价格问题;讨价还价成功者更是寥寥无几。① ① 据美国国防部统计,过去5 年中有7名军人或军人家属由于摇晃自动售货机,希望它吐出饮料或硬币,结果被倒塌下来的自动售货机砸死,另有39人由于同样的行为而受伤。——The International Herald Tribune,June 15,1988。 这就结束了我们关于建立成功承诺的八种方法的讨论。在实践中,任何特殊情况都有可能需要不止一种方法。以下是两个例子。 2 .只有一次生命可以献给你的祖国 怎样才能使敌人相信,你的士兵一旦听到召唤就会毫不犹豫地为祖国献身?假如战场上的每一个士兵都会对献身之举的得失进行一番理性的考虑,那么,世界上大多数军队早就完蛋了。我们必须找到其他办法,其中包括上面说过的许多例子中的办法。我们已经提到破釜沉舟的策略,以及在阻止临阵脱逃行为的过程里惩罚与团队合作所起的作用。现在我们集中讨论激励单个士兵的办法。 这个过程从新兵训练营开始。世界各地的武装部队的基本训练其实都是一次伤痕累累的历程。新兵遭到虐待、羞辱,同时面临巨大的体力与精神压力,这些压力如此巨大,以至于要不了几个星期,他的个性就会发生改变。在这一历程当中学会的一个重要习惯是自动自觉而不问是非地服从。为什么袜子必须叠好或者床铺必须整理,而且要按照一个特定方式完成,完全没有理由可言,惟一理由就是军官下了这样的命令。这么做的目的是,将来听到更加重要的命令时,士兵也会照样服从。一旦训练出不问是非的士兵,这支军队就会变成一台战斗机器;承诺就会自动形成。 这么一来,每一个士兵似乎都缺乏理性的表面现象就能会聚成一种策略的理性。莎士比亚深明此道。在阿金库尔(Agincourt)战役打响的前夜,亨利五世(Henry V)这样祈祷: 噢,战神!请让我的士兵之心坚硬如钢; 使他们不再恐惧;现在就拿走他们 思量的本领,假如敌人的数量 使他们心惊胆战… … (斜体为笔者所加) 接下来是将自豪感灌输到每一个士兵的头脑中去:为祖国自豪,为当兵而自豪,还有,可能是最重要的一点,为自己所在部队的传统而自豪。美国海军陆战队、英国军队的著名军团以及法国外籍军团就是这一做法的范例。部队在过去的重大战役中做出的重大贡献代代相传;英勇献身的事迹人人传颂。部队之所以不断重复自己的历史,目的就是让新兵对这一传统产生一种自豪感,下定决心在相似的重要关头无所畏惧,勇往直前。 部队指挥官同样需要对他的士兵有一种更加个人化的自豪感。按照莎士比亚的说法,亨利五世在哈佛洛尔(Harfleur)这样激励他的部队:“不要让你们的母亲蒙羞;现在就向你们称为父亲的人证明他没有白生了你。”自豪感通常是一种精英主义情感;它表现为从事大多数人做不到的事情或拥有大多数人不具备的东西。这么一来,我们再次听见亨利五世在阿金库尔战役爆发之前对他的部队发表讲话: 我们虽然人数很少,却是快乐的少数,我们情同手足; 因为今天跟我一起浴血奋战者 就是我的兄弟… … 此刻躺在床上的英格兰绅士们 会感到自己受到诅咒,所以不能赶到这里 而且他们也会感到英雄气短,一旦听见别人说起 在圣克里斯平(Saint Crispin)的日子与我们并肩作战。 要实现承诺还可以把团队合作、签订合同以及破釜沉舟的方法混合起来运用。让我们再次回到莎士比亚笔下的亨利五世在阿金库尔战役爆发之前的讲话: 那些无心打仗者, 请他离开;他的通行证应该签发, 连同其护送的王冠,一起放进他的背包; 我们不会在他的陪伴下死去 他却要担心他的情谊随我们而亡。 当然,没有人愿意公开接受这一临阵豁免的提议,因为这么做实在太丢人了。不过,即便如此,这些士兵通过拒绝这一提议,在心理上已经破釜沉舟,切断了回家的退路。他们已经签订了一份毫无疑问的合同,宣布谁也不能苟且偷生。亨利五世非常清楚应该怎样激励他的部队以及怎样将他们投入到战役中去,而他的远见卓识换来了战场上的胜利,虽然当时他的士兵数量远远少于敌人的数量。 3 .你难以拒绝的提议 我们听见“一个你难以拒绝的提议”的机会不仅仅限于影片《教父》中。只要稍作变化,我们就会发现,这种机会经常出现,其出现的频率令人吃惊。 我们的朋友拉里(Larry)参加过一次求职面试。整个过程看上去相当成功。接近尾声的时候,他听见对方问道,在他打算求职的公司当中,这一家排在第几位。在回答之前,他被告知该公司只录取将其排在第一位的求职者。假如该公司是他的第一选择,该公司人员希望他在得到该公司安排的某个职位之前就答应接受这个职位。① 遇到这么一个“你难以拒绝的提议”(这是因为,假如你拒绝,他们就不会给你安排一个职位),拉里应该怎么办? ① 对于初级职位,各大公司确定的起薪标准其实非常接近。因此,他可以在公司提出一个职位之前预计自己将会得到什么。 借助博弈论如X射线一般精准的洞察力,我们可以窥破个中奥妙。该公司宣称它只会雇用那些将它排在第一位的求职者。不过,这一压力策略产生的效果与其宣称的说法恰恰相反。假如该公司真的想雇用将它排在第一位的求职者,那么,它就不应该把能不能给予一个职位与求职者将它排在第几位挂起钩来。假如在一场面试结束之际,该公司确实成为拉里的首选,那么它就可以指望拉里会接受它安排的职位。没有一家公司需要担心一个最想在它那里工作的求职者会拒绝它安排的职位。另一方面,假如该公司是拉里的第二选择,但拉里的首选公司尚未提供任何职位,那么,他大约还是会愿意接受第二选择的公司提供的职位,以免最后一无所获。假如该公司声称自己只会雇用那些首先接受它安排的职位的求职者,其效果等同于雇用那些实际上没有把它排在第一位的求职者。 更加符合实际的情况以及该公司的真实意思是:“我们希望你可以为我们工作。假如你把我们排在第一位,我们知道我们一定可以得到你。不过,假如你把我们排在第二位,我们就可能失去你。为了在你没把我们当成首选的情况下也能得到你,我们希望你预先同意接受我们的职位提议,否则你什么也得不到。”认识到了这一点,我们就会发现,这不像是一个可信的威胁。该公司如此希望雇用拉里,以至于不论拉里把它排在第几位,它也要得到他。与此同时,它却宣称,若是拉里拒绝预先接受它安排的职位而只愿以后再接受这个职位,它就不会再给他职位。这种情况是可能的,却不大会发生。 我们的朋友拉里解释说,他刚刚开始找工作,手头资料太少,没法排出一个先后次序。该公司人员提醒他说,除非他预先接受这个职位,否则他们不会给他安排任何职位。面试是在星期三进行的,他走的时候没有得到任何职位。星期五,他从他的电话录音里得到了一个职位。到了下星期一,又来了一个口信,重申了这个职位。星期三,来了一封电报,其中还提到只要签约就能得到一笔奖金。面对一个你很想雇用的人,你想立下一个可信的承诺,说你不会给他安排一个职位,其实是很困难的。 该公司若想使其威胁变得更加可信,应该怎样做?这里,团队合作大有帮助,不过我们说的不是通常意义上的团队合作。假如存在几个有权决定雇用与否的人,那么,你若是没能立即接受他们提出的职位,原来同意选你的联盟就有可能破裂,转而青睐另一个求职者。正如我们将在关于投票的第10章看到的那样,候选人的先后次序可能影响最终决定。这么一来,一个委员会的决定就有很大的偶然性,因为它不能许诺,若是条件相同,得出的结果也会一样。正是委员会不能确保自己“理性”决策的事实,使这个“接受或者放弃”的威胁显得可信。 一个现在有效而将来未必继续有效的提议,可以阻止人们在买东西的时候到处比较。立体声音响商店和汽车经纪人用这一策略取得了很好的效果。不过,这些销售员怎样才能使自己的威胁,即一定会在明天拒绝一个他们今天愿意接受的价码变得可信呢?答案在于销售量可能上升,现金流的问题可能缓解。就像他们喜欢挂在嘴边的,这是千载难逢的好机会。 4 .案例分析之六:你会不会宁可向IBM 租一台电脑? 经过一场超过12年的漫长战斗,美国政府对IBM一案成了反托拉斯法一颗拔不掉的眼中钉。其中一个议题是围绕IBM出租而非出售其大型计算机的政策展开的。 美国政府认为,IBM把重心放在短期租赁的做法设置了一道进入屏障,使其独享了垄断的好处。IBM辩解说这一做法完全是为消费者利益着想。它认为,签订一份短期租赁合同后,消费者就不必担心自己使用的机器可能过时,从而享有灵活性,并且可以在有需要的时候改变合同,同时还可在合同中规定由IBM负责保养出租的机器(因为它负责确保出租的机器正常运转),而这家财力雄厚的公司还提供贷款融资服务。[16] 许多人认为这番辩护相当令人信服。不过,租赁做法还有一个策略优势,双方似乎都没有注意到。假如IBM对其大型计算机只是出售而绝不出租,你认为大型计算机的价格会有怎样的变化? 案例讨论 即便是一个没有外部对手的公司,也不得不担心怎样跟以后的自己竞争。每次推出一款新的计算机,IBM都能以非常高的价格把首批产品卖给那些迫不及待想尝试最新技术成果的消费者。一旦这款计算机的大批量生产可行,就会出现一种诱惑,促使公司降价,从而吸引更多消费者。生产这款计算机的主要成本在开发阶段已经发生了,此后每多卖一台,其所得基本上就是利润。 这里有一个问题:假如消费者估计IBM差不多要降价了,他们就会稍等一下再购买。一旦大多数消费者都在观望,IBM就有动机加速减价进程,希望早日俘获消费者。这个想法首先是由芝加哥大学法学教授罗纳德·科斯(Ronald Coase)提出的。他认为,对于耐用产品,一个垄断者实际上是在跟以后的自己竞争,从而使市场变得富有竞争性。[l7] 租赁做法作为一个承诺机制,使IBM得以维持较高的价格。租赁合同使IBM的降价成本大大增加。一旦它的机器短期出租,任何一次降价就都要告知全体消费者,而不仅仅限于那些尚未购买其机器的消费者。从现有消费者群体损失的收入,可能超过新的租赁合同带来的收入。相反,假如现有消费者群体拥有IBM的机器,这个结果就不会出现,因为已经花大价钱买下这台机器的消费者不会得到现金返还。 这么一来,租赁做法变成一个小步前进的例子。前进的步幅等于租赁时间。租赁时间越短,步幅也越短。假如步幅太大,消费者就不相信IBM会把价格维持在较高水平;他们会等待降价,等一段时间就能以较低价格购买同样的机器。不过,假如IBM只在短期可续约租赁合同的基础上出租它的机器,它就能以相当可信的方式将价格维持在较高的水平,这时,消费者没有理由观望,IBM就能赚取较高的利润。 作为大学教授和作者,我们在教科书市场上也遇到了同样的问题。假如承诺有可能存在,出版商一定会通过每五年推出一部新版教科书的方式提高利润,而不是沿用现在通行的三年周期。周期越长,这部教科书在二手教科书市场上的价值就越高,相应地,新版推出之际学生的购买积极性也会越高。问题在于,一旦出现二手教科书,出版商就有很强的动机想通过推出新版削弱二手教科书的竞争。由于人人都知道这样的事情一定会发生,因此,学生们可以用较低的价格买到二手教科书,因而也就不那么愿意花钱购买新版了。出版商的解决办法与IBM的解决办法一样:应该出租教科书,而不是出售教科书。 第7章不可预测性 1986年的全国棒球联赛冠军争夺战在纽约大都会队与休斯敦星象队之间展开,依靠击球手莱恩·戴克斯特拉(Len Dykstra)在第九局面对投手戴夫·史密斯(Dave Smith)的第二投击出的一个本垒打,纽约大都会队赢得了关键的一仗。赛后,两位球员都被问到究竟发生了什么事。[1]戴克斯特拉说:“他在第一投投了一个快球,我击球出界。当时我有一种奇怪的想法,觉得他接下来会投一个下坠球*,他确实那样做了。这个球的路线我看得非常准确,我的出手也非常准确。”而史密斯的说法则是:“只能归结为一点,即这是一个糟糕的投球选择。”换言之,他也认为戴克斯特拉可能猜到,因为第一投是一个快球,接下来史密斯可能改变投球速度。“如果我再投一次会怎么样?当然是(又)一个快球。” *用中指与无名指夹住而投出的球,通常会在飞行过程中急速下坠。——译者注 假如日后出现同样的情形,史密斯是不是应该采取再投一个快球的策略呢?当然不是。击球手可以看穿史密斯这一层次的思考方式,早就等着迎接一个快球。这个时候,史密斯应该转向另一个层次的思考方式,投出一个下坠球。击球手可以看穿并利用投手的一切有规则的思考与行动方式,反过来也一样。对双方而言,惟一合理的行动方针是力求做到不可预测。① 遇到这些情况,策略思维的一个经典错误在于,认为只要将自己摆在对手的位置,就能预测对手的行动。在戴维·哈伯斯塔姆(David Halberstam)的著作《1949年夏天》(The Summer of' 49)里,当作者描述17岁的特德· 威廉斯(Ted Williams)初次体会策略思维的重要意义的时候,我们就看到这样的错误。[2] 和其他许多年轻球员一样,威廉斯也对变化球感到一筹莫展。他一直应付不来。有一次,一名投手用一个曲线球使他出局。威廉斯对自己的表现极为恼火,一路小跑回到外场休息区自己的座位上。圣迭戈的一名投手曾是大联盟球员,他向威廉斯大喊了一声:“嘿,小伙子,他究竟是怎么把你打出去的?" “一个该死的慢曲线球。”威廉斯答道。“你能不能击中他的快球?”投手问。“没问题。”威廉斯答道。“你觉得下一次他会怎样对付你?”投手问。出现了一个短暂的沉默。特德·威廉斯从没想过应该怎样对付他自己——那是投手们思考的问题。“一个曲线球。”他答道。“嘿,小伙子,”投手说,“为什么你不回到场边等待下一次机会呢?”威廉斯照办了,结果击出了一个漂亮的本垒打。由此展开了一项针对投手思维的长达25年的研究。 显然,这个投手没有认识到不可预测的必要性,当然,威廉斯也没有认识到,这是因为,假如威廉斯想过应该怎样向自己投球,他就不会在他意识到自己早有准备的时候仍然投出一个曲线球!本章将阐述在双方都想压倒对方的时候会出现什么情况。即便你的猜测不能始终正确,至少也可以看出其中的概率。 ① 要想做到不可预测,投手必须随机选择一系列精确的投球。他不能投出不精确的球。一个不精确的投手当然不可预测,因为他自己都不晓得球会飞向何处。若是缺少精确性,投手就没办法决定什么时候应该投什么类型的球,以及不同类型的球应该保持怎样的相对频率。精确而不可预测的投球的一个绝妙例子是不旋转球。由于这种球几乎不会旋转,球面上的缝合线会在空中飞行过程中引发相当突然的路线变化,结果没有人可以很有把握地预测它的落点。不过,话又说回来,没有几个投手可以投出好的不旋转球。 正确估计并回应不可预测性不仅在棒球场上非常有用,在其他领域也是一样。只要一方喜欢准确地预料将发生的事情,而另一方却竭力避免被预测,不可预测性就会变成策略的一个关键因素。美国国税局想要审查那些逃税者,而逃税者竭力想避免遭到审查。在孩子们中间,大孩子通常不喜欢小孩子当自己的“跟屁虫”,小孩子却喜欢跟在大孩子后面。入侵的军队想方设法企图选出一个绝妙的攻击点,发动一场出其不意的袭击,守军则想方设法企图确定进攻发生的地点,并在那里布下重兵,严阵以待。 在夜总会、饭店、服装和艺术方面的引领时尚者希望保持与众不同的地位,普通大众却期盼能跟他们呆在一起。最终,所谓“人时”的场所会被发现。不过,到了那时,明星们早就有了新的聚会处。这有助于解释夜总会的生命周期为什么这样短暂。一家夜总会一旦取得成功,就会引来无数好奇的捧场客。这会把引领时尚者赶跑,使他们不得不另找一个新的消遣去处。正如约吉·贝拉*(Yogi Berra)所说:“那地方实在太挤了,谁也不想去。” *美国著名棒球选手兼球队经理。——译者注 尽管棒球投手的投球选择或者国税局确定谁该接受审核也许不可预测,却还是有一些规则可以指导这类选择。一定数量的不可预测性不应该完全听天由命。实际上,选择投这种球而非那种球的概率,或者选择这人而非那人进行审核的概率,可以通过整个博弈的细节精确地确定下来。“虽然这实在疯狂,却也不是毫无办法。”下面我们就来解释这个办法。 1 .怎样使输赢机会相等? 你们当中有许多人一定还记得小学时玩过的一个游戏,叫做“一、二、三射击”或者“手指配对”。在这个比赛中,其中一个选手选择“偶数”,另外一个选手则得到“奇数”。数到三的时候,两个选手必须同时伸出一个或者两个手指。假如手指的总数是偶数,就算“偶数”选手赢;假如手指的总数是奇数,就算“奇数”选手赢。假设输者给赢者1美元。我们可以通过计算得出与策略选择相关的输赢图表(如图7-1 所示)。 图7-1 偶数者和奇数者的得益 假如两位选手的行动不是随机的,这个博弈就没有均衡点。设想一下,假如“奇数”选手一定出一个指头,“偶数”选手就一定会用一个指头奉陪到底。现在,逻辑开始逆转。既然“奇数”选手确信他的对手一定会出一个指头,他就会改出两个指头。这将使“偶数”选手转而报以两个指头。这么一来,“奇数”选手就会出一个指头。于是我们又回到了开始的地方,这种循环推理看来简直是没完没了。 检验随机性是不是必要的一个简单办法,是考察让对手在出招之前看到你的行动究竟有没有害处。假如随机性必不可少,先行者就会处于不利地位。设想一下,在“一、二、三射击”的游戏里,你若是先行会出现什么情况?你将永远是输家。 并非任何随机性都会奏效。假设“奇数”选手有75%的时间选择出一个指头,另外25%的时间选择出两个指头。那么,“偶数”选手若是一直选择出一个指头,就能在75%的时间取胜,平均每场游戏赢得0.75xl+0.25x(-1)=0.50 美元。类似地,“偶数”选手若是选择出两个指头,平均每场游戏就会输掉0.50 美元。因此,“偶数”选手会选择一直出一个指头。不过,“奇数”选手应该选择出两个指头,而不是前面提到的75:25 的混合策略。在双方不断揣摩对方策略的连续多轮的较量中,这种混合策略将会一败涂地。 换言之,随机性存在一种均衡模式,必须加以计算。在这个例子中,整个局面是如此对称,以至于各个选手的均衡混合策略应该都是50:50 。我们这就验证一下:假如“奇数”选手出一个指头和两个指头的机会是各一半,那么,“偶数”选手无论选择出一个还是两个指头,平均每场游戏将会赢得0.50xl+0.50x(-1)=0美元。因此,假如他的策略也是50:50,那么他的平均所得就是0美元。同样的证明反过来也适用。因此,两个50:50混合策略对彼此都是最佳选择,它们合起来就是一个均衡。这一解决方案的名称叫做“混合策略”均衡,反映了个人随机混合自己的策略的必要性。 若是换了其他更一般的情况,这个均衡混合的对称性就不会显得如此明显,但仍有一些简单规则可以用来计算。我们以网球比赛为例子说明这些规则。 2 .有人要打网球吗? 网球的首要策略教训之一,就是不到最后一瞬不要选定一个方向。否则,对手可以利用对你的猜测,将球击向另一方。不过,哪怕你看不出对手的移动,预测一下也是大有好处的。假如发球者总是瞄准接球者的反手,接球者就会早有准备,开始向那个方向移动,从而可以更好地将球打回去。因此,发球者应该努力使自己的发球变得不可预测,不让接球者准确预计他的目标。相反,接球者启动的时候不能完全倾向于奔向这一方或者那一方。与手指配对游戏不同,网球选手不应该将不可预测性等同为输赢机会相等。参与者可以通过系统地偏向一边而改善自己的表现,只不过这样做的时候应该确保对方不能预见。 为了具体阐述这个问题,我们设想有这么一对具备特殊技巧的网球选手。接球者的正手稍微强一些。假如他的预计正确,他的正手回球有90%的机会获得成功,而反手回球的成功率只有60%。当然,假如他跑向一方而对方发出的球飞向另一方,那么,回球的质量就会大打折扣:假如他跑向反手一方,而对方发出的球飞向他的正手一方,他能及时转向而成功回球的概率只有30% ;反过来,他的成功率只有20%。我们可以用图7-2 显示上述情况。 发球者一心要使对方回球成功的概率越低越好;接球者的目标恰恰相反。比赛开始前,两位选手要选择自己的作战计划。他们各自的最佳策略是什么? 假如发球者永远瞄准对手的正手,接球者就会预计到球会朝自己的正手而来,从而有90%的概率回球成功。假如发球者永远瞄准对手的反手,接球者也能预计到球会朝自己的反手而来,从而有60%的概率回球成功。 图7-2 接球者成功回球的概率 发球者只有打乱自己的瞄准目标才能降低接球者回球成功的概率。这么一来,他会让接球者永远处于猜测之中,也就没有办法尽享准确预测的优势了。 假设发球者在每次发球前都会在自己的脑子里投掷一枚假想的硬币,根据硬币出现正面或者反面决定自己的发球应该瞄准对手的正手还是反手。现在我们考察接球者若是向正手方移动会出现什么情况。这一猜测准确的概率只有50%。猜测准确的时候,正手回球的成功概率是90% ;而猜测出错的时候,接球者及时转向而成功回球的概率只有20%。因此,他的整体成功概率是1/2*90% +1/2*20%=55 %。通过类似的计算可以知道,若是向反手方移动,他的整体成功概率是1/2*60%+1/2*30%=45%。 在发球者采取50:50 混合策略的前提下,接球者若是从自己的角度出发,就能选出最佳回应策略。他应该向正手方向移动,这么做,成功回球的概率达到55%。而在发球者看来,这个成绩与他永远将球发向一方得到的结果相比已经有所改善。对比一下,假如发球者永远将球发向一方,分别是接球者的正手方和反手方,那么,接球者的成功回球概率分别为90%和60%。 另一个显而易见的问题是,发球者的最佳混合策略是什么?要回答这个间题,我们可将不同的混合策略的结果列成一个图表(如图7 -3所示)。发球者瞄准对方正手方向的概率是一条从O 到100%的水平线。对于所有这些混合策略,图中有两条线,一条显示接球者准备向正手方移动的成功回球概率,另一条则显示他准备向反手方移动的成功回球概率。举个例子:假如接球者准备向正手方移动,概率为0的向正手发球的策略(即100%地向反手发球的策略)就能使接球者的成功回球概率维持在20%的低水平,而100%地向正手发球的策略则会使接球者的成功回球概率达到90%。接球者的成功回球概率从一端直线上升到另一端。 图7-3 两条直线交于一点,在这一点上发球者只有40%的时间将球发向对方正手方。在交点的左边,接球者若是预计对方会将球发向反手方,那么他的成功回球概率就会提高;而在右边,他若是预计对方会将球发向正手方,成功回球概率也会提高。① ① 注意,一旦发球者选择向接球者正手方向发球的概率超过40% (不是50% ) ,接球者如果将赌注押在正手方向,就能取得更好的成绩。哪怕发球者选择向接球者反手方向发球的概率还是较大,但他向两个方向发球的技巧却不相等。 向正手和向反手发球维持在40:60的混合策略,是惟一一个不会让接球者用上述方法占便宜的选择。只有选择这种混合策略,接球者无论选择防守正手还是反手,其成功回球概率都是一样的。两种情况都会留给接球者48%的成功回球概率。发球者若是采取其他任何一种混合策略,只要接球者善加利用,就能使自己的成功回球概率沿着图中的两条直线上升到交点之上,也就是超过48%。因此,40%的时间瞄准对方的正手就是发球者的最佳策略。 混合策略的确切比例是由基本行动配对而成的4种情况确定的。对于拥有不同的绝对优势和相对优势的选手,这里的数字90、60、30 和20会相应发生变化,而他们的最佳混合策略也会随之不同。我们很快就会发现,这样一些变化可能导致一些令人惊讶的结果。这里的关键在于,你必须通过估计你真正参加的博弈的4种基本情况,确定自己的最佳混合策略。 这里有一条捷径,使你不必画出前面提到的图表也可以计算出均衡策略。这个简单的算术方法归功于J.D.威廉斯。[3]回到基本情况的表格。对于发球者,如果选择瞄准对方正手的策略,就要观察对方选择两种不同的回应方式之一会使结果发生什么变化;我们得到90-30=60 。假设他瞄准对方反手发球,再做同样的计算,可得60-20=40 。将上述数字倒过来排列,就能得到最佳混合策略中采用这两种策略的概率。① 因此,发球者应该按照40:60的比例瞄准对方的正手和反手。 现在我们改从接球者的角度考察同一场比赛。图7-4显示了他的不同选择会有什么不同的结果。假如发球者瞄准他的反手,那么,他回 ① 我们可以用一点代数知识验证这个结果。假如纵列选手的得失情况如下图所示,左列对右列的均衡比例为(D-B):( A-C)。纵列选手选择左列的概率是p,那么,无论横行选手选择上或者下都没有关系;pA+(1-p)B=pC十1-P)D 意味着p /( 1-p )=(D-B )/(A-C) ,如前所述。由于横行选手的得失是纵列选手的得失的负数,他的均衡混合策略就是上行对下行,即(D-C):(A-B)。 球的时候向反手方移动就能得到60%的成功回球概率,而向正手方移动的成功回球概率只有20%。从O到100%改变向正手方移动的概率,就得到一条和上述两点相交的直线。与前面的分析类似,若是发球者瞄准对手的正手,我们就得到一条从30%上升到90%的直线。这两条直线交于一点,在这一点,接球者向正手方移动的概率为30% ,无论发球者选择瞄准哪一方,他的成功回球概率始终维持在48%。任何其他混合策略都会让发球者占便宜,使他得以选择更好的策略,将接球者的成功回球概率进一步降低到48%以下。 图7-4 接球手向正手移动的概率(% ) 此外,我们也可以采用威廉斯的方法。表格显示了接球者两种不同选择可能导致什么不同结果。若向正手方移动,我们得到90-20=70 ; 向反手方移动,我们得到60-30=30。将这两个数字倒过来排列就得到最佳混合策略的比例:30%的时间准备向正手方移动,70%的时间准备向反手方移动。 你可能已经注意到,从两位选手的不同角度计算最佳混合策略,会得到一个有趣的共同点:两次计算会得到同样的成功回球概率,即48%。接球者若采用自己的最佳混合策略,就能将发球者的成功概率拉低到发球者采用自己的最佳混合策略所能达到的成功概率。这并非巧合,而是两个选手的利益严格对立的所有博弈的一个共同点。这个结果称为最小最大定理,由前普林斯顿数学家约翰·冯·诺伊曼(John von Nrumann)与奥斯卡·摩根斯顿(Oscar Morgenstern)创立。这一定理指出,在零和博弈里,参与者的利益严格相反(一人所得等于另一人所失),每个参与者尽量使对手的最大收益最小化,而他的对手则努力使自己的最小收益最大化。他们这样做的时候,会出现一个令人惊讶的结果,即最大收益的最小值(最小最大收益)等于最小收益的最大值(最大最小收益)。双方都没办法改善自己的地位,因此这些策略形成这个博弈的一个均衡。 我们以网球比赛为例,并假设每个选手只有两种策略,以此证明这一定理。假如发球者想努力使接球者的最大成功率最小化,他应该在假设接球者已经正确预计到他的混合策略且会做出最优回应的基础上确定自己的行动。也就是说,接球者的成功率将是图7-5中两条直线的最大值。这个最大值的最小值出现在两条直线的相交处,该点的成功率为48%。 图7-5发球手攻正手的概率(% ) 现在我们从接球者的角度考察这个问题:他要努力使自己的最小收益最大化。如图7-6所示,假如接球者一半时间向正手方移动,一半时间向反手方移动,他的新的收益曲线就是原来两条直线的平均值,以点线显示。由于这条直线是向上延伸的,其最小值永远出现在左端,该点的成功率为40%。无论接球者向两方移动的比例是多少,这条直线一定经过成功率为48%的那一点,这是因为发球者可以选择采用40:60的混合策略。假如这条直线出现任何倾斜,那么,它的一端一定落在48%以下。只有在接球者的混合策略为30:70的时候,这条直线才会变成一条水平直线,最小值变成48%。因此,最大值的最小值等于最小值的最大值——48%。 图7-6发球手攻正手的概率(%) 最小——最大定理的普遍证明相当复杂,不过,其结论却很有用,应该记住。假如你想知道的只不过是一个选手之得或者另一个选手之失,你只要计算其中一个选手的最佳混合策略并得出结果就行了。 我们的其他工具,比如威廉斯的方法和上述图表,能够很好地解决一切只有两个选手参加且他们各有两个策略的零和博弈。不幸的是,这些工具并不适用于任何非零和博弈,也不适用于选手数目超过两个或者他们拥有的策略数目超过两个的零和博弈。经济学家和数学家发明了更加普遍的技巧,比如线性规划方法,可以找出最复杂的零和博弈的均衡策略。虽然这些技巧超出了本书的范围,我们还是可以利用其中得出的结果。 所有混合策略的均衡具有一个共同点:每个参与者并不在意自己在均衡点的任何具体策略。一旦有必要采取混合策略,找出你自己的均衡混合策略的途径就在于使别人对他们自己的具体行动无所谓。虽然这听上去像是一种倒退,其实不然,因为它正好符合零和博弈的随机化动机:你想阻止别人利用你的有规则的行为占你的便宜。假如他们确实倾向于采取某一种特别的行动,从你的角度观察,这只能表示他们选择了最糟糕的方针。 说到这里,我们已经解释了采取混合或者随机策略的好处,以及这么做的策略必要性。基本要点在于,运用偶然性防止别人利用你的有规则的行为占你的便宜。将这一原理用于实践则是一个更微妙的间题。下面五个部分可以看做是运用混合策略的迷你指南。 3 .为什么你应该选择正确的混合策略? 假如真能发现某个参与者打算采取一种行动方针,而这种行动方针并非其均衡随机混合策略,另一个参与者就可以利用这一点占他的便宜。在网球比赛的例子中,当发球者采取自己的均衡策略,按照40:60的比例选择攻击对方正手方和反手方时,接球者的成功率为48%。如果发球者采取其他比例,接球者的成功率就会上升。举个例子:假如发球者很傻,决定把所有的球都发向对方较弱的反手方,接球者由于早有预料,其成功率将会增至60%。一般来说,假如接球者认识发球者,确切了解他有什么癖好,他就能相应采取行动。不过,这么做永远存在一种危险,即发球者可能是一个更出色的策略家,好比台球桌旁的骗子,懂得在无关紧要的时候装出只会采用糟糕策略的傻样,引诱对方上当,然后在关键时刻发挥本色,打接球者一个措手不及。一旦接球者以为看穿了对方的惯用手法,而放弃自己的均衡混合策略,一心要占对方便宜,就会上发球者的当。发球者乍看起来很傻的混合策略可能只是一个陷阱。只有采取自己的均衡混合策略才能避免这一危险。 与正确的混合比例一样重要的是随机性的本质。假如发球者向接球者正手方发出4个球,然后转向反手方发出6个球,接着又向正手方发4个球,再向反手方发6个球,如此循环,确实可以达到正确的混合比例。不过,这是一种有规则的行为,接球者很快就能洞察其中奥妙。他可以相应做出正确的移动,成功率因此上升为(4/10)90%+(6/10)60%=72%。发球者若想取得最大效果,必须使每一次发球都不可预测。前面故事里提到的棒球选手戴克斯特拉与史密斯,似乎没意识到这个原则。 4 .为什么不能依赖对手的随机化? 假如一个参与者选择的是他的最佳混合策略,那么,无论对手采取什么样的策略,他的成功率都是一样的。假设你是网球比赛例子里的接球者,而发球者已经选择了他的最佳混合策略,即40:60的混合策略。那么,无论你向正手方还是反手方移动,又或是时而正手方,时而反手方,你的成功回球率都是48%。意识到这一点,你可能打算免掉计算自己的最佳混合策略的麻烦,只随便选定一种行动,并指望对手选择他的最佳混合策略。问题在于,除非你选择自己的最佳混合策略,否则你的对手就没有动机选择他自己的最佳混合策略。举个例子:假如你选择向正手方移动,他会转向攻击你的反手方。为什么你应该选择自己的最佳混合策略?理由就是迫使对方继续使用他的最佳混合策略。 5 .你的技巧变化了,你的最佳混合策略怎样变化? 假设接球者努力改进自己的反手回球技巧,反手方的成功回球率从60%上升为65%。我们可以相应修改用于计算他的最佳混合策略的图表。请看图7-7。我们注意到,接球者向正手方移动的比例从30%上升为33.3% ,而整体成功回球率也从48%上升为50%。 图7-7 接球手向正手移动的概率(% ) 随着接球者的技巧不断改进,他的成功率自然也会提高。不过,出人意料的是,这一提高了的成功率是由减少使用改进了的反手技巧取得的。在第1章的妙手传说中,我们说过这样的事情有可能发生;现在我们就来解释一下。 原因在于两位参与者的策略的相互影响。当接球者更善于反手回球,发球者就会多向他的正手方发球(向正手发球的比率达到43%, 而不是原来的40%)。为了适应这个变化,接球者也会多向正手方移动。反手技巧改进了,正手技巧的威力也因此释放出来。好比拉里·伯德的例子,随着他的左手投篮得分率上升,对方防守他的策略不得不发生同样的改变,结果反而给了他更多机会右手投篮。 同样的情况还有一个例子:假设接球者刻苦训练,提高自己的灵活性,从而他在向正手方移动后迅速转向接住反手球的准确度提高了。他对付反手球的成功率从20%上升为25%。和前面提到的情况一样,他向正手方移动的机会也从30%上升到31.6% (若用威廉斯的方法,向正手方和反手方移动的比例从原来的30:70上升为35:65)。接球者多向正手方移动的原因在于他在这边的技巧改善了。相应地,发球者将会减少攻击对方的反手方的次数,以此减少对方的得益。 6 .怎样随机行动? 假如有人告诉你,你应该以相等的比例随机投出下坠球和快球,你该怎么办?一个办法是从1到10中随机挑选出一个数字。假如这个数字是5或在5以下,你就投快球;假如这个数字是6或在6以上,你就投下坠球。当然了,这在简化你的问题的方向上只走了一步而已。你怎样才能从1到10的十个数字里随机挑选出一个呢? 我们从一个更简单的问题开始,即写下连续投掷一枚硬币可能得出的结果。假如这个序列的确是一个随机序列,谁要是打算猜测你究竟写的是正面还是反面,他猜中的机会艸TTP/1.1 200 OK Server: Huadun-Server/3.0 Content-Length: 336 Content-type: text/html /> -->