身边的博弈论：博弈论与信息经济学浅说-爱华网

目录

序言大博弈的思维观........................................................................................................................2

第一章什么是博弈论：从秦始皇统一天下谈起................................................................................5

1．秦始皇因何统一天下？................................................................................................................5

2．博弈是一种竞合游戏..................................................................................................................10

3．博弈论不是“万金油”..............................................................................................................13

第二章纳什均衡、纯策略与混和策略..............................................................................................16

1．从围棋定式谈纳什均衡..............................................................................................................16

2．从爱情故事谈起：优势策略与房地产开发博弈......................................................................20

3．房地产博弈、警察捉小偷博弈与纳什均衡..............................................................................23

4．位置博弈与商家策略..................................................................................................................27

5．猎鹿模型的合作哲学..................................................................................................................29

第三章 “囚徒困境”的启示..............................................................................................................33

1．“囚徒困境”的深刻哲理............................................................................................................33

2．经济自由与效率..........................................................................................................................36

3．“囚徒困境”的破解：无限次重复博弈与有限次重复博弈..................................................39

4．威胁、承诺、作弊与惩罚..........................................................................................................43

5．国家法律.....................................................................................................................................46

6．猴子的故事与道德约束..............................................................................................................49

7．爱克斯罗德试验、针锋相对的策略..........................................................................................52

8.合作、利他主义与爱克斯罗德试验的局限................................................................................55

第四章 “智猪博弈”：对诸多现象的解释........................................................................................58

1．“智猪博弈”的故事..................................................................................................................58

2“智猪博弈”与激励机制设计......................................................................................................62

3．企业战略与“智猪博弈”..........................................................................................................64

4．证券市场中的“智猪博弈”......................................................................................................67

第五章常见的博弈案例......................................................................................................................69

1．“斗鸡博弈”与“骑虎难下”..................................................................................................69

2．银行会垮掉吗？..........................................................................................................................73

3．如何以弱胜强？..........................................................................................................................76

4．公共地悲剧.................................................................................................................................80

5．少数人博弈与酒吧问题..............................................................................................................83

6．房地产市场的多人博弈..............................................................................................................87

第六章信息经济学基础......................................................................................................................90

1.信息有价.......................................................................................................................................90

2. 从形象工程谈道德风险..............................................................................................................95

3．逆向选择的困境：二手车市场为何建立不起来？..................................................................98

4.声誉、信号传递与制度设计......................................................................................................102

5．所罗门故事与信息甄别............................................................................................................106

第七章讨价还价的策略....................................................................................................................111

1．从情侣博弈谈起........................................................................................................................111

2．先发优势与后发优势................................................................................................................113

3．谈判的要诀:掌握对方心理与妥协..........................................................................................117

4．独裁者博弈与劳资谈判............................................................................................................119

第八章如何做好一个老板................................................................................................................122

1．管理需要建立预期....................................................................................................................122

2．奖罚分明...................................................................................................................................125

3．强强如何有效联合？................................................................................................................128

4．如何接到一个项目？................................................................................................................131

第九章民主的悲剧............................................................................................................................134

1.社会选择的形式..........................................................................................................................134

2.非排序式投票..............................................................................................................................137

3．孔多塞投票法则........................................................................................................................143

4．BORDA法则及其他......................................................................................................................146

5．投票操纵的方法：民主的悖论................................................................................................148

6．阿罗不可能定理........................................................................................................................153

参考文献：.........................................................................................................................................157

序言大博弈的思维观

对于许多非数学专业和经济学专业的人们来说，博弈论可能是一

个极为陌生的概念。但在国外，博弈论作为现代经济学的前沿领域，

已成为占据主流的基本分析工具。1994年诺贝尔经济学奖即授予三

位博弈论专家，1996年诺贝尔经济学奖又授予两位与博弈论一脉相

承的信息经济学的开拓者。

经济学的三次重大的“革命”，分别是“边际分析革命”、“凯恩

斯革命”与“博弈论革命”。博弈论与信息经济学的产生与发展引发

了一场深刻的经济学革命，博弈论与信息经济学代表着一种新概念、

新方法论、新分析方法和一种全新的思想。

经济学家凯恩斯1936年在《就业利息与货币通论》写过这样一

段深刻的话，“经济学家和政治哲学家的思想，不管是正确的还是错

误的，其力量之大，往往超出常人意料。事实上，统治这个世界的就

只是这些思想。许多实践家自以为绝不受任何知识的影响，却往往当

上了一些已故经济学家的奴隶。执政的狂人，自称听到了上帝的指示，

实际上却是从若干年前一些学术界劣等思想家那儿拾取了一些怪诞

的想法......比起思想的逐渐侵蚀力来，既得利益的势力被过分夸大

了。”

由此可见，博弈论的思想比任何技术性的分析都要重要。

实际上，博弈之道是古已有之，但博弈思想的系统化、数学化却

是近几十年的事。正是因为博弈科学是一门新学科，我国管理界、经

济界对博弈论与信息经济学的研究还是停留在引进介绍层面上，他们

发表的成果大多堆砌庞杂的数学算法与令人眩目的数学模型。虽然博

弈论与信息经济学在中国已是一门显学，但却逐渐变成阳春白雪、弃

之不用的高深学问或是概念混乱而被滥用到极至。

博弈论与信息经济学不仅仅能在学术领域中光彩夺目，在其它领

域如军事、管理、体育、政治、公关、个人生活中同样能得到充分利

用，甚至在生物学中都可以觅其踪迹。在普通的企业管理中，经营者

要熟练地掌握管理之术，必须能够自动自发并自觉地运用博弈论与信

息经济学。在日常生活中，人们可以博弈论与信息经济学得思想方法

赖分析甚而解决实际问题。正是因为如此，诺贝尔经济学奖获得者保

罗·萨缪尔逊（Paul Samuelson）说：“要想在现代社会做一个有文

化的人，你必须对博弈论有一个大致了解。”

笔者试图在这本小册子中用最浅显的语言描述博弈论与信息经

济学的大概思路方法，能用语言可以描述的就尽量少用或不用数学，

因此笔者未对博弈论与信息经济学作数学化、系统的证明与阐述。但

是，只有这样才能够使似乎高深的博弈论与信息经济学思想很轻松地

为普通读者所掌握，并能够让读者应用其思想方法来分析甚至是能够

解决身边的实际问题。

笔者这里还要解释一下书名的由来，“身边的博弈论”并不是说

读者身边看到感受到的博弈论，这样理解未免过于狭窄。这里“身边

的博弈论”的含义是，人们身边无处不在的博弈哲学，无论是直接感

受到还是从未接触过的社会、政治、法律、军事、经济、管理等现象。

由于笔者本人学识有限，对博弈论与信息经济学的理解与研究尚

不深刻，错误在所难免，敬请博弈论与信息经济学的方家高人指点，

以免贻误广大读者。

余治国2005年9月

谨识于安徽工业大学

第一章什么是博弈论：从秦始皇统一天下谈起

1．秦始皇因何统一天下？

2000多年前，雄才大略的秦始皇第一次统一了中国大地,并创建

了当时世界上最庞大的帝国，得以名垂青史。从当时的历史条件来看，

秦国虽然在商鞅变法之后实力大增，但其经济、政治、军事实力是远

远不能与六国总和相匹敌的。这种情况下，六国与秦国的形势就产生

了两种针锋相对的可能：其一，六国采用“合纵”政策对抗秦国，也

就是各国缔结军事盟约，共同抵御秦国的侵略，秦国若对任一国家发

动侵略，其它国家必须无条件出兵营救；其二，六国采用“连横”政

策与秦国妥协，也就是各国都与秦国签订友好互助条约，保持双边和

平关系。

当时七国之中，只有齐国实力比秦国稍逊一筹，成为六国军事同

盟的核心。一旦齐国放弃“合纵”政策，六国的军事同盟就土崩瓦解。

真实的历史也证明了这一点，秦国对六国联盟的破坏正是从齐国开始

的。

在这种情况下，秦国与齐国都有两种战略政策可以选择，那就是

“合纵”与“连横”。秦国如果默许六国“合纵”，齐国采用“合纵”

政策，结果是秦国势力扩张被遏制，而齐国成为六国领袖，势力得以

扩张。秦国采取“连横”政策，齐国仍然采取“合纵”政策，结果是

秦国与六国处于对峙状态。秦国默许六国“合纵”，齐国却采用“连

横”政策与秦国示好，结果是秦国没有吞并六国的野心自然无法一统

天下，齐国的势力也没有得以扩张。而历史的真相是，秦国采取“连

横”政策，齐国默许秦国的“连横”政策并与秦国建立友好外交关系，

齐国最终被灭，千古一帝秦始皇得以名扬千秋。

秦国与六国集团之间的争斗实质上就是一种博弈。秦国与齐国之

间的战略政策选择正是为了在保持自身能够生存的基础上谋取更大

的利益甚至是统一天下。有利益的争夺是博弈的目的，也是形成博弈

的基础。经济学的最基本的公设就是经济人或理性人的目的就是为了

收益最大化，参与博弈的博弈者正是为了自身收益的最大化而互相争

斗。参与博弈的各方形成相互竞争相互对抗的关系，以争得利益的多

少决定胜负，一定的外部条件又决定了竞争和对抗的具体形式，这就

形成了博弈。如象棋对局的参与者是以将对方的军为目标，战争的目

的是为了胜利，古罗马竞技场中角斗士在争夺两人中仅有的一个生存

权，企业经营的目的是为了生存发展，而股市中人们所争的很实在，

就是金钱。从经济学角度来看，有一种资源为人们所需要，而资源的

总量具有稀缺性或是有限的，这时就会发生竞争，竞争需要有一个具

体形式把大家拉在一起，一旦找到了这种形式就形成了博弈，竞争各

方之间就会走到一起开始一场博弈。《孙子兵法》上说，“知己知彼，

百战百胜。”，可见竞争对抗还有博弈各方拥有信息的特征。比如上

一个例子中，秦国与齐国都明白对方的策略，从博弈理论来说，更拗

口的说法是秦国知道齐国知道自己的策略，反之齐国亦然，这种句法

我们可以一直这么用下去，一直用到打“……”，而这正是博弈双方

所掌握的信息。

因此我们可以了解到，形成一个博弈有4个要素：

1．博弈要有2个或2个以上的参与者（Player）。在博弈中存在一个

必须的因素，那就是不是一个人在一个毫无干扰的真空作决策。比如，

前例中只有秦国，而没有与之对抗的六国，就不存在“合纵连横”的

博弈。从经济学的角度来看，如果是一个人做决策而不受到他人干扰

的话，那就是一个传统经济学或管理学中最经常研究的最优化问题，

也就是一个人或一个企业在一个既定的局面或情况下如何决策的问

题。最简单一个最优化的例子就是，吸烟伤肺，不吸烟却又伤心，烟

民是选择抽烟还是不抽烟，这就需要进行权衡（Tradeoff）。如果这个

烟民非单身贵族，而是有妻子或女友，这种情况下就很有可能形成一

个博弈。这也就是，博弈者的身边充斥着具有主观能动性的决策者，

他们的选择与其它博弈者的选择相互作用、相互影响。这种互动关系

自然会对博弈各方的思维和行动产生重要的影响，有时甚至直接影响

着其他参与者的决策结果。

在冯·诺依曼（Von Neumann）的博弈论奠基之作《博弈论与经

济行为》一书中举过这样一个经典的例子。在《鲁滨逊漂流记》中，

与世隔绝的“鲁滨逊”（Robinson Crusoe）一个人组成一个独立的经

济系统，有中学数学水平的人都能够清楚，这只是一个普通的求解最

大值的问题。因为鲁滨逊面对的是一些死的数据，而不是有主观意愿

的人。一旦“星期五”（《鲁滨逊漂流记》中鲁滨逊的黑人仆人）加入

这个系统，这个经济系统就形成了一个博弈问题。

2）博弈要有参与各方争夺的资源或收益（Resources或Payoff）。

资源指的不仅仅是自然资源，如矿山、石油、土地、水资源等，还包

括了各种社会资源，如人脉、信誉、学历、职位等。如果这些资源是

无限供给的，那么我们也不需要为共产主义而奋斗了，因为一步就可

以迈入“货恶其弃于地也，不必藏于已，力恶其不出于身也，不必为

已。”、“大道之行也,天下为公。”的大同社会。当然，不可否认是，

一方面，博弈者之间会发生冲突；另一方面，他们当中也包含着合作

的潜力。

笔者在这里还要强调一点是，资源是有主观性的。人们之所以会

参与博弈是受到利益的吸引，预期将来所获得利益的大小直接影响到

竞争博弈的吸引力和参与者的关注程度。经济学的效用理论可以用来

解释这个问题，凡是自己主观需要的就是资源，反之亦然。比如，“孩

子总是自己的好，妻子总是别人好”：自己的孩子在眼里是无价之宝，

而在别人面前相对是无价值的；即使是众人公认的美妻娇眷也会产生

审美疲劳，资源的价值不断下降，这正是效用递减规律起了作用。最

极端的例子大概就是明代小说《镜花缘》中所描绘的君子国，人人礼

让使得客观的资源就变得毫无价值，自然就不存在竞争与博弈。

3）参与者有自己能够选择的策略（Strategy）。所谓策略，就

是“计利以听，乃为之势，以佐其外。势者，因利而制权也。”，这

指的是直接实用的针对某一个具体问题所采取的应对方式。通俗的说

策略就是计策，是博弈参与者所能够选择的手段方法。比如秦国就采

用了“连横”的策略将六国“合纵”瓦解。

一般日常生活中，策略选择仅是解决问题的方法，并不牵涉到分

析关键因素、确定局势特征这些理论化的内容。而博弈论种的策略选

择，是先对局势和整体状况进行分析，确定局势特征，找出其中关键

因素，然后在最重要的目标上进行策略选择。由此可见，博弈论种的

策略是可以牵一发而动全身的，这直接对整个局势造成重大影响。

4）参与者拥有一定量的信息（Information）。比如在“合纵连

横”的故事中，秦国与六国之间所拥有的信息就是完全的。但有些时

候，信息并不是完全的，俗话说“天有不测风云”，比如今天是阴云

密布、狂风大作，气象台预报明天是“阴转小雨”，明天出门上班到

底要不要带伞呢？这种情况的信息是不完全的，人们决策的信息条件

是不确定。当然从情理上说，在实际生活中一般是要带伞以防不测。

通俗的说，博弈就是个人或组织在一定的环境条件与既定的规则

下，同时或先后，仅仅一次或是进行多次地选择策略并实施，从而得

到某种结果的过程。我们生活在这个世界上，就不可避免地要与他人

打交道，这是一个利益交换的过程，也就无可避免地要面对各种矛盾

和冲突。所谓博弈论听似拗牙聱齿，看似深不可测，但其思想极易理

解。简单说来博弈论就是研究，人们如何进行决策、以及这种决策的

如何达到均衡问题。每个博弈者在决定采取何种行动时，不但要根据

自身的利益和目的行事，还必须考虑到他的决策行为对其他人的可能

影响，以及其他人的反应行为的可能后果，通过选择最佳行动计划，

来寻求收益或效用的最大化。

2．博弈是一种竞合游戏

“博弈论”的英文是“Game Theory”，实际上Gme的本意是游戏，

博弈论直接翻译成中文最贴切的直译是“游戏理论”。更准确点说，

是一种竞合的智力游戏。

所谓竞合，就是竞争合作的简写，一个博弈，并不仅仅是竞争，

实际上竞争种包含着潜在合作的种子，合作中包含着潜在竞争的种

子。合作博弈并不是指合作各方具有合作的意向或态度，而是指在博

弈中有一些对博弈各方有约束力的协议或契约，或者说是博弈各方不

能公然“串通”或“共谋”。合作博弈最典型的例子就是石油输出国

组织欧佩克（Organization of Petroleum Exporting Countries，

简称Opec），其1960年9月，由伊朗、伊拉克、科威特、沙特阿拉

伯和委内瑞拉的代表在巴格达开会，决定联合起来共同对付西方石油

公司，维护石油收入。随着成员的增加，欧佩克发展成为亚洲、非洲

和拉丁美洲一些主要石油生产国的国际性石油组织。欧佩克协调和统

一各成员国的石油政策，并以石油生产配额制的手段来维护它们各自

和共同的利益,把国际石油价格稳定在公平合理的水平上。比如有些

时候为防止石油价格飚升，欧佩克可依据市场形势增加其石油产量；

为阻止石油价格下滑，欧佩克则可依据市场形势减少其石油产量。

智力游戏与博弈相近似的本质是，在确定游戏规则的约束下，游

戏参与者决策、行动的过程。各种智力游戏实际上就是一个实际社会、

经济、管理、军事、政治等现象抽象出来的缩微模拟的模型。在这个

意义上不妨说，博弈论就是研究怎么玩好游戏的理论。

游戏是一种抽象。面对复杂现象时，人们经常会“见树木不见森

林”，无法抓住某种现象的关键所在。而在游戏中，可以通过抽象出

现实生活中的要点，并将干扰因素减至最低，从而轻松地分析问题并

找到合理可行的解决方法。

中国最古老的围棋最初的功能形态就是模拟战争。围棋包含最多

的是军事内涵，如围而歼之，生死存亡为先，争地夺利为上。围棋以

获得最大的利益为胜，抽象出战争的本质和目的，非常符合战争规律。

围棋游戏的规则极其简单，不过是两气生，一气死，附加帖目、

打劫等辅助规则，最终以所占地盘大小定胜负。但其作为一项智力游

戏，与战争在很多方面都相通。围棋棋手在小小棋盘上较量，就是战

争、战场、战斗在棋盘上的演绎。

战争理念和战争指导思想是“基于毁伤”，以破坏、消耗、摧毁

敌方为上。现代西方国家提出“基于效果”的作战思想，美国人将这

一战争理念上的革命称为新的战争哲学。基于效果就是，着眼于敌方

整个作战系统的控制，使之丧失作战能力。美军在伊拉克发动“斩首

行动”的前一天，还专门召开了推出基于效果作战理念的新闻发布会，

接着就发动了进攻。

围棋模拟出“基于效果”的战争理念，强调从全局上控制，而不

是基于蝇头小利。即所有的作战方法都必须是有效的，着子要看在全

局中是否有用、有效,而不再是基于棋理、棋道、棋风等虚幻的在形

式。基于效果的思想就是赢棋第一，实事求是。比如韩国棋手李昌镐

就是基于效果的典范。

现在很多世界级公司都已经明白智力游戏的作用。比如著名的微

软公司在招聘员工时出过非常“儿童化”的招聘考题，题目是这样的：

“某合唱团的4名成员A、B、C、D往演出现场，他们途中要经过一座

小桥。当他们赶到桥头时，天已经黑了，周围没有灯。他们只有一只

手电筒。现在规定：一次最多只许两人一起过桥，过桥人手里必须有

手电筒，而且手电筒不能用扔的方式传递。4个人的步行速度都不同，

若两人同行，则以较慢者的速度为准。A需花1分钟过桥，B过桥需花2

分钟，C需花5分钟过桥，D需花10分钟过桥。请问：他们能在17分钟

内过桥吗？” 这可不是微软公司的别出心裁，据说世界上许多跻身

世界500强的公司在招收新员工时，都要出类似的智力题。

智力游戏可以锻炼人的思维能力，培养人的思维方法。良好的思

维方法能使我们从错综复杂的现象中找到事物的本质，从纷繁的因素

中找到事物变化的主要原因，使事物呈现出条理性。思维方法是抽象

的，它不像1＋1＝2那么简单，只有通过自己的想像，亲自动手操作，

经历失败，才能逐步形成。思维科学化程度越高的人，工作中发现问

题、解决问题的能力就越强。这一点已成为人们的共识。

在许多智力游戏中，都存在这么一个共同的特点，就是参与者所

选择的策略对于胜负有着举足轻重的影响。一个游戏一点规则制订好

之后，策略选择的好坏就成了游戏参加者所能自由运用的左右游戏结

果的最关键因素。特别是在围棋、象棋之类参与者的初始条件完全相

同的游戏中，策略选择就成了游戏结果的唯一决定因素。

至于从围棋初段段到九段之间的差别，从博弈论的角度去看，就

是他们之间策略选择的技巧高低不同而已。博弈论的策略思维是一种

技巧。策略思维从一些基本技巧出发，考虑的是怎样将这些基本技巧

最大限度地发挥出来。

任何游戏都有自己的规则（Rule of the game）。实际现实自然也

是如此，这就是法律、道德和各种成文或不成文的规章制度和惯例等。

当然，这些规则也不是一成不变的，它会随着情况的改变和人们的要

求不断修正，但是只要规则存在，这个规则就是确定了人们行为的前

提条件。因此博弈与游戏都有一个重要的共同特征，那就是这些规则

规定游戏参加者可以做什么，不可以作什么，按照什么次序去做，什

么时候结束游戏，一旦参与者犯规将受到怎样的处罚等。

游戏者的策略有相互依存的关系。每一个游戏者从游戏所得结果

的好坏不仅取决于自身的策略选择，同时也取决于其它参加者的策略

选择。有时甚至一个坏的策略会给选它的一方带来并不坏的结果，原

因是其它方选择了更坏的利他而不利己的策略。这一点也是游戏与博

弈重要的相似之处。

3．博弈论不是“万金油”

博弈论并不是“万金油”，正如诺贝尔经济学奖得主莱因哈德·泽

尔滕教授所说，“博弈论并不是疗法，也不是处方，它不能帮我们在

赌博中获胜，不能帮我们通过投机来致富，也不能帮我们在下棋或打

牌中赢对手。它不告诉你该付多少钱买东西，这是计算机或者字典的

任务。”

要求博弈论能够完全刻画真实的世界，那么这命中注定会徒劳无

功。根据著名的哥德尔不完备定理，任何一个理论体系必定是不完全

的，任何理论包含了既不能证明为真也不能证明为假的命题。对这个

世界的最好描述可能只有其本身，但是正如罗宾逊夫人的妙语“比例

尺是一比一的地图是没用的”。

博弈论也是这样，博弈论力图用最简单的假设下得到最大范围的

推理应用。博弈论的这种方法与很多应用广泛学科都是相似的。如欧

几里德几何的基本假设是两点之间直线，推演出庞大而严密的几何体

系，可以说，在生活中或工程应用中，欧几里德几何学的思想方法是

无处不在、无时不有。其基本公设之一就是，人是理性的（rational）。

所谓理性的人是指行动者具有推理能力，在具体策略选择时的目的是

使自己的利益最大化。而现实生活中，人们再做决策时往往是有限理

性。

所谓有限理性，也就是说人不是机器，人的理性是有限度的。比

方说，某人要签署一份合同，有三种方法可供选择：一种是计划好，

安排好一切，然后不动脑筋按部就班地照计划进行；另一种是做进度

安排的时候都留一点余地，可供签订合同双方私下协商解决：最后一

种是完全没有安排，凭着当时的感情与直觉任意为之，这种方法当然

不可能是理性的。

后两种一眼就可看出完全不满足博弈论意义上的理性，即使是第

一种方法也不是真正意义上的经济理性。这是因为人们很难对每个措

施将要产生的结果具有完全的了解和正确的预测，常常要在缺乏完全

了解的情况下，一定程度地根据主观意识进行决策，个人或企业的决

策都是在有限理性的条件下进行的。完全理性，意味着对每个抉择的

确切后果都有完完全全的了解。事实上，一个人对自己的行动条件的

了解，从来都只能是零碎的；至于使他得以从对当前状况的了解去推

想未来后果的那些规律和法则，他也是所知甚微的。

人类的精力和时间永远是有限的，人不可能具备完全理性，不可

能掌握所有知识和信息。人类也不可能搜寻到所需的全部的信息。另

一方面也要意识到信息的搜寻需要成本，而不是毫不费成本的，因为

人类必须为此付出大量的时间、精力和财力等等。意图搜寻到所有信

息，企图做出收益最优的决策行为有时反而是最不理性的行为。

但当我们退而求其次时，博弈论可以得到对现实的客观世界描述

的近似。所以博弈论仍然是我们目前所能得到的最好但非唯一的工

具。就像并不完美的力学是自然科学的哲学和数学一样，博弈论是社

会科学的力学和数学。没有牛顿力学我们连最简单的物理现象都无法

理解，马用了多大的力拉动一车货物？上帝说“让牛顿来做吧”，于

是我们知道了马用的力相当于克服摩擦力。同样的道理，没有博弈论

我们也无法解释分析很多现实的社会现象。

著名的博弈论大师鲁宾斯坦（Rubinstein）说过，“一个博弈模型

是我们关于现实的观念的近似，而不是现实的客观描述的近似”。看

来“理论之树是灰色的，生命之树常青！”这句话，我们应该谨记于

心。

第二章纳什均衡、纯策略与混和策略

1．从围棋定式谈纳什均衡

我们已经知道，博弈论的基本前提是，某人或某物的行为效果如

何，有赖于他人或他物的行为。由于世上人间的事物很少不依赖于其

他事物而存在。非合作博弈强调利益的冲突，即非合作甚至对抗状态。

比如，“零和博弈”就是典型的非合作博弈，它是指博弈各方的所得

之和为零，在特殊情况下如两人博弈时，一方所得与另一方所失相等。

从严格的数学角度来看，围棋19×19的361个交叉点就是围棋对弈者

所得的总和，因此围棋棋手非输即赢，可见围棋明显是数学意义上的

严格的零和博弈。

世事如棋局，而棋局是可以用博弈思维加以概括的。比如过分的

“骗着”，“本手”与“缓着”之间，一般都会选择本手，着法过分如

不遇反击，可能占到便宜，如遇反击则可能亏损，因此如果棋力相当，

则应考虑到对手的反击手段。对手也同样考虑到在追求利益中不可能

占尽便宜。这就导致双方都能接受的方案。

围棋定式从策略层面看，如一方的策略是抢占实地，另一方是获

得外势，而结果相当，互有所得，双方就愿意那样下。抢占实地考虑

现实利益，获得外势考虑将来发展，这便形成一个双方的“均衡”；

另一方面，可以从具体行棋效果来看，如果一步棋能考虑到对手各种

应手而依然成立，对手也运用同样法则找到应对，则可以说双方达成

了“均衡”。

在经济学中，均衡(equilibrium)意即相关量处于稳定值。比如在

经典的供需分析中，若某一商品的市场价格使得欲购买该商品的人均

能买到，同时想卖的人均能将商品卖出去，此时该商品的供求达到了

均衡。这个市场价格可称之为均衡价格，产量可称之为均衡产量。均

衡分析是经典经济学中的重要方法。

在讲解纳什均衡之前，我们再来看这样一个例子。一般对博弈论

稍微有些了解的人，都会知道“囚徒困境”这个名词。这个例子就是

在“囚徒困境”的基础上所作的修改。

A和B是两个因盗窃而被抓的惯犯。警察局局长C正在调查该

局管辖区域内的一宗悬而未决的银行抢劫案，并且他根据一系列的线

索判定A和B是这桩案子的凶犯。因为该局管辖地区治安一向混乱

不堪，C的上级对C非常恼火，直接威胁C如果银行案破不了，就

要撤销C局长的职位，给予降级惩罚。C在上级的压力下不得不耗费

大量时间、精力提审A和B。为了能够让两个囚犯认罪，C想让A

和B明白，假如只有他们其中的一人坦白认罪则这个人可能受到的

最严厉的惩罚是什么，但向他们遵守承诺，若两个人都坦白，则会从

轻发落。

于是，这个警察局长C分别与A、B立下许诺：如果只有一个人

坦白认罪，则认罪的一方会收到所有指控，会因银行抢劫而判无期徒

刑，另一个人则不会再加刑罚。如果无人认罪，两个人都会因盗窃罪

而判刑2年。如果两个人都坦白，则两个人都被判处有期徒刑5年。

这样，警察局长C给A和B构造了一个博弈。不妨假设，A和

B都是极其精明的会打小算盘的自私自利不讲“江湖义气”的人，同

时A和B被分别审查不能够进行沟通。在这种情况下，A会在脑子

里打小算盘，他会想：如果选择坦白，那么B选择坦白时将判刑5

年，B选择不坦白时将判刑20年，因此选择坦白时最坏的打算就把

牢底坐穿；若是选择不坦白，那么B选择坦白时将无罪释放获得自

由，B选择不坦白时将判有期徒刑5年，因此选择不坦白时最坏的可

能就是被囚禁5年。两害相权，取其轻。因此在这种情况下，A必然

会选择不坦白，同样的道理，B也会选择不坦白。这个时候，博弈达

到了这样一种局面，这种局面就是纳什均衡（Nash Equilibrium）。

纳什均衡的思想其实并不复杂，在博弈达到纳什均衡时，局中的

每一个博弈者都不可能因为单方面改变自己的策略而增加获益，于是

各方为了自己利益的最大化而选择了某中最优策略，并与其他对手达

成了某种暂时的平衡。这种平衡在外界环境没有变化的情况下，倘若

有关各方坚持原有的利益最大化原则并理性面对现实，那么这种平衡

状况就能够长期保持稳定。

再简单一点说，一策略组合中，所有的参与者面临这样的一种情

况：当其他人不改变策略时，他此时的策略是最好的。也就是说，此

时如果他改变策略，他的收益将会降低。在纳什均衡点上，每一个理

性的参与者都不会有单独改变策略的冲动。

由此可见，纳什均衡是一稳定的博弈结果。打一个比方，如果把

一个乒乓球，放到一个光滑的铁锅里，不论其初始位置在何处，最终

乒乓球都会稳定地停留在锅底，这时的锅底就可称为是一个纳什均衡

点。相反，如果锅是扣在地上的，那么锅底部位是很难放稳一个乒乓

球的，因为往任何方向的一点点移动，都会使球彻底离开锅底。这时

的锅底部位就不是一个纳什均衡点了。

博弈的结果并不都能成为均衡。博弈的均衡是稳定的，则必然可

以预测。纳什均衡的另一层含义是：在对方策略确定的情况下，每个

参与者的策略是最好的，此时没有人愿意先改变或主动改变自己的策

略。在上面的“囚徒困境”变形的博弈中，A和B都不坦白就是一个

纳什均衡，这对双方来说都是最优选择。同时在这个博弈中，其均衡

对双方来说是全局最优的。当然博弈达到纳什均衡，并不一定是对参

与者最有利的结果，更不意味着是对整个社会作为一个整体而言最有

利的结果，比如“囚徒困境”的例子导致了整体的不利。

围棋与这个博弈的例子是有所不同的。上面的这个例子是A和B

双方没有信息交换下的博弈，这就是博弈论中的静态博弈概念。围棋

则是对弈双方相继按照一先一后次序行动的博弈。对于一人一步的相

继行动的博弈，每个参与者都必须向前展望或预期，估计对手的意图，

从而倒后推理，决定自己这一步应该怎么走。这是一条线性的推理链：

“假如我这么做，他就会那么做——若是那样，我会这么反击”，后

面的步骤依此类推。也就是说，你怎么走棋，完全取决于对手的上一

招。这在博弈论上叫做“倒推法”。在动态博弈中，存在明显的马太

效应，也就是说凡是少的，连他仅有的也夺过来；凡是多的，就加给

他，让他更多。比如在围棋上，就有“一招不慎，满盘皆输”的谚语，

当然我们也要应用动态博弈的马太效应原理，在获得优势的情况能够

保持优势扩大优势，直至最后成功。

而在同时行动的静态博弈里，没有一个博弈者可以在自己行动之

前得知另一个博弈者的整个计划。在这种情况下，互动推理不是通过

观察对方的策略进行，而是必须通过看穿对手的策略才能展开。要想

做到这一点，单单假设自己处于对手的位置会怎么做还不够。即便你

那样做了，你只会发现，你的对手也在做同样的事情，即他也在假设

自己处于你的位置会怎么做。因此，每一个人不得不同时担任两个角

色，一个是自己，一个是对手，从而找出双方的最佳行动方式。与一

条线性的推理链不同，这是一个循环，即“假如我认为对方认为我认

为……”。

这样来看，定式是一系列纳什均衡的累计直至局部达到稳定的一

种变化，直到一方认为可以根据形势选择任何变化或脱先而无局部受

损之虞。由于定式是在大量实战基础上不断被验证并长期积累而成。

因此在动态博弈中，纳什均衡的要义在于：即使在对抗条件下，

双方可以通过向对方提出威胁和要求，找到双方能够接受的解决方案

而不至于因为各自追求自我利益而无法达到妥协，甚至两败俱伤。稳

定的均衡点建立在找到各自的“占优策略”(dominant strategy)，即无

论对方作何选择，这一策略优于其他策略。

2．从爱情故事谈起：优势策略与房地产开发博弈

“原地高天，堪叹古今情难尽；痴男怨女，可怜风月债难偿。”我

们来先看欧·亨利的小说《麦吉的礼物》描述的这样一个爱情故事。

新婚不久的MM和GG，很是穷困潦倒。除了MM那一头美丽的金色长发，

GG那一只祖传的金怀表，便再也没有什么东西可以让他们引以为傲

了。虽然生活很累很苦，他们却彼此相爱至深。每个人关心对方都胜

过关心自己。为了促进对方的利益，他们愿意奉献和牺牲自己的一切。

话说明天就是圣诞节了，小两口都是身无余钱。为了让爱人过得

好一点，每个人还是想悄悄儿准备一份礼物给对方。GG卖掉了心爱的

怀表，买了一套漂亮发卡，去配MM那一头金色长发。MM剪掉心爱的长

发，拿去卖钱，为GG的怀表买了表链和表袋。

最后，到了交换礼物的时刻，他们无可奈何地发现，自己如此珍

视的东西，对方已作为礼物的代价而出卖了。花了惨痛代价换回的东

西，竟成了无用之物。出于无私爱心的利他主义行为，结果却使得双

方的利益同时受损。

欧·亨利在小说中写道：“聪明的人，送礼自然也很聪明。大约

都是用自己有余的物事，来交换送礼的好处。然而，我讲的这个平平

淡淡的故事里，两个住公寓的傻孩子，却是笨到极点，彼此为了对方，

白白牺牲了他们屋檐下最珍贵的财富。”从这段文字看，欧亨利似乎

并不认为这小两口是理性的。且让我们暂时抛开爱情的温馨，单从利

益的角度来解读。我们假定，他们每个人，有一个“毫不利己专门利

人”的偏好系统，毫不考虑自身利益，专门谋求别人的幸福。这样，

个人选择付出还是不付出，只看对方能不能得益，与自己是否受损无

关。以这样的偏好来衡量，最好的结果自然是自己付出而对方不付出，

对方收益增大；次好的结果是大家都不付出，对方不得益也不牺牲；

再次的结果是大家都付出；最坏的结果是别人付出而自己不付出，靠

牺牲别人来使自己得益。我们不妨可用数字来代表个人对这四种结果

的评价：第一种结果给3分，第二种结果给1分，第三种结果给1分，

最后那种给0分。

不难看出，无论对方选择付出，还是选择不付出，个人自己的最

佳选择都是付出。然而这并不是对大家都有利的选择。事实上，大家

都选择不付出，明显优于大家都选择付出的境况，这就达到了上文提

到的纳什均衡。

实际上，这里的例子是一个博弈论中所说的占优策略均衡。通俗

地说，在占优策略均衡中，不论所有其他参与人选择什么策略，一个

参与人的占优策略都是他的最优策略。显然，这一策略一定是所有其

他参与人选择某一特定策略时该参与人的占优策略。因此，占优策略

均衡一定是纳什均衡。在这个例子中，MM选择不付出，也就是不剪掉

金发对于MM来说是一个优势策略，也就是说MM不付出，GG不管选择什

么策略，MM所得的结果都好于GG。同理，GG不卖掉怀表对于GG来说也

是一个优势策略。

再举个简单的例子：一名篮球前锋和队友在蓝下面对着对方的一

个后卫时，形成了二打一的局面，该前锋可以选择直接投篮，也可以

选择传球给队友，根据经验，传球过人的成功率更大，那么传球就是

该前锋的优势策略。即某些时候它胜于其他策略，且任何时候都不会

比其他策略差。如果一个球员具有这样一种策略，无论其他球员怎么

做，这个策略都会高出一筹，那么这个球员就有一个优势策略。当然

如果一个球员有这么一个优势策略，他的决策就会变得非常简单，只

要直接采用该策略而完全不必考虑对手的应对策略。

还有一个要注意的问题是，采用优势策略得到的最坏结果并不一

定比采用另外一个策略得到的最佳结果要好，这是很多博弈论普及书

中容易出错的一个问题。应该说，对局者采用优势策略在对方采取任

何策略时，总能够显示出优势。比如就这个例子来说，就MM来说，

她采用不付出的策略，无论GG付出或不付出，MM的不付出策略总

是占有优势。GG的优势策略也是一样。但是，MM选择不付出的最

坏结果是1，二选择付出的最好结果是3，很明显，MM的优势策略

得到的最坏结果并不比采用另外一个策略得到的最佳结果要高出一

筹。

反之，劣势策略则是指在博弈中，不论其他参与人采取什么策略，

某一参与人可能采取的策略中，对自己严格不利的策略，劣势策略是

我们在日常生活中不可以选择的行动。劣势策略是与优势策略相对应

的概念，笔者这里就不多做介绍。

3．房地产博弈、警察捉小偷博弈与纳什均衡

实际上，在上一小节，每个参与人都有优势策略的情况下，优势

策略均衡是非常合乎逻辑的。一个优势策略优于其他任何策略，同样，

一个劣势策略则劣于其他任何策略。假如你有一个优势策略，你可以

选择采用，并且知道你的对手若是有一个优势策略他也会照办；同样，

假如你有一个劣势策略，你应该避免采用，并且知道你的对手若是有

一个劣势策略他也会规避。

但遗憾的是不是所有博弈都有优势策略，哪怕这个博弈只有两个

个参与者。实际上，优势策略只是博弈论的一种特例。虽然出现一个

优势策略可以大大简化行动的规则，但这些规则却并不适用于大多数

现实生活中的博弈。

来看这样一个房地产开发博弈的例子。假定北京市的房地产市场

需求有限，Ａ、Ｂ两个开发商都想开发一定规模的房地产，但是市场

对房地产的需求只能满足一个房地产的开发量，而且，每个房地产商

必须一次性开发这一定规模的房地产才能获利。在这种情况下，无论

是对开发商Ａ还是开发商Ｂ，都不存在一种策略完全优于另一种策

略，也不存在一个策略完全劣于另一个策略。因为，如果Ａ选择开发，

则Ｂ的最优策略是不开发；如果Ａ选择不开发，则Ｂ的最优策略是开

发；类似地，如果Ｂ选择开发，则Ａ的最优策略是不开发；如果Ｂ选

择不开发，则Ａ的最优策略是开发。这样就形成了一个循环选择。

根据纳什均衡含义就是：给定你的策略，我的策略是最好的策略；

给定我的策略，你的策略也是你最好的策略。即双方在对方给定的策

略下不愿意调整自己的策略。这个博弈的纳什均衡点不止一个，而是

两个：要么A选择开发，B不开发；要么A选择不开发，B选择开

发。在这种情况下，A与B都不存在优势策略，也就是A和B不可

能只要选择某一个策略而不考虑对方的所选择的策略。实际上，在有

两个或两个以上纳什均衡点的博弈中，其最后结果难以预测。在房地

产博弈中，我们无法知道，最后结果是A开发，B不开发还是A不

开发，B开发。

再来看这样一个警察捉小偷博弈的例子。某个村庄上只有一名警

察，他要负责整个村的治安。小村的两头住着两个全村最富有的村民

A和B，A、B分别需要保护的财产为2万元、1万元。整个小村某

一天来了个小偷，要在村中偷盗A和B的财产，这个消息被警察得

知。因为分身乏术，警察一次只能在一个地方巡逻；而小偷也只能偷

盗其中一家。若警察在某家看守财产，而小偷也选择了去该富户家，

就会被警察抓住；若警察没有看守财产的富户家而小偷去了，则小偷

偷盗成功。

一般人会凭着感觉认为，警察当然应该看守富户A家财产，因

为A2万元的财产而B只有1万元的财产。实际上，对于警察的一个

最好的做法是，警察抽签决定去A还是B家。因为A家的财产是B

家的2倍，所以用两个签代表A家，比如如果抽到1、2号签去A家，

抽到3号签去B家。这样警察有2／3的机会去A家进行做看守，1／3的机会去B家做看守。而小偷的最优选择是：以同样抽签的办法

决定去A家还是去B家实施偷盗，只是抽到1、2号签去A家，抽到

3号签去B家，那么，小偷有l／3的机会去A家，2／3的机会去B

家。这些数值是可以通过联立方程准确计算出的，笔者这里就不给出

具体的数学计算过程。

细心的读者会发现，警察捉小偷博弈与前面所举的两个博弈案例

有一个很大的差别，就是用到了概率的知识，警察与小偷没有一个一

定要选择某个策略的纳什均衡，而只有选择某个策略是多少几率的纳

什均衡。

在博弈论中，可以选择出某个策略的纳什均衡，这个策略叫做纯

策略，凡是用到概率（并且几率不能为0和1，否则就退化为纯策略，

可以想见，纯策略的纳什均衡只是博弈的一种特例）的纳什均衡。用

专业的话来说，所谓纯策略是指参与者在他的策略空间中选取惟一确

定的策略。但至少存在一个混合策略均衡点。所谓混合策略是指参与

者采取的不是惟一的策略，而是其策略空间上的概率分布。这就是纳

什于1950年证明了的纳什定理。而这个博弈没有纯策略纳什均衡点，

而有混合策略均衡点。这个混合策略均衡点下的策略选择是每个参与

者的混合策略选择。

最常见混和策略就是猜硬币游戏。比如在足球比较开场，裁判将

手中的硬币抛掷到空中，让双方队长猜硬币落下的正反面。由于硬币

落下是正是反是随机的，概率应该都是1/2。那么，猜硬币游戏的参

与者都是1/2的概率选择正与反，这时博弈达到混和策略纳什均衡。

再比如我们儿时玩的“剪、布、锤”就不存在纯策略均衡，对每个小

孩来说，自己采取出“剪”、“布”还是“锤”的策略应当是随机的。

一旦一方知道另一方出其中某个策略的可能性增大，那么这个对弈者

在游戏中输的可能性就增大。因此，每个小孩的最优混合策略是采取

每个策略的可能性是l／3。在这样的博弈中，每个小孩各取三个策略

的1／3是纳什均衡。由此可见：纯策略是参与者一次性选取的，并

且坚持他选取的策略；而混合策略是参与者在各种备选策略中采取随

机方式选取的。在博弈中，参与者可以改变他的策略，而使得他的策

略选取满足一定的概率。当博弈是零和博弈时，即一方所得是另外一

方的所失时，此时只有混合策略均衡。对于任何一方来说，此时不可

能有纯策略的占优策略。

4．位置博弈与商家策略

有这么一个大家都很熟悉的现象，那就是在每个大大小小的城市

街道上，经常见到一些地段上的商店十分拥挤，构成一个繁荣的商业

中心区，但另一些地段却十分冷僻，没什么商店。更有意思的是，往

往在一个同类型的商家总是聚集在比较近的地方，比如在任何城市肯

德基、麦当劳之间总是津津相邻。再如超市现象，前两年有很多人对

超市的布局发表了一些议论。因为有人注意到，如果在一条街上有2～

3家超市的话，这几家超市经常性地会“相依为邻”，选址离得很近，

倘若它们稍微分散地布置于街上，无疑对市民的购物提供相当的便

利，因此他们认为超市“拥挤”在一起属于资源浪费。

类似的事情发生于电视台的节目播放。很多电视迷会发现，大部

分电视台总是将最精彩的节目放在相同的时间段，甚至有些时候是在

相同时间段播放类似的节目，比如你播“快乐大本营”，我就播“超

级总动员”；你播“玫瑰有约”，我就播“单身男女”。人都说文人相

轻，电视台也是这么相煎太急。

博弈论能够对这个现象作出科学的解释。首先看一个简单的博弈

模型进行叙述：

假设有条完全笔直的公路，连接城市A到城市B之间的交通。

这条公路上每天行驶着大量的车辆，并且车流量在公路上是均匀分布

的。假设有两家快餐店，我们不妨假设为靠高速公路起家的麦当劳与

肯德基，它们要在这条公路上选择一个位置开设快餐，招揽来往车辆。

为了能够更加清晰的说明这个博弈，我们不得不画一张图。

再对该模型作一个合乎逻辑的假定：通常情况下，车辆总是乐意

到距自己最近的快餐店购买食物。根据这个原则，从资源的最佳配置

来看，麦当劳、肯德基应该分别开在1/4、3/4处是最优。在这种均匀

散布的情况下，每家快餐店所有拥有的客户从距离最近的城市到两家

快餐店的中心为止，因此都拥有1/2的顾客量，同时对于开车的人们

总体来说，这种策略的选择，车辆到快餐店的总的距离最短。

然而，，天总不能遂人之愿。肯德基与麦当劳都是百年老店，自

然是精明之至，从经济学上就是具有经济理性。他们只要手段合法，

总是希望自己的生意尽可能地红火，至于其他人的生意的好坏则与己

无关。出于这种理性，肯德基分店经理肯定会想到：如果我将店铺从

3/4点处向左移一点，那麽1/4点之间的中点不在是1/2点处，而是位

于1/2点的靠左边一点。这等于说，这一移位，肯德基将从麦当劳抢

夺走部分顾客，这对于肯德基单方面来说无疑是一个好主意。当然麦

当劳也不甘示弱，作为一个“理性人”，麦当劳自然也应该想到将自

己的店铺从1/4点处向右移动以争取更多的顾客。不难想象，双方博

弈的结果将使他们的店铺设置在l/2中点附近达到纳什均衡状态，甲

图1 位置博弈

文本框: 1/4麦当劳

1/4麦当劳 3/4肯德基 1/20

A

1B

乙两人相依为邻且相安无事地做起快餐生意。如果我们放宽条件，不

是两家快餐店，而是很多家快餐店，很容易分析得到结果：这些快餐

店仍然会在1/2处设店达到纳什均衡。

同样的道理，如果地段的繁华等其他原因在一条路上上都可以认

为到处相同的话，没有一个商家会将自己安置于某条路的一头，只要

条件许可，超市将几乎趋向于相依为邻，这种现象完全可以看作公正

的市场竞争的合理结果。这就是很多城市商业中心形成的原理，在博

弈论中称为位置博弈。

电视台之间在时间段上的重叠问题在本质上就是位置博弈。事实

上，我们只要将时间设想为上述案例中的公路，就不难分析到它们都

将得到大部分观众青睐的精彩节目放在同一黄金时段完全是市场竞

争的结果。在这种情况下，电视台之间的竞争会更加激烈，为了获得

收视率，电视台只能在制作质量上下功夫，获得真正实惠的依然是广

大观众。

5．猎鹿模型的合作哲学

来看这样一个“狩猎”故事：设想在原始社会，人们靠狩猎为生。

某一天有两个猎人围住了一头鹿，他们各卡住鹿可能逃跑的两个路口

中的一个。只要他们齐心协力，鹿就会成为他们的猎物，不过仅凭一

个人的力量是无法猎捕到鹿的。如果此时周围跑过一群兔子，两位猎

人中的任何一个只要去抓兔子一定会获得成功，他会抓住4只兔子。

从能够填饱肚子的角度来看，4只兔子可以供一个人吃4天，1只鹿

如果被抓住将被两个猎人平分，可供每人吃10天。这里不妨假设两

个猎人叫A和B。我们引入一种矩阵式的对两人博弈的描述方法，见

下图。

4

4

0

4

4

0

10

10

在这个矩阵图中，每一个格子都代表一种博弈的结果。具体说来，

在左上角的格子表示，猎人A和B都抓兔子，结果是猎人A和B都

能吃饱4天；在左下角的格子表示，猎人A抓兔子，猎人B打鹿，

结果是猎人A可以吃饱4天，B则一无所获；在右上角，猎人A打

鹿，猎人B抓兔子，结果是猎人A一无所获，猎人B可以吃饱4天；

在右下角，猎人A和B合作抓捕鹿，结果是两人平分猎物，都可以

吃饱10天。

在这个博弈中，根据纳什均衡的定义，应用博弈论中的“严格劣

势删除法”（有兴趣的读者可以找本书参考文献中的相关书籍阅读，

这里不做详细介绍。）可以得到该博弈有两个纳什均衡点，那就是：

要么分别打兔子，每人吃饱4天；要么合作，每人吃饱10天。

猎人A

猎人B

抓兔

打鹿

打鹿

抓兔

图2 猎鹿模型

两个纳什均衡，就是两个可能的结局。两种结局到底哪一个最终

发生，这无法用纳什均衡本身来确定。比较[10，10]和[4，4]两个纳

什均衡，明显的事实是，两人一起去猎鹿比各自去抓兔子可以让每个

人多吃12天。按照经济学的说法，合作猎鹿的纳什均衡，分头抓打

兔子的纳什均衡，具有帕累托优势。与[4，4]相比，[10，10]不仅有

整体福利改进，而且每个人都得到福利改进。换一种更加严密的说法

就是，[10，10]与[4，4]相比，其中一方收益增大，而其它各方的境

况都不受损害。这就是[10，10]对于[4，4]具有帕累托优势的含义。

在经济学中，帕累托效率准则是：经济的效率体现于配置社会资

源以改善人们的境况，主要看资源是否已经被充分利用。如果资源已

经被充分利用，要想再改善我就必须损害你或别的什么人，要想再改

善你就必须损害另外某个人，一句话，要想再改善任何人都必须损害

别的人了，这时候就说一个经济已经实现了帕累托效率。相反，如果

还可以在不损害别人的情况下改善任何人，就认为经济资源尚未充分

利用，就不能说已经达到帕累托效率。

目前在世界上比比皆是的企业强强联合就很接近于猎鹿模型的

帕累托改善，跨国汽车公司的联合、日本两大银行的联合等等均属此

列，这种强强联合造成的结果是资金雄厚、生产技术先进、在世界上

占有的竞争地位更优越，发挥的影响更显赫。总之，他们将蛋糕做得

更大，双方的效益也就越高。比如宝山钢铁公司与上海钢铁集团强强

联合也好，最重要的就是将蛋糕做大。在宝钢与上钢的强强联合中，

宝钢有着资金、效益、管理水平、规模等各方面的优势，上钢也有着

生产技术与经验的优势。两个公司实施强强联合，充分发挥各方的优

势，发掘更多更大的潜力，形成一个更大更有力的拳头，将蛋糕做得

比原先两个蛋糕之和还要大。

猎鹿模型的讨论，我们的思路实际只停留在考虑整体效率最高这

个角度，而没有考虑蛋糕做大之后的分配。猎鹿模型是假设猎人双方

平均分配猎物。

我们不妨做这样一种假设，猎人A比猎人B狩猎的能力水平要

略高一筹，但B猎人却是酋长的之子，拥有较高的分配权。可以设

想，A猎人与B猎人合作猎鹿之后的分配不是两人平分成果，而是A

猎人仅分到了够吃2天的鹿肉，B猎人却分到了够吃18天的鹿肉。

在这种情况下，整体效率虽然提高，但却不是帕累托改善，因为整体

的改善反而伤害到猎人A的利益。我们假想，具有特权的猎人B会

通过各种手段方法让猎人A乖乖就范。但是猎人A的狩猎热情遭到

伤害，这必然会导致整体效率的下降。进一步推测，如果不是两个人

进行狩猎，而是多人狩猎博弈，根据分配可以分成既得利益集团与弱

势群体，这和我国的现状非常相似。

我国改革进程根据著名经济学家左大培先生的研究，在九十年代

中期以前是一种帕累托改善的过程。但是随着国企改制失误、教育体

制改革失误、医疗改革失误、腐败等因素的影响，逐渐是极少数既得

利益集团获得最大的利益（中国千万富翁超过24万人），基尼指数接

近0.6，社会极度不平等，贫富差距极度拉大，帕累托改善已不存在。

很显然，这种情况如果继续下去，社会稳定和改革深化会受到决定性

的冲击。

第三章 “囚徒困境”的启示

1．“囚徒困境”的深刻哲理

在前面的章节，笔者讨论一个“囚徒困境”(Prisoner’s dilemma)

变形博弈，很明显，该警察局长所采取的策略必然不能够使得两名囚

犯坦白罪行。其实，只有改变游戏规则，利用“囚徒困境”模型策略

才可以达到目的。“坦白从宽，抗拒从严”的道理人人都懂，从博弈

论的角度来看，其实就是一个囚徒困境模型的应用。我们前面所讨论

的爱情博弈其实也是囚徒困境的一种形式。

这里我们继续前面的讨论，这个警察局局长C如果足够明智的

话，必然不要求两名囚犯都招供，而是让两名囚犯中的任何一名坦白，

招出另外一个人。这样警察局局长C就要确定，对不坦白的人施以最

严厉的刑罚。

这种情况下，警察局局长C对囚犯A和B作成如下许诺：如果他

们之中有一人坦白，而另一人不坦白，则坦白者无罪释放，而不坦白

者要被判无期徒刑，囚禁终生；如果两人都坦白，则两人都被判有期

徒刑5年；如果两人都不坦白，则两人都被判2年监禁。

囚徒困境仍然需要2个前提预设：囚徒A和B两人都是自利理性

的个人，即只要给出两种可选的策略，每一方将总是选择其中对他更

有利的那种策略；两人无法沟通，要在不知道对方所选结果的情况下，

独自进行策略选择。在这种条件下，从囚犯A的立场来看，共有2种

可能情况：第一种可能是B采取坦白的策略，这时如果囚犯A也坦白，

则要入狱5年，如果不坦白，则要囚禁终生，两相比较，结论是应该

坦白。第二种可能是囚犯B采取沉默的态度，这时若甲也沉默，要入

狱2年，如果囚犯A坦白，则可获得自由，两相比较结论是应该坦白。

因此，无论囚犯B是坦白还是沉默，囚犯A采取坦白的策略对自己更

为有利。同样以上推理对于囚犯B也适用。结果两个囚徒都坦白了，

都被判刑5年。囚徒困境的“困境”在于如果甲乙二人都保持沉默，

则都只被判刑一年，显然比两人都坦白的结果要好。

两名囚犯都作出招供的选择，这对他们个人来说都是最佳的，即

最符合他们个体理性的选择。照博弈论的说法，这是惟一的纳什均衡

点。除了这个均衡点，A与B的任何一人单方面改变选择，他只会得

到更加不经济的结果。而在其它的结果中，比如两人都不坦白的情况

下，都有一人可以通过单方面改变选择，来减少自己的刑期。可是两

人经过一番理性计算后，却选择了一个使自己陷入不利的结局。

其实“囚徒困境”不允许囚犯A和B进行沟通的假设，与实际生

活中大部分情况的现实是有差异的。比如，在爱情博弈中，很多恋人

会经常花前月下、彻夜厮守；在企业的价格战中，企业之间也会多有

沟通，价格；即使是二十世纪下半世纪的美苏军备竞赛中，两个超级

大国也会经常进行外交交谈，及时交换信息。

笔者不妨将条件放宽，允许囚犯A和B在审讯室李一起单独呆上

10分钟，然后再决定是否坦白。很明显，双方交流的主旨就是建立

攻守同盟，克服自利心理，甚至可能订立一个口头协议，要求双方都

不去坦白。然后，双方再单独被提审。我们不妨设想，囚犯A的心理，

他一定会认为，如果囚犯B遵守约定的话，则自己坦白就可获得自由；

如果囚犯B告密的话，若不坦白就会被终生囚禁。事实上，囚犯A的

策略并没有因为简单的沟通或协议而摆脱两难境地。

恋人们在恋爱中的海誓山盟，最终还是分手；企业之间相互沟通

信誓旦旦，价格战仍然会爆发；美苏两国经常会晤，甚至签订核不扩

散条约，但军费一年高过一年。这些现象都反映了上面所说明的问题。

在本节所举的囚徒困境的游戏规则，能够让狡猾的罪犯招供，得

到应有的惩罚，固然不是坏事。然而，我们不妨假设囚徒A和B都是

完全清白的大大的具有理性的良民，这个博弈的纳什均衡并不会因为

他们的清白而改变。如果在现实生活中，加上对身体的残害，完全会

造成屈打成招的冤假错案。在中国历史上，这种事情并不是多么稀有

的个案。

在更深刻的意义上，囚徒困境模型动摇了传统社会学、经济学理

论基础，这是经济学的重大革命。

传统经济学的鼻祖亚当·斯密在其传世经典《国民财富的性质和

原因的研究》中这样描述市场机制：“当个人在追求他自己的私利时，

市场的看不见的手会导致最佳经济后果。” 这就是说，每个人的自利

行为在“看不见的手”的指引下，追求自身利益最大化的同时也促进

了社会公共利益的增长。即自利会带来互利。

传统经济学秉承了亚当·斯密的思想。传统经济学认为：人的经

济行为的根本动机是自利，自私是个好东西，每个人都有权追求自己

的利益，没有私社会就不会进步，现代社会的财富是建立在对每个人

自利权利的保护上的。因此经济学不必担心人们参与竞争的动力，只

需关注如何让每个求利者能够自由参与尽可能展开公平竞争的市场

机制。只要市场机制公正，自然会增进社会福利。

但是囚徒困境的结果，恰恰表明个人理性不能通过市场导致社会

福利的最优。每一个参与者可以相信市场所提供的一切条件，但无法

确信其他参与者是否能与自己一样遵守市场规则。

佛家讲因果律，儒家讲究“财自道生，利缘义取”。从囚徒困境

看来，如果一味地想算计别人，算来算去，最后算计到自己头上来了。

如果我们将囚徒困境中的有期徒刑改为死刑，那么“机关算尽太聪明,

反误了卿卿性命”用在这里是再恰当不过的了。

2．经济自由与效率

关于经济自由主义，笔者不得不在这里着重笔墨写这么额外

的一小节。在目前中国的经济、管理领域，经济自由主义者的观点已

是喧嚣尘上、风靡一时，如江河之泛滥，一发不可收拾。他们恨不能

将中国所有的大型国有企业全部分解成原始资本主义的小商小贩，妄

图在一夜之间造就出梦幻般的完全自由竞争的市场经济体系。按照经

济学家左大培的观点，中国经济自由主义者的思想是 “有中国特色

的经济自由主义”。

在资本主义早期，成千上万的小私有者投资工商业作为谋生手

段，亚当·斯密正是在这种背景下才假设经济个体行为不会影响其他

个体行为，并推断出个体利益最大化也就是社会利益的最大化。后来

资本的高度集中使其日益脱离生产，变为纯粹攫取利润的工具，理论

模型开始注意经济生活中各利益主体之间的相互影响和相互作用。一

种研究经济个体如何在复杂的竞争关系中使自身利益最大化的理论

“经济博弈论”应运而生。

正如上一节所述，“囚徒困境”本身就已经推翻了自由经济主

义存在的理论基础。囚徒困境揭示了：个体理性的选择与群体理性选

择之间的矛盾，从个体利益出发的行为往往不能实现团体的最大利

益；同时也揭示了市场理性本身的内在矛盾，从个体理性出发的行为

最终也不一定能真正实现个体的最大利益，甚至会得到相当差的结

果。从“囚徒困境”与“囚徒困境”变形模型中，我们可以证明：人

们的相互交往过程中，每个行为主体的利己主义决策结果，可能是有

效率的，也可能是无效率的，但多次重复这种决策肯定是低效率的。

它实际上证明了亚当·斯密200年前提出的每个人自私自利就可以实

现社会最大福利的假设的不可实现性。在现代市场经济中，人们在多

次交往或者重复博弈后发现，遵循平等合作规则要比通过欺诈获得少

数几次不义之财更有利。如果一直按照工业社会的传统规则博弈下

去，人类将面临“一切人坑害一切人”的社会。

笔者这里再举一个实例证实，自由竞争并不是最优效的经济体

系，而政府管制也不是最无效的手段。

1971年，美国国会通过了禁止在电视上做烟草广告的法律。令

许多人奇怪的是，财大气粗的各大烟草公司反应相当平静，并没有动

用其庞大的社会资源和影响力阻止这个法律的通过。政府管制最终的

结果是，尽管烟草广告因受到限制而减少，可是烟草公司的利润却提

高了。实际上，政府禁令不仅没有打击烟草公司，反而是把陷入白热

化广告战的各大烟草集团从“囚徒困境”中解放了出来。

在20世纪60年代，美国烟草行业竞争激烈，为了争夺市场，各

大烟草公司都必须耗费巨额费用大做广告，这无疑降低了它们的利润

水平。也就是说，如果烟草公司都不做广告，它们的利润要更高。可

是，如果其中一家公司不做广告，它的市场份额就会被其他公司抢走。

这正是一个囚徒困境：某公司放弃做，而其它公司仍然大作广告抢占

市场，放弃做广告的公司必然利益受损。在这种情况下，做广告就是

每一个广告公司的优势策略。即使烟草公司能够达成都不做广告的协

议，但是这个协议的约束力太低，这在上一节已经解释过，这并不能

将烟草行业从广告战的泥潭中解救出来。

这个时候国家出台法令对于烟草行业来说反而是个好事，烟草公

司靠自己做不到的事情，政府做到了。因为国家法律具有强制性的作

用，相当于是烟草集团之间签订了极具约束力的协议，同时政府承担

了监督烟草公司是否违反协议的成本。

除了自由竞争之外，中国的经济自由主义者还强调，经济只应关

注效率，不要强求公平，更加谬误的是他们又把效率只片面地看成是

个人或家庭的发财致富。我们可以发现，这种思想在社会上引起了很

恶劣糟糕的一种思想潮流。在书店里充斥着如何发财致富的书籍，而

所谓的一些成功人士则是人们顶礼膜拜的新偶像。

他们甚至还认为，经济体系可以不要任何秩序的竞争，一切都应

放任自流，反对靠政府的干预来建立秩序。所谓秩序，就是游戏规则，

就是一个博弈对局的规则。比如很多知名的所谓经济学家竟然公开颂

扬“全民炒股”、全国性的房地产投机之类的对经济具有极强破坏力

的现象。更有甚者是，某经济学居然从理论上推出这样的结论：“腐

败适度存在，能使改革进一步推进”。还有经济学家公开宣称“腐败

和贿赂成为改革过程得以顺利进行的润滑剂”。关于这个问题，笔者

会在后面的章节用博弈论的方法与观点来说明其荒谬性与无耻性。

3．“囚徒困境”的破解：无限次重复博弈与有限次重复博弈

“不识庐山真面目,只缘身在此山中。”我们继续囚徒困境的讨论，

从上几节的解释中，我们可以看出，严格囚徒困境的前提条件是博弈

各方不可以进行合作，也就是不能够制订有约束力的协议。但在实际

上，合作是文明的基础，比如兴修水利、组织国防、创建企业等都是

合作而产生的，无怪乎哲学家卢梭写了本书《社会契约论》，认为契

约是整个人类社会存在的前提条件之一。

前面已经分析过，如果囚徒困境只是一次性的博弈，那么签订协

议是毫无意义的，其纳什均衡点并不会改变。可以签订协议的一个最

基本的条件，就是博弈需要重复若干次，当然至少大于一次。就恋爱

博弈来看，男女双方在交往的过程，随时都在博弈，因为相爱的过程

中任何一个时点都是有可能分手的。用博弈论的术语来说，这是一种

囚徒困境的重复博弈。无数爱情故事中的悲欢离合、精彩跌宕正是这

个博弈模型的表现。当然那种素不相识一对男女，偶尔在酒吧中相遇，

于是宾馆订房、春梦一场，拂晓之后就各自分道扬镳的一夜情是理所

当然的一次性囚徒困境博弈。

我们在这里要注意的是，重复博弈与我们前面所提及一般性的动

态博弈是不同的。多轮动态博弈中，参与者能够了解到博弈中的每一

步其它参与者的在自己选择某种策略下的行动，而重复博弈的参与者

无法了解到在任何一个步中，其它参与者的策略选择。

囚徒困境一旦从一次性博弈转变为重复博弈，情况会发生非常大

的变化，博弈的结局也就是纳什均衡点可能会完全不同。举个最简单

的例子，大家都知道国外的黑手党组织严密，对待背叛者的惩罚非常

残忍。一个黑手党成员告发别的黑手党成员，一定会被组织谋杀。我

们假设前面的囚徒困境故事不是发生在中国，而是意大利，囚犯A

和B都是黑手党成员。他们很可能宁愿被判处终生囚禁，也不愿意

出狱之后被同伙干掉。

实际上，在重复型的囚徒困境中，并不是签订合作协议很困难，

困难的是这个协议对博弈各方是否具有很强的约束力。一个合作契约

建立的困难在于任何协议签订之后，博弈参与者都有作弊的动机，因

为至少在作弊的这一局博弈中，作弊者可以得到更大的收益。还是用

爱情来打比方，常言道：“婚姻是走向爱情的坟墓”，但从博弈论的角

度来看，婚姻恰恰是男女双方签订的一种协议，具有一定约束力的协

议，因为一旦对方背叛婚姻，就会受到家庭的压力与社会舆论的谴责。

在博弈理论中，博弈专家已经用数学证明出，在无限次重复博弈

的情况下，合作可能是稳固的。如果博弈无穷次，双方就会逐渐从互

相背叛走向互相合作。因为任何一次背叛都会招致对方在下一次博弈

时的报复；而双方都取合作态度会带来合作收益。但是在现实社会生

活中又不完全这样，人总是要死的，因而人与人之间的博弈不是无限

次的。当一个人知道他终将退出博弈时，他就可能不再害怕此后别人

对他的报复，从而可以在博弈结束前做损害他人的事情，这就回复到

有限次重复博弈的境况。

对于有限次囚徒困境博弈，美国密西根大学的罗伯特·爱克斯罗

德教授（Robert Axelrod）曾经做过一个著名的博弈论试验。这个试

验的思路非常简单：任何想参加这个计算机竞赛的人都扮演“囚徒困

境”模型中一个囚犯。他们把自己的策略编入计算机程序，然后这些

程序会被成双成对地融入不同的组合。分好组以后，参与者就开始玩

“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择。

试验参与者连续玩上200次，于是这就更逼真地反映了日常人际关

系。

试验的结果表明，囚徒困境在同样重复数十次或一百次的情况

下，只要两个参与者仍然还是理性人（这可以在该试验的参加者所编

程序中反映出），博弈的结果仍然是囚徒A和B相互把对方招供出来。

为了解释这个问题，我们不妨讨论一个博弈两次的模型。

我们首先考虑第二次博弈的情况，由于这是最后一次博弈，自然

没有后面的博弈对这次博弈的影响，因此也不就不必为将来打算，个

人都只追求这次博弈的最大利益，于是第二次博弈的结果应该和一次

囚徒困境博弈完全一样，自然是囚徒A和B都坦白，达到纳什均衡。

现在再来考虑第一次博弈的情况，博弈参与者A已经很清楚最后一

次博弈，B一定会招供，那么即使囚徒A不坦白，在下一次博弈时，

B也一定会招供，这次博弈A不坦白对下一次博弈没有任何好的影

响，那么作为理性人的A一定仍然选择坦白。对于B，也是一样的道

理。由此可见，第一次博弈自然也和一次性囚徒困境博弈完全一样。

其实不论是两次博弈，还是3次，4次，甚至是上百次，只要是

有限次数的重复囚徒困境博弈，其思路方法都是一样的。这种方法就

是我们在前文中提到的倒推法（Backward induction），这在博弈论中，

对于重复博弈与动态博弈是一种重要的分析方法，当然这对我们在日

常生活中分析问题也不无裨益。比如，汽车企业之间的价格战往往不

是一次性降价，而是一轮一轮地降价，这种类似的问题都可以用有限

次囚徒困境模型来分析，事实情况和我们前面的分析完全相同，汽车

企业之间每一次的价格博弈的纳什均衡只有一个，那就是全体降价。

笔者在这一节最后还要补充一个问题，就是多人重复囚徒困境的

博弈。实际上，生活中的两人博弈毕竟是特例，绝大部分的情况还是

多人博弈，比如上面提到的汽车价格战。在多人博弈中，只有其它所

有参与者在第k－1次博弈中都是合作的，某个参与者才会在的k次

博弈中采取合作策略。然而，这一策略会带来一个协调问题，任何人

的一个小小失误都会导致采取背叛策略的其他参与者的数量如同滚

雪球一样地愈演愈烈，最终导致所有人的背叛。更糟糕的是，一旦出

现这种情况，没有任何人会主动开始合作。因此，我们可以这么说，

多人重复囚徒困境（无论有限或无限）中稳定的合作几乎是不可能的。

比如1992年英镑事件前后，可以明显感觉到有关游戏各方的思

路与分析、行为模式。游戏中的德国、英国、意大利等的共同利益是

建立统一的欧洲共同体；而它们在考虑统一货币的利益时，均在强调

自己的利益；德国在其中的地位很特殊，它具有双重身份，既是欧洲

汇率机制的基础，也是德国货币稳定的保证。这就形成了“囚徒困境”

的博弈模型。索罗斯的量子基金发起攻击的主要原因在于：德国联邦

银行总裁“暗示”不会放弃德国的利益。而英国、意大利等国家在本

国利益受到损害时，也必然倾向于自保。而在这种分歧加剧的背景下，

无疑会加重有关各方拒绝承认错误的立场，这又进一步加重了分歧，

索罗斯正是利用这套机制获利的。

这个结论似乎是一个令人绝望的，绝望之处必有希望，欧元已经

成功地在欧洲大陆通行，成为可以与美圆相抗衡的硬通货。这其中的

道理，笔者在下一节将告诉读者，什么样的游戏规则可以保证博弈各

方稳定合作。

4．威胁、承诺、作弊与惩罚

西方哲学家卢梭说过，“究竟是什么不可思议的艺术，使人类找

到一种法，通过强迫人们服从，从而使他们获得自由？”

其中最著名的一个答案是由托马斯·霍布斯给出的。霍布斯是现

代英国君主立宪政体的理论奠基人，其代表作是政治学名著《利维坦》

（Leviathan）。所谓“利维坦”，是《圣经》中的一种力大无穷的

巨兽名字的音译，在书中意指一个强大的国家。霍布斯说：“人的自

然本性是自私自利、恐惧、贪婪、残暴无情，人对人互相防范、敌对、

争战不已，像狼和狼一样处于可怕的自然状态中。于是出于人的理性，

人们相互间同意订立契约，放弃各人的自然权利，把它托付给某一个

人或一个由多人组成的集体（如议会、董事会、法院等），这个人或

集体能把大家的意志化为一个意志，能把大家的人格统一为一个人

格；大家都服从他的意志，服从他的判断。这个人或这个集体就是主

权者，而像这样通过社会契约而统一在一个人格之中的一群人就组成

了国家。这就是伟大的利维坦的诞生，用更尊敬的方式来说，这就是

活的上帝的诞生。”按照他的观点，没有集权的合作是不可能产生的。

因此，一个有力的政府是必要的。

霍布斯对合作协议的观点是：“不带剑的契约不过是一纸空文。

它毫无力量去保障一个人的安全。”这就是说，没有权威的协议并不

是导致民主，而是导致无政府状态。最后，霍布斯总结道，“在一切

政体中，最坏的政体并不是专制而是无政府状态。”

霍布斯的观点虽然有些偏激，但却不无道理。根据博弈论的观点，

无论是一次性或有限次重复博弈，“囚徒困境”产生这种结局的原因

是两个囚犯都基于自身利益的角度考虑，这最终导致合作协议无法稳

定遵守。

实际上，决定合作协议是否能够被囚徒双方执行的最关键的基本

要素有两个，即承诺与威胁。所谓承诺，在囚徒困境中就是囚徒向对

方相互许诺，在下一次博弈时会采取让对方有利的行为，也就是不坦

白与对方合作；所谓威胁，就是某个囚徒告知对方如果下一次博弈时

其采取招供策略而不合作，在下下一次博弈时就会采取不利于对方的

策略即招供。

其实，在社会生活中，承诺与威胁是非常常见的现象。比如女生

告诉她男朋友，如果他敢结交其他的女生，只要被发现一次，就立刻

分手，这是威胁；而她男朋友向她发誓绝对自己是个专一的情圣，决

不会背叛爱情，这就是承诺。再比如，在外交中，美国经常向中国承

诺只承认一个中国的原则，我国政府向国际社会承诺中国强大也决不

会采用霸权政策。大家常见的很多耳熟目详的俗语都是承诺与威胁，

比如“人不犯我，我不犯人”、“坦白从宽，抗拒从严”、“以眼还眼，

以牙还牙”等。

合作的关键是承诺与威胁的可信度有多大。因为承诺与威胁都是

在博弈者进行策略选择之前作出的，如果承诺与威胁对博弈者的约束

力越小，那么合作的可能性就越小。假想一个可信度很小的承诺与威

胁，比如参加考试的学生向监考老师承诺在没有老师监考的时候决不

会作弊，不难想象考场中将会是什么样的一种景象，学生并不都是道

德高尚、具有很强自制能力的人。即使在有老师监督考场，并威胁如

果有学生敢于顶风作案，必然严惩不待，比如考卷直接判零分。设想

一下，如果这种威胁仅仅是威胁，在学生作弊后并未真的采取什么严

惩的行动，那么学生作弊的风险非常小，考场纪律依然与没有老师一

样。由此可见，监考老师在一定程度上不得不要做一个霍布斯所说的

“利维坦”式的专制者。

从实际的整个社会生活说来，对于有限次重复博弈合作问题的解

决主要有2个典型方法，那就是国家法律与社会道德。至于其他解决

方法在本质上并不会超脱于它们。

5．国家法律

100多年以前，粱启超曾说过：“我国成文法之起原不可确指，

然以数千年之思想往往视法律与命令同为一物。”直至今日，很多人

在骨子里面往往还是视法律和命令同为一物。从命令的角度来理解

法律，是指个人意志或某个集团的意志以上下级纵向关系的方式传

达，具有直接的强制力，在命令者与被命令者之间缺乏公正程序、严

格的概念解释以及独立的第三者裁判等中间环节或者客观化机制作

为媒介。这样的法律往往是朝令夕改，其约束力并不能保持长久。更

严重的是，这种法律经常演变成是权力的合法外衣，为个人私欲谋取

利益，而法律不再成为凌驾于社会生活博弈的超然之物，而是让博弈

又多了一个权力者的不公平参与。真正的法律是在顾及社会各方利益

博弈均衡的结果，在社会博弈中具有独立性，不参与博弈。同时，合

理的法律必须又要有强制性，不管是对社会大众还是掌握权力的人，

都拥有至高无上的权威，所有的人都必须遵守法律的约定，包括制定

与执行法律的人，否则必然要受到无法逃脱的惩罚。

在这样一种法治环境中，法律必然可以改善囚徒困境。我们来看

这样一个例子。如所前述，我们假定执法人员独立于博弈之外，有公

司A与公司B是商业上的合作伙伴，公司A经常向公司B购买原材

料，由于两家公司在不同的城市，于是两个公司经过谈判之后签定买

卖合同，一般在一周之后的那一天，公司A打现金打入公司B的银

行帐户，公司B则发货到公司A，若违约则处于2~5倍罚款。实际

上，如果公司A与公司B都是理性人，那么他们的合作就是一个有

限次数重复博弈，在社会不存在法律的情况下，在两个公司任何一次

交易中都有可能有某一家公司不遵守合同，逃款或逃货，即使公司A

现金充裕，而公司B货源充足。所谓的熟人欺诈也是这个道理。然

而，在我们理想的法律环境下，公司A和B最佳策略都是合作。不

妨假设公司A与公司B每年的交易都有十几次，平均每笔生意为100

万，若违约则罚款200万。见下图，公司A与公司B合作时，双方

收益均为20万（指公司A与公司B的利润）；公司A付款，而公司

B不发货，A损失100万，B收益100万；公司A不付款，公司B

发货，公司A收益120万（其中包含20万的利润），公司B损失80

万（指公司B货物的成本，也就是收入减去利润）；公司A不付款，

公司B不发货，双方收益为零。当然，这里还要说明的是这个博弈

中没有考虑商业信誉的问题，商誉是社会道德中的问题，后面笔者会

详细讨论。

20

20

120

-80

公司B

合作

不合作

合作

-100

100

0

0

很显然这是一个有限次重复博弈的囚徒困境，注意到前文所介绍

的模型都是对称的，这个博弈则是非对称博弈，这更加贴切于日常生

活的真相。在没有法律背景的条件下，双方选择不合作是自然的纳什

均衡点。然而引入强制性的法律则不同，这时他们所签合同具有法律

效应，一旦有一方违约，另一方有权罚款其200万元，并且法院可以

强制实行。在这种情况下，两个“囚徒”，也就是公司自然都会采取

合作策略，完成合同对各方所要求的行动。简单说来，就是法律改变

了两个公司博弈的均衡结果。

霍布斯认为，国家以法律形式规定对某种行为如“违约”采取惩

罚措施，但是如果惩罚措施不力，即使扣除惩罚的成本，行动者从“违

约”策略中获取的好处大于他采取“守信”策略所带来的好处，那么

国家的法律措施是无效率的或者说是低效率的。因此国家法律的制定

应以抑制对他人的危害行动为原则。这就是法律制定的第一条原则：

效率原则。效率原则是从对社会的整体考虑分析得出的，从这个意义

上讲，法律越严格越好，越严格越有效率。强制性有效率的法律之重

要性还可从冷战时期美苏两个超级大国40多年的军备竞赛中得出反

证。尽管他们双方签定一些制止军备竞赛的协议，但是由于缺乏一个

世界性的公平合理又具有强制性的法律环境，其结果仍然是陷入无法

解脱的囚徒困境。类似的还有各国的贸易保护主义的永恒倾向也很能

不合作

图3 法律模型

说明这个问题，除非某一天出现全世界的国家都得到统一，建立一个

全球性政府才可以彻底解决这些国与国之间的囚徒困境问题。

法律制定的第二条原则是，法律对犯法者的惩罚应以与犯法者给

社会或他人造成的危害相等为原则，这就是公平原则。用简单的一句

话说，法律惩罚太重对犯法者不公平，惩罚太轻则对社会或他人不公

平。

因此在不同的国家以及在同一个国家的不同时期，对这两个原则

的是不同的。法律制定的这两条原则要根据不同时代，不同社会的具

体状况而各有侧重。前面一小节提到目前一些国内的经济学家否认国

家法律与立法执法的重要性，否认反腐败的重要性，导致目前经济混

乱的观点是非常荒谬的。从法律制定的第一条原则来看，违反契约的

惩罚越是严厉并可信，则博弈者违约的可能性越小，这是路人皆知的。

从法律制定的第二条原则来看，权力对法律公平性的侵害有损法律的

权威性与公正性，这也是众所周知的。笔者相信，这些学者的素养应

该比绝大部分人要强很多，自然他们也应该能够理解甚至是精通这些

基本常识。可见他们公开所宣称的观点只能说明其赤裸裸的掠夺社会

财富、剥夺绝大部分人公平权利的无耻性。“乱世用重典”，通过博

弈分析，笔者认为采用如同香港70年代严厉的反腐政策或新加坡一

样的严刑峻法比较适宜目前的社会状况。

6．猴子的故事与道德约束

与当代某些无耻之尤的中国经济学家不同，亚当·斯密在写完《国

富论》与市场这只“看不见的手”之后，转而又写了本《道德情操论》，

专门论述个人道德与社会道德是维持市场经济的基本要素之一。亚

当·斯密告诉我们：最商业化的社会，也是最讲究道德的社会，比如

16世纪时荷兰人就比英国人值得信赖，当时荷兰的商业比英国发达，

反之亦然。

人类道德的产生一般有两种解释：一种是纯文化因素起作用，有

些国家道德程度高，有些国家则低。如北欧人之间的道德感高于意大

利人的道德感。或者是宗教信仰的原因，怕上帝惩罚你，所以有宗教

信仰的人道德感就要强于一般人。如在美国，教会的人道德感比较强，

因为他们认为若不道德，将来会进地狱。这种解释中，道德是外界强

加于人们的，使人们不违约。而笔者主要想给出的是第二种解释，即

博弈论是如何解释道德的。

道德可以打破囚徒困境的难题，化解个人理性与社会群体理性的

矛盾，维系整个社会经济体系的稳定与发展。关于这一点，我们来看

一个猴群博弈的故事。这个故事这两年一直流传于中文网络各大论坛

与社区。

有一群猴子被关在笼子里，在笼子里的上方有一条绳子，绳子拴

着一个香蕉，绳子连着一个机关，机关又与一个水源相连。猴子们发

现了香蕉，有猴子跳上去够这个香蕉，当猴子够到时，与香蕉相连的

绳子带动了机关，于是一盆水倒了下来，尽管够到香蕉的猴子吃到了

香蕉，但其他猴子被淋湿了，这个过程重复着，猴子们发现，尽管有

猴子吃到香蕉，但吃到香蕉的猴子是少数，而其余的大多数猴子都被

淋湿。经过一段时间，有一伙猴子自觉地行动起来，当有猴子去抓香

蕉时，它们便揍那个猴子。每当有猴子去取香蕉，就有其他的猴子因

愤怒而自动地去撕咬那个猴子，久而久之，猴子们产生了合作，再也

没有猴子敢去取香蕉了。

在这个故事里，猴子间产生了“道德”。如果这群猴子构成一个

社会，它们也繁衍下一代，它们会将它们的经历告诉下一代，渐渐地

猴子们便认为取香蕉的后果对其他猴子不利，从而认为去取这个香蕉

是“不道德的”，它们也会自动地惩罚“不道德的”猴子。当然这只

是一个故事，但这个博弈故事却反映了人类的道德的产生过程。

霍布斯认为人类在没有任何约束的自然状态中，就是“人与人之

间像狼与狼一样”，是“每个人对每个人的战争”。在这种状态中，每

个人都力图保护自己的利益，并企图占有别人的东西，此时，每个人

是每个人的敌人。此时没有任何规则，没有财产，没有正义或不正义，

只有战争。武力与欺诈是战争中的两大基本德性。因此人类在自然状

态下无法产生文明。

与国家一样，道德也是对某些不合作行动的惩罚机制。这种机制

的出现使得人类从囚徒困境中走出来。人的正义与非正义的观念产生

了道德感。

道德感自然地使得人们对不道德的或不正义的行为谴责或者对不

道德的人不采取合作，从而使得不道德的人遭受损失。这样，社会上

不道德的行为就会受到抑制。因此只要社会形成了道德或不道德，或

者正义或非正义的观念，就自动地产生了调节作用。

当然，道德约束有其自身的局限性。它对不道德的行为的抑制是

有限度的，当不道德的行为带来的利益大于道德的满足时，道德约束

的作用便失效。举个很简单的例子，拾金不昧是理所当然的美德，当

捡到别人丢的100块钱时还给失主不仅有道德满足感，还会受到社会

的表扬，建立起自己的美誉；若不及时交换失主并很容易被发现的话，

则会受到严厉的谴责并失去社会信誉。假想一下，当检别人遗失的价

值上百万的古玩名画时，极大的可能是归为己有。这是因为他道德的

满足感与可能所受谴责的效用远小于其所检物品给他带来的效用。这

种情况下，道德作用失效了，法治就不可替换地代替了道德。

7．爱克斯罗德试验、针锋相对的策略

如果没有外部强制力，这时囚徒困境中两个参与者采取什么样的

策略才可以更好的维持合作的稳定性呢？这是一个非常实际的问题，

生活中经常见到国家与国家之间达成协议，这种协议我们在前面解释

过，由于不存在一个世界性的政府，往往约束力很小。

对于这个问题，有这样一种答案。如果一方采取不合作的策略另

一方随即也采取不合作策略并且永远采取不合作策略，在博弈论里面

称之为触发策略（Trigger strategy），或称冷酷策略。如果对方知道你

的策略是触发策略，那么对方将不敢采取不合作策略，因为一旦他采

取了不合作策略，双方便永远进入不合作的困境。因此，只要有人采

取触发策略，那么双方均愿意采取合作策略。但是这个策略面临着这

样一个问题：如果双方存在误解，或者由于一方发生选择性的错误，

这个错误是无意的，那么结果将是双方均采取不合作的策略。也就是

说，这种策略不给对方一个改正错误或解释错误的机会。

在前文提到的美国密西根大学罗伯特·爱克斯罗德教授那个著名

的博弈论试验中给出了这个问题更好的答案。爱克斯罗德邀的这些人

都是政治学家、数学家、经济学家、社会学家。获胜者是加拿大多伦

多大学的拉波波特写出的针锋相对（tit-for-tat）策略。说穿了，所谓

针锋相对策略，就是胡萝卜加大棒的原则。

爱克斯罗德在开始研究合作之前，设定了两个前提：一、每个人

都是自私的；二、没有权威干预个人决策。也就是说，个人可以完全

按照自己利益最大化的企图进行决策。在此前提下，合作要研究的问

题是：第一、人为什么要合作；第二、人什么时候是合作的，什么时

候又是不合作的；第三、如何使别人与你合作。

这个游戏共分两轮。第一轮游戏有14个程序参加，再加上爱克

斯罗德自己的一个随机程序(即以50%的概率选取合作或不合作)，运

转了200次。结果得分最高的程序是加拿大学者罗伯布编写的针锋相

对策略的游戏程序。这个程序的特点是，第一次对局采用合作的策略，

以后每一步都跟随对方上一步的策略，你上一次合作，我这一次就合

作，你上一次不合作，我这一次就不合作。爱克斯罗德还发现，得分

排在前面的程序有三个特点：第一，从不首先背叛，即“善良的”；

第二，对于对方的背叛行为一定要报复，不能总是合作，即“可激怒

的”；第三，不能人家一次背叛，你就没完没了的报复，以后人家只

要改为合作，你也要合作，即“宽容性”。

为了进一步验证上述结论，爱克斯罗德决定邀请更多的人再做一

次游戏，并把第一次的结果公开发表。第二次征集到了62个程序，

加上他自己的随机程序，又进行了一次竞赛。结果，第一名的仍是针

锋相对策略。，爱克斯罗德总结这次游戏的结论是：第一，针锋相对

方法仍是最优策略。第二，前面提到的三个特点仍然有效，因为63

人中的前15名里，只有第8名的哈灵顿程序是“不善良的”，后15

名中，只有1个总是合作的是“善良的”。可激怒性和宽容性也得到

了证明。此外，好的策略还必须具有的一个特点是“清晰性”，能让

对方在三、五步对局内辨识出来，太复杂的对策不见得好。针锋相对

策略就有很好的清晰性，让对方很快发现规律，从而不得不采取合作

的态度。

针锋相对策略的优越性向我们充分展示了一个纯粹自利的人何

以会选择善，只因为合作是自我利益最大化的一种必要手段。比如在

爱情中的博弈原则应该是：善意而不是恶意地对待恋人；宽容而不是

尖刻地对待恋人，关键是能够彼此宽容，既宽容对方的缺点；强硬而

不是软弱地对待恋人，就是要在我永远爱你的善意的前提下，做到有

爱必报，有恨也必报，以眼还眼，以牙还牙，以其人之道，还治其人

之身，比如对恋人与其他异性的亲热行为，要有极其强烈的敏感与斩

钉截铁地回报；简单明了而不是山环水绕地对待恋人，在博弈中过分

复杂的策略使得对手难于理解，无所适从，因而难以建立稳定的合作

关系，明晰的个性、简练的作风和坦诚的态度倒是制胜的要诀。

8.合作、利他主义与爱克斯罗德试验的局限

我们再进一步看这个试验中选手策略的演化方向。假设对策者所

组成的策略群体是一代一代进化下去的，进化的规则包括：一，试错。

人们在对待周围环境时，起初不知道该怎么做，于是就试试这个，试

试那个，哪个结果好就照哪个去做。第二，遗传。一个人如果合作性

好，他的后代的合作基因就多。第三，学习。比赛过程就是对策者相

互学习的过程，针锋相对策略好，有的人就愿意学。在爱克斯罗德的

试验中，第一轮比赛中的63个对策者，谁在第一轮中的得分高，他

在第二轮的群体中所占比例就越高。这样，群体的结构就会在进化过

程中改变，由此可以看出群体是向什么方向进化的。

试验结果很有趣。针锋相对策略原来在群体中占1/63，经过1000

代的进化，结构稳定下来时，它占了24%。另外，有一些程序在进化

过程中消失了。其中有一个值得研究的程序，即原来前15名中唯一

的那个不善良的“哈灵顿”程序，它的对策方案是，首先合作，当发

现对方一直在合作，它就突然来个不合作，如果对方立刻报复它，它

就恢复合作，如果对方仍然合作，它就继续背叛。这个程序一开始发

展很快，但等到除了针锋相对之外的其它程序开始消失时，它就开始

下降了。因此，以合作系数来测量，群体是越来越合作的。

进化试验揭示了一个哲理：一个策略的成功应该以对方的成功为

基础。针锋相对在两个人对策时，得分不可能超过对方，最多打个平

手，但它的总分最高。它赖以生存的基础是很牢固的，因为它让对方

得到了高分。哈灵顿程序就不是这样，它得到高分时，对方必然得到

低分。它的成功是建立在别人失败的基础上的，而失败者总是要被淘

汰的，当失败者被淘汰之后，这个好占别人便宜的成功者也要被淘汰。

那么，在一个极端自私者所组成的不合作者的群体中，针锋相对

策略能否生存呢？爱克斯罗德发现，在得分矩阵和未来的折现系数一

定的情况下，可以算出，只要群体的5%或更多成员是针锋相对策略

的，这些合作者就能生存，而且，只要他们的得分超过群体的总平均

分，这个合作的群体就会越来越大，最后蔓延到整个群体。反之，无

论不合作者在一个合作者占多数的群体中有多大比例，不合作者都是

不可能自下而上的。这就说明，社会向合作进化的趋势是不可逆转的，

群体的合作性越来越大。

在研究中发现，合作的必要条件是：第一、关系要持续，一次性

的或有限次的博弈中，对策者是没有合作动机的；第二、对对方的行

为要做出回报，一个永远合作的对策者是不会有人跟他合作的。

那么，提高团队合作性必须要做到以下8点：要建立持久的关系，

即使是爱情也需要建立婚姻契约以维持双方的合作；要增强识别对方

行动的能力，如果不清楚对方是合作还是不合作，就没法回报他了；

要维持声誉，说要报复就一定要做到，人家才知道你是不好欺负的，

才不敢不与你合作；能够分步完成的对局不要一次完成，以维持长久

关系，比如，贸易、谈判都要分步进行，以促使对方采取合作态度；

不要嫉妒人家的成功，针锋相对策略正是这样的典范；不要首先背叛，

以免担上罪魁祸首的道德压力；不仅对背叛要回报，对合作也要作出

回报；不要耍小聪明，占人家便宜。

爱克斯罗德在《合作的进化》一书结尾提出这么几个结论。第一、

友谊不是合作的必要条件，即使是敌人，只要满足了关系持续，互相

回报的条件，也有可能合作。比如，第一次世界大战期间，德英两军

在战壕战中遇上了三个月的雨季，双方在这三个月中达成了默契，互

相不攻击对方的粮车给养，到大反攻时再你死我活地打。这个例子说

明，友谊不是合作的前提。第二、预见性也不是合作的前提，爱克斯

罗德举出生物界低等动物、植物之间合作的例子来说明这一点。但是，

当有预见性的人类了解了合作的规律之后，合作进化的过程就会加

快。这时，预见性是有用的，学习也是有用的。

当游戏中考虑到随机干扰，即对策者由于误会而开始互相背叛的

情形时，以修正的针锋相对策略，即以一定的概率不报复对方的背叛，

和“悔过的针锋相对策略”，即以一定的概率主动停止背叛。群体所

有成员处理随机环境的能力越强，悔过的针锋相对策略效果越好，宽

大的针锋相对策略效果越差。

爱克斯罗德所发现的针锋相对策略，从社会学的角度可以看作是

一种利他主义，这种行为的动机是个人私利，但它的结果是双方获利，

并通过互惠式利他有可能覆盖了范围最广的社会生活，人们通过送礼

及回报，形成了一种社会生活的秩序，这种秩序即使在多年隔绝，语

言不通的人群之间也是最易理解的东西。比如，哥伦布登上美洲大陆

时，与印地安人最初的交往就开始于互赠礼物。有些看似纯粹的利他

行为，比如无偿损赠，也通过某些间接方式，比如社会声誉的获得，

得到了回报。

但是，爱克斯罗德对博弈者的一些假设和结论使其研究不可避免

地与现实脱节。首先，《合作的进化》一书暗含着一个重要的假定，

即，个体之间的博弈是完全无差异的。现实的博弈中，对策者之间绝

对的平等是不可能达到的。一方面，对策者在实际的实力上有差异，

双方互相背叛时，可能不是各得1分，而是强者得5分，弱者得0分，

这样，弱者的报复就毫无意义。另一方面，即使对局双方确实旗鼓相

当，但某一方可能怀有赌徒心理，认定自己更强大，采取背叛的策略

能占便宜。爱克斯罗德的得分矩阵忽视了这种情形，而这种赌徒心理

恰恰在社会上大量引发了零和博弈。

第四章 “智猪博弈”：对诸多现象的解释

1．“智猪博弈”的故事

博弈论里面有个十分卡通化的博弈模型，叫做“智猪博弈”（Pigs’payoffs）。整个故事是这样的：笼子里面有两只猪，一只大，一只小。

笼子很长，一头有一个按钮，另一头是饲料的出口和食槽。按一下按

钮，将有相当于10个单位的猪食流进食槽，但是按按钮以后跑到食

槽所需要付出的“劳动”，加起来要消耗相当于2个单位的猪食。如

果两只猪同时按按钮，再一起跑过去吃，大猪吃到7个单位，小猪吃

到3个单位，减去劳动耗费各自2个单位，大猪净得益5个单位，小

猪净得益1个单位。大猪按按钮，小猪等着先吃，大猪再赶过去吃，

大猪吃到6个单位，去掉按按钮的劳动耗费2个单位净得4个单位，

小猪

小猪也吃到4个单位。如果小猪按按钮，大猪等着先吃，大猪吃到9

个单位，小猪吃到1个单位，再减去按按钮的劳动耗费，小猪是净亏

损1个单位。如果大家都等待，结果是谁都吃不到。可以得出结论，

唯一解是大猪按按钮，小猪等待。

1

5

4

4

-1

9

0

0

我们把这个博弈用矩阵的形式表达，见上图。根据这个矩阵，我

们知道“等待”是小猪的优势策略，“按按钮”是小猪的劣势策略。

先把小猪的劣势策略消去。现在来看大猪。由于小猪有“等待”这个

优势策略，大猪只剩下了两个选择：等待一份不得；按按钮得到4份。

所以“等待”就变成了大猪的劣势策略。把它也删去，就得到智猪博

弈最后出现的的结局：大猪来回在猪槽的两端奔波，小猪则坐享其成。

其结论似乎是，在一个双方公平、公正、合理和公享的竞争环境中，

有时占优势的一方最终得到的结果却有悖于他的初始理性。这种情况

在现实中比比皆是，譬如在北约内部，美国承担了防务开支很大比例

的份额，大大便宜了西欧和日本。美国经济学家曼库尔·奥尔森将这

一现象称为“小国对大国的剥削”。

大猪

按

等

等

按

图4 智猪博弈

智猪博弈告诉我们，谁先去按下按钮，就会造福全体，但多劳并

不一定多得。在现实生活中，很多人都只想付出最小的代价，得到最

大的回报，争着做那只坐享其成的小猪。 “一个和尚挑水喝，两个

和尚抬水喝，三个和尚没水喝”说得正是这样一个道理。这三个和尚

都想做小猪，却不想付出劳动，不愿承担起大猪的义务，最后导致每

个人都无法获得利益。

智猪博弈这一模型可以扩展到生活中的各个方面，不论是在战争

中还是商业竞争中，我们都会看到类似于智猪博弈这种情况的存在。

在办公室的人际冲突中，有一些人会成为不劳而获的“小猪”，而又

另一些人充当了费力不讨好的“大猪”。有这样一个真实的故事深刻

反映了智猪博弈的哲理。某大学公开招聘两名教授，一个是教经济学

的，一个是教会计学的。经过层层选拔，最终有两人获得机会，姑且

称之为A教授和B教授。接下来就是一个让所有人想不通但现实得不

能再现实的选择过程。会计学教授的工资是5000元/月，而经济学教

授的工资是3500元/月。A、B两教授具有相同的学历背景--会计学

硕士。同时又都有经济学的教学经验，A授的会计学教学经验优于B

教授。依一般人的想法，知识就是金钱，知识越多，工资越高，A教

授理所当然的会获得会计学教授职位。这就是我们这些聪明人的天真

之处，殊不知现实并非如此。因为B教授知道市场行情，而且知道到

了目前，不可能有新的竞争者加入。因此，在与教务主任谈判时，极

力否认自己具有经济学的教学经验，甚至说如果让他去讲授经济学会

误人子弟，与其这样，自己宁可不要这分工作。而A教授为了证明自

己的能力，一开始就合盘托出，甚至大谈特谈自己的经济学教学经验。

事情到此为止，我想每个人都看出了门道，学校不可能重新招聘，而

两个教授也都不可能随便丢掉到手的美差。最终的结果就是B教授获

得了会计学的教授职位，而A教授只好退而求其次，教授经济学。

事实上，这样的情况在企业里比比皆是。因为我们什么都缺，就

是不缺人，所以每次不论多大的事情，加班的人总是越多越好。本来

一个人就可以做完的事，总是会安排两个甚至更多的人做。“三个和

尚”的现象这时就出现了。如果大家都耗在那里，谁也不动，结果是

工作完不成，挨老板骂。这些常年在一起工作多年的战友们，对对方

的行事规则都了如指掌。“大猪”知道“小猪”一直是过着不劳而获

的生活，而“小猪”也知道“大猪”总是碍于面子或责任心使然，不

会坐而待之。因此，其结果就是总会有一些“大猪们”过意不去，主

动去完成任务。而“小猪们”则在一边逍遥自在，反正任务完成后，

奖金一样拿。

智猪博弈用句通俗的话来形容就是“枪打出头鸟”。一个很常见

的现象就是在企业中，不论国企还是民企或是外企，在企业内部总会

存在各种各样的小团体，套用组织行为学的专业术语来说就是存在各

种非正式组织。而每一个团体都代表了一部分人的利益，因此不可避

免的会产生冲突。这时，每个团体都会推选出各自的代言人。这些代

言人是为集体利益（如争取加薪或增加福利等）做出积极行动的领头

人。但我们这时会发现，被推选为代言人的总是那些胸无城府，但又

总是给人以积极形象的人。而群体活动的最大受益者“小猪”则永远

躲在幕后。活动成功了，他们可以不伤皮毛的优先分到一杯羹；如果

失败了，他们也可以发表一通与我无关，我是受害者之类的演讲，让

“大猪”成为永远的牺牲者。

2“智猪博弈”与激励机制设计

“智猪博弈”给了竞争中的弱者以等待为最佳策略的启发同时，

也反映了一种“搭便车”现象。 “搭便车”的现象在现实中大量存

在，在企业的运营过程中也不乏其例。很多企业的一般员工甚至中层

管理者工资、福利也不算低，但依然缺乏工作能动性，不能创造优异

的绩效，很多事情还要亲力而为。对于社会而言，因为小猪未能参与

竞争，创造价值，小猪“搭便车”时的社会资源配置的并不是最佳状

态。为使资源最有效配置，规则的设计者是不愿看见有人搭便车的，

政府、公司都是如此。智猪博弈告诉我们一个企业制度和流程的重要

性，以及不好的规则对公司带来的影响。这就要求规则的设计者应清

楚、慎重地考虑规则制定的前瞻性、适应性和高效性。

能否完全杜绝“搭便车”现象，就要看游戏规则的核心指标设置

是否合适。“智猪博弈”的核心指标一般来说有两个：食物数量、按

钮与食槽之间的距离。

那么，如果改变这两个关键条件，“搭便车”的现象会不会杜绝

呢？

首先来看看减量方案。食物只有原来的一半分量，也就是5个单

位的食物。这种情况下，小猪大猪都不去按按钮。小猪去按按钮，大

猪将会把食物吃完；大猪去按按钮，小猪将也会把食物吃完。谁去按

按钮，就意味着为对方嫁衣裳，所以谁也不会有按按钮的动力。如果

目的是想让两只猪去按按钮，这个制度的设计显然是非常失败的。

其次再来看看增量方案。食物是原来的两倍分量，也就是20个

单位的食物。结果是小猪、大猪都会去抢着去按按钮。谁想吃，谁就

会去按按钮。因为对方不可能一次把食物吃完，小猪和大猪相当于生

活在应有尽有的天堂，当然它们的竞争意识也不会得到提高。对于制

度设计者来说，这个制度的成本提高了一倍，因为可以不费心地就可

以得到所需要的食物，自然两只猪都不会有多少动机去增加按按钮的

数量。这个制度的设计明显激励作用不足。

最后再来看看移位方案。考虑到问题的关键是移位，接下来我们

探讨一下因移位而产生的几种改变方案。

其一，移位并减少食物投放量。食物只有原来的一半分量，但同

时将食槽与按钮之间的距离缩短。这种情况下，小猪和大猪都在拼命

地抢着踩踏板。等待者不得食，而多劳者多得。每次的收获刚好消费

完。

其二，移位并增加食物投放量。正常情况移位用不着增量，大猪

小猪都会去踩踏板。如果适当增量，成员会快速成长，小猪会长大，

大猪会出栏，效益就会增长。不过需要把握成本增加的度，适当的增

量更符合组织与个人的需求。

其三，移位但不改变食物投放量。由于食槽与按钮之间的距离缩

短，去按按钮的劳动量减少，大猪小猪都会争着去按按钮。如果把按

按钮的次数增加，吃到的食物会更多，对食物的不懈追求，将驱动合

作机制的形成和生产效率的提高。对于游戏设计者，这是一个最好的

方案。成本不高，但收获最大。

智猪博弈制度规则的改变对于企业的经营管理者而言，就是采取

不同的激励方案，对员工积极性调动的影响也是不同的，并不是足够

多的激励就能充分调动员工的积极性。比如企业实行职工全员持股的

方案，结果如第二个方案一样，人人有股不但没有起到相应的激励作

用。

同样的，企业在构建战略性激励体系过程中，也需要从目标出发，

设计相应的合理方案。一是，根据不同激励方式的特点，结合企业自

身发展的要求，准确定位激励方案的目标和应起到的作用。二是，根

据激励方案的目标和应起到的作用，选择相关激励方式，并明确激励

的对象范围和激励力度。

扩而大之，从整个社会来讲，自身需求大的群体，比如现在媒体

经常提及的弱势群体，他们往往才是社会生产力推动的主力。换句话

说，要迅速提高整个社会的生产力水平，就需要有一个自身具有很大

消费需求的群体，并且需要给他们一定程度的奖励。第三种改变方案

反映的就是这种情况，方案中降低了取食的成本，在现实中，也可以

等同于增加了对取食者的奖励。

3．企业战略与“智猪博弈”

价格竞争作为市场经济实行优胜劣汰、优化资源配置的一种

手段，起着独特的作用。但在一些行业除了有大中型的公司以外还同

时存在着一些管理规范、运作良好的小公司。那么在两个企业实力存

在差距的情况下而对价格竞争时，小企业的生存反展与其所选择的策

略有着密不可分的关系。

我们都知道，“智猪博弈”的结果依赖于大猪的行为。如果小猪

去按动按钮。大猪当然乐于等待在食槽旁吃掉9个单位的猪食。如果

小猪等待，那么大猪将先去按动按钮再跑回来以获得相当于4个单位

的猪食，这总比肚子等待要好。对小猪来说，情况非常清楚，无论大

猪如何行动，它最好是等在食槽旁边。因此这个博弈的均衡结果就是：

每次都是大猪去按动按钮，小猪先吃，大猪再赶来吃，只有这样大猪

小猪才可以共同生存。

在实力悬殊公司之间的价格竞争策略也是这个道理。在商业竞争

中，如果公司是弱小的一方，则可以选择如下策略：

首先是等待，静观其变。允许市场上占主导地位的品牌开拓本行

业所有产品的市场需求。将自己的品牌定位在较低价格上，以享受主

导品牌的强大广告所带来的市场机会。

其次是不要贪婪，妄图将“大猪”应得的那份也据为己有。只要

主导品牌认为弱小公司不会对自己形成威胁，它就会不断创造市场需

求。因此公司可以将自己定位在一个引起不了主导品牌兴趣的较小的

细分市场，以限制自己对主导品牌的威胁。

如果公司是“智猪博弈”中的大猪，在行业市场中占主导地位，

则可采取以下策略：

首先要接受小公司。作为主导品牌，加强广告宣传，创造和开拓

对行业所有产品的市场需求才是真正的利益所在。不要采取降价这种

浪费资源的做法与小企业竞争，除非它对公司形成了真正的威胁。正

是小企业采取的低价格阻止了潜在进入者的涌入。对威胁的限制要清

楚：如果小企业发展壮大到了构成威胁的程度，大公司就应该迅速做

出进攻性的反应，并且让小企业清楚地知道它们在什么样的规模水平

之下才是可以被容忍的，否则就会招致大公司强有力的回击。如果小

公司知道对它们的限制，也就不会再有兴趣超越这种限制。

当然“大猪”“小猪”的共同生存是有条件的。“智猪博弈”说明

了在某个市场上一个占主导地位、控制着市场的公司和它的一个较小

的竞争对手之间可能发生的竞争情况。这取决于占主导地位的公司如

何看待这个较小的竞争对手对它的威胁程度。“智猪博弈”中“共同

生存”的均衡结果只有在大猪的食物份额没有受到小猪严重威胁时才

会出现。

70年代末80年代初，美国市场上私人标签（Private label，非品

牌产品）的软饮料质量虽低劣，但价格很便宜，因此仍然能够占有较

低的市场份额。可口可乐公司和百事可乐公司最初能够容忍这些私人

标签软饮料的存在，因为它们的威胁有有限的。可没过多久，一家主

要的私人标签软饮料供应商Cott公司通过挑衅性的定价和较高的质

量，从一只仅有较低市场份额的地区品牌的“小猪”，成为一个拥有

1/3市场份额的、与两大可乐公司旗鼓相当的竞争者。此时，可口可

乐公司和百事可乐公司通过降低价格这种进攻性的战略行动，抢占了

私人标签软饮料的市场份额，这些公司包括Scott公司在瞬间土崩瓦

解。

总而言之，通过运用“智猪博弈”模型对两个规模与实力存在较

大差距的竞争对手之间价格战的情况进行分析可以看到，竞争双方应

对自己在竞争博弈中的地位和作用有一个清醒的认识，这一点非常重

要。认清自己真正的利益所在，避免残酷的价格战的发生，两个地位

相去甚远的对于最终能够达成一种和平的生存模式：共同生存。

4．证券市场中的“智猪博弈”

金融证券市场是一个群体博弈的场所，其真实情况非常复杂。在

证券交易中,其结果不仅依赖于单个参与者自身的策略和市场条件，

也依赖其他人的选择及策略。

在“智猪博弈”的情景中，大猪是占据比较优势的，但是，由于

小猪别无选择，使得大猪为了自己能吃到食物，不得不辛勤忙碌，反

而让小猪搭了便车，而且比大猪还得意。这个博弈中的关键要素是猪

圈的设计，即按按钮的成本。

证券投资中也是有这种情形的。例如，当庄家在底位买入大量股

票后，已经付出了相当多的资金和时间成本，如果不等价格上升就撤

退，就只有接受亏损。所以，基于和大猪一样的贪吃本能，只要大势

不是太糟糕，庄家一般都会抬高股价，以求实现手中股票的增值。这

时的中小散户，就可以对该股追加资金，当一只聪明的“小猪”，而

让“大猪”庄家力抬股价。当然，这种股票的发觉并不容易，所以当

“小猪”需要忙碌的就是发现有这种情况存在的猪圈，并冲进去当聪

明的小猪。

从散户与庄家的策略选择上看，这种博弈结果是有参考意义的。

例如，对股票的操作是需要成本的，事先、事中和事后的信息处理都

需要金钱与时间成本的投入，如行业分析、企业调研、财务分析等，

一旦已经付出，机构投资者是不太甘心就此放弃的。而中小散户，不

太可能事先支付这些高额成本，更没有资金控盘操作，因此只能采取

小猪的等待策略。等到庄家动手为自己觅食而主动出击时，散户就可

以坐享其成了。

股市中，散户投资者与小猪的命运有相似之处，没有能力承担炒

作成本，所以就应该充分利用资金灵活、成本低和不怕被套的优势，

发现并选择那些机构投资者已经或可能坐庄的股票，等着大猪们为自

己服务。由此看到，散户和机构的博弈中，散户并不是总没有优势的，

关键是找到有大猪的那个食槽，并等到对自己有利的游戏规则形成时

再进入。

遗憾的是，在股市中，很多作为“小猪”的散户不知道要采取等

待策略。让“大猪”们去表现，在“大猪”们拉动股票价格后从中获

取利润，才是“小猪”们的最佳选择。作为“小猪”，还要学会特立

独行。行动前，不用也不需要从其他“小猪”那里得到肯定；行动时，

认同且跟随你的“小猪”越多，则你出错的可能也就越大。简单地说，

就是不要从众，而是跟随“大猪”。

当然股市中的金融机构要比模型中的大猪聪明的多，并且不守游

戏规则，他们不会甘心为小猪们按按钮。事实上，他们往往会选择破

坏这个博弈的规矩，甚至重新建立新规则，比如把按钮放在食槽旁边，

或者可以遥控，这样小猪们就失去了搭便车的机会。例如，金融机构

和上市公司串通，散布虚假的利空消息，这就类似于按按钮前骗小猪

离开食槽，好让自己饱餐一顿。

当然金融市场中的很多“大猪”也并不聪明，他们的表现欲过强，

太喜欢主动地创造市场反应，而不只是对市场做出反应。短期来看，

他们可以很容易地左右市场，操纵价格，做胆大妄为的造市者。这些

“大猪”们并不知道自己要小心谨慎、如履薄冰，他们不知道自己的

力量不如想象的那样强大到可以无敌于天下。自然而然地，每一年都

会有一些高估自己的“大猪”倒下，幸存的“大猪”在经过优胜劣汰

之后会变得更加强壮。不过，无论是多么强壮的“大猪”，只要过于

自信、高估自己控制市场的能力，总会倒下。

俗话说“家家有本难念的经”,在股市中，“大猪”有“大猪”的

难处，“小猪”有“小猪”的难处。尽管“大猪”“小猪”只要了解自

身处境，采取相应的策略就会成功，然而理性是有限的，确定的成功

总是很难获得。

第五章常见的博弈案例

1．“斗鸡博弈”与“骑虎难下”

试想有两只公鸡遇到一起，每只公鸡有两个行动选择：一是退下

来，一是进攻。如果一方退下来，而对方没有退下来，对方获得胜利，

这只公鸡则很丢面子；如果对方也退下来双方则打个平手；如果自己

没退下来，而对方退下来，自己则胜利，对方则失败；如果两只公鸡

都前进，那么则两败俱伤。因此，对每只公鸡来说，最好的结果是，

对方退下来，而自己不退，但是此时面临着两败俱伤的结果。

不妨假设两只公鸡如果均选择“前进”，结果是两败俱伤，两者

的收益是-2个单位，也就是损失为2个单位；如果一方“前进”，另

外一方“后退”，前进的公鸡获得1个单位的收益，赢得了面子，而

后退的公鸡获得-l的收益或损失1个单位，输掉了面子，但没有两者

均“前进”受到的损失大；两者均“后退”，两者均输掉了面子获得

-1的收益或1个单位的损失。当然这些数字只是相对的值。

如果博弈有唯一的纳什均衡点，那么这个博弈是可预测的，即这

个纳什均衡点就是一事先知道的惟一的博弈结果。但是如果一博弈有

两个或两个以上的纳什均衡点，则无法预测出一个结果来。斗鸡博弈

则有两个纳什均衡：一方进另一方退。因此，我们无法预测斗鸡博弈

的结果，即不能知道谁进谁退，谁输谁赢。

由此看来，斗鸡博弈描述的是两个强者在对抗冲突的时候，如何

能让自己占据优势，力争得到最大收益，确保损失最小。斗鸡博弈中

的参与者都是处于势均力敌、剑拔弩张的紧张局势。这就像武侠小说

中描写的一样，两个武林顶尖高手在华上之上比拼内力，斗得是难分

难解，一旦一方稍有分心，内力衰竭，就要被对方一举击溃。

斗鸡博弈在日常生活中非常普遍。比如收债人与债务人之间的博

弈类似于斗鸡博弈。还如，警察与游行者相遇，最好有一方退下来。

假设债权人A与债务人B双方实力相当，债权债务关系明确，B欠

A100元，金额可协商，若合作达成妥协，A可获90元，减免B债务

10元，B可获10元；如一方强硬一方妥协，则强硬方收益为100元，

而妥协方收益为0；如双方强硬，发生暴力冲突，A不但收不回债务

还受伤，医疗费用损失100元，则A的收益为-200元，也就是不仅

100元债收不回反而倒贴100元，B则是损失了100元。

因此，A、B各有两种战略：妥协或强硬。每一方选择自己最优

战略时都假定对方战略给定：若A妥协，则B强硬是最优战略；若

B妥协，A强硬将获更大收益。于是双方都强硬，企图获100的收益，

却不曾考虑这一行动会给自己和对方带来负效益100。故这场博弈有

两个纳什均衡，A收益为100，B收益为0，或反之，这显然比不上

集体理性下的收益支付，A、B皆妥协，收益支付分别为90、10。也

就是债权人与债务人为追求利益最大化，会选择不合作，从某种意义

上说双方陷入囚徒困境。

尽管在理论上有两个纳什均衡，但由于当今中国信用不健全(如

欠债不还、履约率低、假冒伪劣盛行)，法律环境对债务人有利，可

想而知B会首先选择强硬。因此，这是一个动态博弈，A在B选择

强硬后，不会选择强硬，因为弱采取强硬措施反而结局不好，故A

只能选择妥协。而在双方强硬的情形下，B虽然收益为-100，但B会

预期，他选择强硬时A必会选择妥协，故B的理性战略是强硬。因

此，这一博弈纳什均衡实际上为B强硬A妥协。

欠债还钱博弈是假定A、B实力相当，如实力相差悬殊，一般实

力强者选择强硬。比如在家庭夫妻冲突中，首先退下阵的一般是丈夫。

大部分夫妻怄气或吵架，最终得利的总是妻子。

前面提到的斗鸡博弈如果进一步衍生为动态博弈，会形成这样一

个拍卖模型。拍卖规则是：轮流出价，谁出得最高，谁就将得到该物

品，但是出价少的人不仅得不到该物品，并且要按他所叫的价付给拍

卖方。

假定有两人竞价争夺价值100元的物品，只要双方开始叫价，在

这个博弈中双方就进入了骑虎难下的状态。因为，每个人都这样想，

如果我退出，我将失去我出的钱，若不退出，我将有可能得到这价值

100元的物品，但是，随着出价的增加，他的损失也可能越大。每个

人面临着是继续叫价还是退出的两难困境。

这个博弈实际上有一个纳什均衡：第一个出价人叫出100元的竞标

价，另外一个人不出价（因为在对方叫出100元的价格后，他继续叫

价将是不理性的），出价100元的参与人得到该物品。

一旦进入骑虎难下的博弈，及早退出是明智之举，然而当局者往

往做不到，这就是所谓当局者迷。这种骑虎难下的博弈经常出现在国

家之间，也出现在企业或组织之间，当然个人之间也经常碰到。20

世纪60年代，美国介入越南就是一个骑虎难下博弈。赌红了眼的赌

徒输了钱还要继续赌下去以希望返本，也是骑虎难下博弈，其实，赌

徒进入赌场开始赌博时，他已经进入了骑虎难下的状态，因为，赌场

从概率上讲是肯定赢的。从理论上讲，赌徒与赌场之间的博弈如果是

多次的，那么赌徒肯定输的，因为赌徒的“资源”与赌场的“资源”

相比实在太小了。如果你的资源与赌场的资源相比很大，那么赌场有

可能输的；如果你的资源无限大，只要赌徒有非0的赢的可能性，那

么赌徒肯定会赢的。因此，像葡京这样的赌场要设定赌博数额的限制。

博弈论专家将这里的骑虎难下博弈称为协和谬误。20世纪60年

代，英国和法国政府联合投资开发大型超音速客机，即协和飞机。该

种飞机机身大、设计豪华并且速度快。但是，英法政府发现：继续投

资开发这样的机型，花费会急剧增加，但是这样的设计定位能否适应

市场还不知道；而停止研制将使以前的投资付诸东流。随着研制工作

的深入，他们更是无法作出停止研制工作的决定。协和飞机最终研制

成功，但因飞机的缺陷（如耗油大、噪音大、污染严重等），它不适

合市场，最终被市场淘汰，英法政府为此蒙受很大的损失。在这个研

制过程中，如果英法政府能及早放弃飞机的开发工作，会使损失减少，

但他们没能做到。

2．银行会垮掉吗？

银行挤兑是存款人集中大量提取存款的行为，是一种突发性、集

中性、灾难性的危机。自有银行以来，挤兑现象就相并而存。据载，

世界上最早的两家银行是1272年和1310年在意大利设立的巴尔迪银

行和佩鲁齐银行，均因债务和挤兑问题于1348年倒闭。始于银行挤

兑而爆发的1929～1933年的经济大危机，使美国大约1.1万家银行

倒闭或被兼并，造成金融混乱。20世纪70年代以来，银行危机发生

的频率越来越高，世界上有100多个国家和地区的银行曾发生过银行

挤兑的灾难。

一般来说，在发生大规模金融危机期间，挤兑现象会非常严重，

同时正是由于挤兑国内银行，导致金融危机愈加严重。比如在1998

的东南亚金融危机、俄罗斯金融危机，以及拉丁美洲各国金融危机时，

银行挤兑现象都是非常严重，很多时候正是银行挤兑摧残了雪上加霜

的国家经济。

为了了解银行挤兑，我们来看这样一个简单的例子。这个例子正

反映了银行挤兑现象发生的机理。假设现在有A和B两个朋友，都

借给C朋友100万元人民币做生意，C拿到这200万元在第一年进行

投资，第二年才可以赚得利润。笔者不妨假设第一年的时候，A和B

索要借款，C只能还给两人各70万元，若是A和B并不是那么急着

用钱，给C两年的时间，则C连本带利可以获得280万。

对于A、B两人来说，第一年要回借款，各得70万；其中一个

人要回借款，而另一个人没有去索要，则索要的人先来一步得到100

万本钱，另一个人则只拿到剩下的40万元；如果两人都在第二年才

拿回存款，则各得140万元；在第二年，只有一个人要回借款，另一

个人并没有催着C还钱的情况下，先催款的人得到180万，另一个

人只拿到原来的本钱100万。

这种情况下，就是一个两阶段的动态博弈。见下面两个图。

等待

索款

B

70 70

100 40

40 100

到第二年

140 140

180 100

100 180

140 140

态博弈都是用倒推法进行分析，我们在这里仍然采用倒推法，首

先看第二年时，A和B作为理性人会如何选择行动策略。假如A和B

都将资金借给C用到第二年，这个时候，博弈均衡点是双方都索要回

自己的资金，A和B各得到140万元的还款，利息率高达40％。从博

弈论的角度来看，整个均衡点是A、B两人理性博弈的唯一可能结果。

我们回过头来看，第一阶段也就是本例中第一年双方的博弈情

况。由于在第一年时，双方都不抽回资金的策略将产生第二阶段的均

衡结果，因此，在第一阶段的博弈矩阵可以改写成如下的图。

70

70

40

100

100

140

A

索款

等待

图5 银行挤兑第一年

A

索款

等待

等待

索款

图6 银行挤兑第二年

B

A

索款

等待

等待

索款

B

40

140

在我们假定A和B都是理性人的条件下，第一阶段的纳什均衡点

很明显有两个，一个是双方都索要借款，这时双方都只能拿回70万

元，另一个就是双方在第一年都不索要借款，这时根据我们在第二阶

段的分析，双方各能收到140万元的回报。自然对于A和B来说，后

一个纳什均衡比前一个纳什均衡要好。

遗憾是，并没有什么可以保证A、B双方一定会在第一年不索要

借款。在现实生活中，这个模型中的C就相当于是一家银行，而A

和B就是银行的存款客户。银行挤兑往往是由于谣言四起，存款客

户不再放心将钱放在银行中，纷纷去银行拿回存款，在很短的时间内，

银行又无法筹措大量的现金，最终的结果就是银行倒闭，很多人只能

抽回银行存款的一部分，甚至是一分存款都拿不到。这种情况往往就

是实际生活中许多银行因挤兑风潮倒闭的根源。

由此可见，只有强有力、权威的、有担保能力的政府才可以出面

保证客户资金安全并辟谣，来防止挤兑的发生。同时政府需要建立信

贷制度、保险制度来加强人们的信心，尽量让该模型另一个较好结果

的纳什均衡。

3．如何以弱胜强？

在中国历史上，以弱胜强的战役举不胜数。在现代企业竞争中，

弱小企业打败大企业也是司空见惯的情形。比如在第二次世界大战

图7 银行挤兑第一年

中，德国以最少的兵力最快的速度侵占法国。德国要进攻法国无非有

三种选择：从两国接壤的边境发起进攻；借道比利时和卢森堡；借道

瑞士。由于瑞士是个高山国家，阿尔卑斯山脉贯穿全境，不便于开展

军事行动。所以第三种选择首先被排除，于是，进攻路线的选择就剩

下了两个：从两国接壤的边境发起进攻；借道比利时和卢森堡。法国

修筑了漫长的防线，严阵以待，抵抗的军。然而事实是，1940年5

月10日，德军从卢森堡和比利时东部的阿登森林地区进入法国，撕

开了法国防线，德军于是长驱直入。驻守在法国和比利时边境的英法

联军，一下子被断了后路，被德军包围了。他们一路向后撤，直到大

海边。5月26日一天，英国动员了所有的船只，从法国接回了33.8

万人，这就是著名的“敦克尔刻大撤退”。

我们不妨用博弈论来简单地分析一下当时的法国是否有好的策

略来阻止德国的进攻。假设进攻方德军准备进攻法国，军力是2个师。

而防守的法国军队则有3个师。德军与法军每个师的装备、人员、后

勤等完全相同，自然战斗力相同。不妨假想，德国进攻法军有两个方

向，分别是A、B两个方向。由于一个德军师与一个法军师的战斗力

完全相同，因此两军相遇时，人数居多的一方取胜，战争中都是“易

攻难守”，因此当两方人数相等时，守方获胜。同时，军队的最小单

位为师，不能够再往下分割。只要德军可以突破防线，就算德军胜利；

反之则法军胜利。

由此看来，进攻方德军的战略有两个：

1．两个师集中向法军防线的A方向进攻；

2．兵分两路，一个师向法军防线的A方向进攻，另一个师向法

军防线的B方向进攻；

3．两个师集中向法军防线的B方向进攻。

防守方法军则有四种不同的防守策略：

1．3个师集中防守A方向；

2．2个师防守A方向，1个师防守B方向；

3． 1个师防守A方向，2个师防守B方向；

4．3个师集中防守B方向。

我们依次用排列组合来看罗列双方各种策略组合下的结果，见下

图。

1

2

3

4

1

法军胜利

法军胜利

德军胜利

德军胜利

2

德军胜利

法军胜利

法军胜利

德军胜利

3

德军胜利

德军胜利

法军胜利

法军胜利

这个博弈中，德军没有劣势策略，而法军有劣势策略，很明显，

法军选择第一种策略，也就是派3个师防守A方向劣于第二种策略，

也就是派2个师防守A方向，1个防守B方向。因为，法军选择第二

种策略的任何一个结果斗不比选择第一种策略的结果要差，在图中能

法军策略

德军策略

图8 以弱胜强博弈1

够看出三种结果：德军选择第一种策略时，法军选择第二种策略与第

一种策略相同，都是法军胜利；德军选择第二种策略时，法军选择第

二种策略是法军胜利，而第一种策略则是德国胜利，自然选择第二种

策略要好；德军选择第三种策略时，法军选择第一、第二策略结果相

同，都是德军胜利。由此可见，法军选择第二种策略自然好于第一种。

同理，法军选择第三种策略也好于第四种策略的结局。因此，法军策

略选择种的第一种和第四种都是劣势策略。

劣势策略从理性人的角度来看是法军一定不会采用的策略，德军

知道法军不会选择第一、第四种策略，德军和法军都知道博弈简化成

下图。

2

4

1

法军胜利

德军胜利

2

法军胜利

法军胜利

3

德军胜利

法军胜利

这个简化的博弈中，法军反而没有劣势策略，德军却有一个劣势

策略，也就是第二种策略，选择分兵两路进攻法军防线。很明显，德

军选择第二种策略的结局就是根本不可能胜利，理性的德军自然不选

择这个劣势策略。博弈矩阵得到了进一步的简化见下图。

法军策略

图9 以弱胜强博弈2

德军策略

2

4

1

法军胜利

德军胜利

3

德军胜利

法军胜利

这个时候，德法双方的形势是相同的，即德军尽管在总兵力上劣

于法军，但实际上它只要运用谋略，攻其不备，其获胜的可能与守方

是相同的。在博弈论中，“以弱胜强”道理就是这样。比如在战争中，

总兵力占优势的一方往往并不能保证在某个局部可以获得优势，处于

弱势的一方则可以集中优势兵力，在某一个方向或某一场战斗中取得

胜利，并逐步积累胜利成果达到最终整个战役的胜利。再如在企业竞

争中，也是一样。资本、规模、品牌、人力等都处于劣势的企业，可

以在某个局部市场上，集中自己所有的资源并加以整合，造成细分市

场上对强势企业的优势，从而成为市场竞争的胜家。

4．公共地悲剧

有一个关于牧民与草地的故事，说的是当草地向牧民完全开放

时，每一个牧民都想多养一头牛，因为多养一头牛增加的收入大于其

养成本，明显这是有利可图的。尽管因为平均草量下降，增加一头牛

可能使整个草地的牛的单位收益下降。

法军策略

图10 以弱胜强博弈3

德军策略

虽然对于单个牧民来说，他增加一头牛是有利的。但是如果所有

的牧民都看到这一点，都增加一头牛，那么草地将被过度放牧，从而

不能满足牛的需要，导致所有牧民的牛都饿死。这个故事就是公共资

源的悲剧，即哈定悲剧，最初由英国留学生哈定（GarritHadin）1968

年在《科学》杂志上发表的文章《Tragedy of Commons》(公共策略)

中提出。哈定指出：“在共享公有物的社会中，每个人，也就是所有

人都追求各自的最大利益。这就是悲剧的所在。每个人都被锁定在一

个迫使他在有限范围内无节制地增加牲畜的制度中。毁灭是所有人都

奔向的目的地。因为在信奉公有物自由的社会当中，每个人均追求自

己的最大利益。公有物自由给所有人带来了毁灭。”

比如市场经济中存在着污染，但政府并没有管制的环境，企业为

了追求利润的最大化，宁愿以牺牲环境为代价，也绝不会主动增加环

保设备投资。按照看不见的手的原理，所有企业都会从利己的目的出

发，采取不顾环境的策略，从而进入“纳什均衡”状态。如果一个企

业从利他的目的出发，投资治理污染，而其他企业仍然不顾环境污染，

那么这个企业的生产成本就会增加，价格就要提高，它的产品就没有

竞争力，甚至企业还要破产。这是一个“看不见的手的有效的完全竞

争机制”失败的例证。直到20世纪90年代中期，中国乡镇企业的盲

目发展造成严重污染的情况就是如此。只有在政府加强污染管制时，

企业才会采取低污染的策略组合。企业在这种情况下，获得与高污染

同样的利润，但环境将更好。

中国的经济社会发展与资源环境之间的关系更是印证了哈定的

观点。中国的国家发展战略一波三折。上世纪五十年代，我们学苏联，

走的是低就业、低消费、高消耗、自我封闭的重工业模式。然而，这

个模式并不符合中国人均资源短缺、资本稀缺、劳动力资源丰富的基

本国情，再加上政治动荡，走了一段就走不下去了，使我们延误了发

展的黄金时期。八十年代，我们又学欧美传统的发展模式，用资源高

消耗和生活高消费来刺激经济高速增长，这一模式追求资本生产率与

利润最大化而忽视资源利用率与环境损失。25年后，中国成了世界

上最大的制造业国家，也成了世界上自然资产损耗最严重的国家。45

种主要矿产15年后将剩下6种，5年以后60％以上的石油依赖进口，

我们单位GDP的能耗是日本的7倍、美国的6倍、印度的2.8倍。

单位GDP污染排放量是发达国家平均水平的十几倍，劳动生产率却

是人家的几十分之一。建国50多年来，我们的人口从6亿增长到了

13亿，多了一倍，而可居住的土地由于水土流失从600多万平方公

里减少到300多万，减少了一半。中国在人均GDP400～1000美元时，

出现了发达国家人均GDP3000～10000美元期间出现的严重污染。按

照目前的污染水平，若干年后我们的经济总量翻两番时，污染负荷也

会跟着翻两番。

资源和环境作为公共自由物，是全体国民的公共财产，政府作为

人民大众管理社会事务的工具责无旁贷的负有保护资源环境、实现经

济社会自然协调发展的政治历史使命。针对不少政府官员和学者总是

寄希望于通过技术手段来解决公共地悲剧问题，然而早在20世纪

60～70年代在现代自然科学领域已经形成一种认识，那就是例如人

口问题、核战争及环境污染等问题都只是一个局部问题，而这些是无

法靠技术手段解决的。

要解决公共地悲剧，就必须要明晰公共地产权、牧民之间有效沟

通形成共同愿景、采取违规行为之后的及时惩罚、牧民自身道德素质

的提高、改善牛或者草的品种甚至是牧民也可以换个职业等都是可行

的方法。这些解决方法对我国建设节约型社会也有很大的启发，比如

增加资源环境危机的宣传和教育以形成大众心理暗示，对公共自由物

中的不可再生资源采用国家管理的形式，严格控制使用；对可再生资

源采取委托管理的形式，培育社会力量加以保护，国家起到监督和引

导作用等。

5．少数人博弈与酒吧问题

酒吧问题(Bar problem)是美国人阿瑟(W.B.Arthur)1994年在《美

国经济评论》发表的《归纳论证的有界理性》一文中提出来的。该问

题是说：有一群人，假如总共有100人，每个周末均要决定是去酒吧

活动还是待在家里。酒吧的容量是有限的，也就是说座位是有限的，

如果去的人多了，去酒吧的人会感到不舒服，此时，他们留在家中比

去酒吧更舒服。我们假定酒吧的容量是60人，如果某人预测去酒吧

的人数超过60人，他的决定是不去，反之则去。这100人如何作出

去还是不去的决定呢？

这是一个典型的动态群体博弈问题。这个博弈的前提条件还做了

如下限制：每一个参与者面临的信息只是以前去酒吧的人数，因此他

们只能根据以前的历史数据归纳出此次行动的策略，没有其它的信息

可以参考，他们之间更没有信息交流。

酒吧问题所模拟的有可能是更接近于一个赌博者下注时面临的

情景，比如股票选择、足球博彩。这个博弈的每个参与者都面临着这

样一个困惑：如果许多人预测去的人数超过60，而决定不去，那么

酒吧的人数会很少，这时候作出的这些预测就错了。反过来，如果有

很大一部分人预测去的人数少于60，他们因而去了酒吧，则去的人

会很多，超过了60，此时他们的预测也错了。因而一个作出正确预

测的人应该是，他能知道其他人如何作出预测。但是在这个问题中每

个人预测时面临的信息来源都是一样的，即过去的历史，同时每个人

无法知道别人如何作出预测，因此所谓正确的预测几乎不可能存在。

阿瑟教授通过真实的人群以及计算机模拟两种实验得到了两个

迥异的、有趣的结果。

对真实人群的是实验中，实验对象的预测呈有规律的波浪状形

态，实验的部分数据如下：

周

别

n

n+1

n+2

n+3

n+4

n+5

n+6

n+7

人

数

44

76

23

77

45

66

78

22

从上述数据看，虽然不同的博弈者采取了不同的策略，但是其中

共同点是这些预测都是用归纳法进行的。我们完全可以把实验的结果

图11 真实人群实验

看做是现实中大多数理性人作出的选择。在这个实验中，更多的博弈

者是根据上一次其他人作出的选择而做出这一次的预测。然而，这个

预测已经被实验证明在多数情况下是不正确的。那么，在这个层面上

说明，这种预测是一个非线性的过程。所谓这样一个非线性的过程是

说，系统的未来情形对初始值有着强烈的敏感性，这就是人们常说的

的“蝴蝶效应”：在北京的一只蝴蝶动了一下翅膀，华盛顿就下了一

场大暴雨。

通过计算机的模拟实验，得出了另一个结果：起初，去酒吧的人

数没有一个固定的规律，然而，经过一段时间后，这个系统去与不去

的人数之比接近于60：40，尽管每个人不会固定地属于去或不去的

人群，但这个系统的的这个比例是不变的。如果把计算机模拟实验当

做是更为全面的、客观的的情形来看，计算机模拟的结果说明的是更

为一般的规律。

生活中有很多例子与这个模型是相通的。“股票买卖”、“交通拥

挤”以及“足球博彩”等等问题都是这个模型的延伸。在现行的说法

中，对这一类博弈统称为“少数人博弈。

少数者博弈是改变了形式的酒吧问题，是由一位定居瑞士的名叫

张翼成的中国人在1997年提出的。少数者博弈可以运用于股票市场。

每个股民都在猜测其他股民的行为而努力与大多数股民不同。如果多

数股民处于卖股票的位置，而你处于买的位置，股票价格低，你就是

赢家；而当你处于少数的卖股票的位置，多数人想买股票，那么你持

有的股票价格将上涨，你将获利。而股民采取什么样的策略则多种多

样，而策略的得出完全是根据他们以往的经验归纳出来的，因而类似

于这里的少数者博弈的情况。

少数者博弈中一个特殊的结论不具有普遍意义，即：记忆长度长

的人未必一定具有优势，因为，如果确实有这样的方法的话，在股票

市场上，人们利用计算机存储的大量的股票的历史数据就肯定能够赚

到钱了。但是，这样一来，人们将争抢着去购买存储量大即硬盘空间

大以及计算速度快的计算机了，在实际中人们还没有发现这是一个炒

股票必定赢的方法。

交通拥挤问题的模型也是一个少数者博弈的问题。城市的交通越

来越拥挤，选择行车路线也是不断的博弈过程。在交通高峰期间，司

机面临两条路的选择时，往往要选择没有太多车的路线行走，此时他

宁愿多开一段路程而不愿意在塞车的地段焦急地等待。司机只能根据

以往的经验来判断哪条路更好走，而所有司机都不愿意在塞车的道路

上行走。因此每一个司机的选择必须考虑其他司机的选择。这也是一

个少数者博弈问题。

当然在司机行车的少数者博弈问题中，司机经过多次的选择和学

习，许多司机往往能找到规则性，这是以往成功和失败的经验教训给

他的指引，但这不是必然有效的规则性。在这个过程中，司机的经验

和司机个人的性格起作用。有的司机因有更多的经验而更能躲开塞车

的路段；有的司机经验不足，往往不能有效避开高峰路段；有的司机

喜欢冒险，宁愿选择短距离的路线；而有的司机因为保守而宁愿选择

有较少堵车的较远的路线，等等。最终的路线的拥挤程度就由不同特

点和不同经验的司机的选择所构成。

6．房地产市场的多人博弈

房地产市场是关系到国计民生的金融市场重要组成部分之一。总

体说来，在房地产市场中，政府的作用举足轻重；再次，房地产开发

过程中参与者众多，除政府管理协调市场外，银行等金融机构协调贷

款、融资的作用也不可估量；当然还有房地产市场的主题，开发商与

抱有不同目的的购房者。这说明房地产开发过程中是多方博弈，力量

均衡的过程；房地产开发过程是一个复杂的过程，其参与者多，涉及

面广，个中利益关系复杂难以言表。

为了简化问题，首先来看政府作为市场“裁判”时的情形，即房

地产商与消费者、房地产商与银行等金融机构在房地产开发过程中的

利益博弈。假设政府的宏观政策等不变，市场上仅两个参与主体，即

房地产商与银行等金融机构。银行等金融机构有两种决策方式，即协

作与不协作；房地产开发商也有两种决策，即优质产品与偷工减料，

不难发现这个博弈有两个纳什均衡：金融机构不协作与开发商偷工减

料，金融机构协作与开发商做出优质产品。事实上，上述两种情况都

在不同阶段、不同城市都出现过，当然这也是房地产泡沫产生的原因

之一。

一般来说政府的政策制定与执行需要经历很多时间才能产生效

果，这就是时滞因素。政府在制定政策以后要通过银行等金融机构和

房地产商共同实施，并在实施过程中通过收集各种市场信息的反馈来

修改政策，如此循环往复，同时每一个博弈参与者都明白自己的利益

所在并可以独立作出决策。

这个动态博弈的过程如下：首先，政府根据所收集的市场信息，

选择紧缩或宽松的货币政策以调控市场繁荣程度。接着，银行等金融

机构根据政府出台的政策，揣测政府意图，并结合自己对市场走向的

判断，来增加或减少给房地产开发商与购房者的贷款。最后，房地产

商根据银行等金融机构的操作过程来做出自己的投资规划：扩大投资

规模或缩减投资量。

如果考虑到购房者，那么这个博弈就成了政府、开发商、购房者

和金融机构的四方利益博弈。该博弈模型从国内的大前提下出发，从

政策的制定到最终落实到购房者，讨论其利益的分配及决策。很明显，

购房者在信息获取方面具有劣势，所掌握的信息既不及时，也不全面，

仅仅是一些公开或较公开的信息，并且对于购房者整体而言，相互之

间没有什么沟通能力，没有信息优势，处于房地产市场博弈各方最为

被动的地位。

在这个动态博弈中，我们采用如下方式进行讨论。首先将四方参

与者分为两类，设为A与B。其中A由政府与购房者组成，因为两

者立场较为接近：政府目的是规范市场，以保长治久安；同时，政府

的政策倾向于购房者的获益，公平的市场才不会使购房者盲从，这有

利于规范化市场的形成。而规范化市场能为购房者提供良好的消费环

境，如此形成良性循环，增强政府对市场的操控能力。B由房地产商

与银行等金融机构组成，因为两者有共同的利益基础：房地产商的大

部分资金是由银行等金融机构提供的，银行也是企业，都是以利益最

大化为经营目标，因而这些金融机构监督房地产开发的全过程，并且

拥有大量信息，以增强其监控能力，提高房地产开发过程的合理、规

范操作可能性，预期获得高额回报。又由于房地产的开发上投入的自

有资金也占相当大比重，也不想将项目“烂”在自己手中，但由于其

信息优势，且规模较大，易于操纵市场，并变相哄抬物价，从而形成

卖方市场，损害消费者利益，占有超额利润。

在这种情况下，政府面临两种选择：其一是有所作为，下大力度

规范市场，其二是不作为，任由市场随意变化。同时，购房者也面临

两个选择：其一是正常的根据自己的经济条件合理购房，特别是在房

价居高不下时持币待购，其二是毫无理性可言，盲目购房。房地产开

发商合理合法地开发新项目，或者投机取巧，开发不能保质保量的劣

质品。银行也根据房地产商和政府的操作选择增加贷款以支持房地产

投资或者减少贷款以维护自己的利益。可见，对于政府来说，当市场

混乱，价格失调时，有所作为是一个理性的选择；对于购房者则根据

自身条件购房，不为购置房产尔透支自己的消费能力方为上策。对于

房地产开发商而言合法合理开发新项目，定价适中，满足大部分人的

需求是收益最大的选择。对于金融机构来说，根据国家宏观政策的变

更而改变贷款策略是保持稳定发展的良好方法。

想象一下在这种情况下，在政府的有序管理与金融机构的大力支

持下，开发商能够充分洞察购房者的消费需求，科学规划、设计、建

设、销售楼盘，那消费者自然趋之若鹜。于是，开发商安心赚取利润，

赢得越来越好的市场信誉；消费者购得满意的房屋，心神俱爽，安居

乐业；市场井然秩序，国家宏观经济形势良好。这不就是房地产市场

皆大欢喜的多赢之局。

第六章信息经济学基础

1.信息有价

我们前面所阐释的“囚徒困境”、“智猪博弈”、“斗鸡博弈”等各

种模型都有一个前提条件，那就是博弈双方都有共同知识，也就是博

弈参与者都知道对方所能采用的策略与各种可能发生的结局。在实际

生活中，很多情况下并不是这么理想化。比如，人寿保险公司并不是

投保人真实的身体状况如何，只有投保人自己对自身健康状况才有最

确切的了解；政府官员廉洁与否，一般的公民并不是非常清楚；求职

者向公司投递简历，求职者的能力相对而言只有自己最清楚，公司并

不完全了解；最常见的例子就是买卖双方进行交易时，对交易商品的

质量高低，自然是卖方比买方更加了解。

这种情况在信息经济学中有一个专门的术语，叫做“信息不对

称”。之所以有信息不对称，是因为存在“私有信息”。所谓“私有信

息”，通俗地讲就是在博弈中，如果，某一方所知道的信息而对方并

不知道，这种信息就是拥有信息一方的私有信息。有位专家说，信息

就是信息，既不是物质，也不是精神。这似乎是什么都没说，又似乎

已经说得很正确。广义的说，所谓信息就是消息。对人类而言，人的

五官生来就是为了感受信息的，它们是信息的接收器，它们所感受到

的一切，都是信息。然而，大量的信息是我们的五官不能直接感受的，

人类正通过各种手段，发明各种仪器来感知它们，发现它们。信息可

以交流，如果不能交流，信息就毫无用处。信息还可以被储存和使用。

你所读过的书，你所听到的音乐，你所看到的事物，你所想到或者做

过的事情，这些都是信息。

私有信息，简单地说，如商家的产品是否有严重缺陷的信息，这

样的信息往往只被能接近和熟悉这种产品的人观察到，那些无法接近

这种产品的人却无从了解或难以了解。相反，如果一则信息是大家都

知道的，或者是所有有关的人都知道的，它就叫做“公共信息”或者

“公共知识”。“私有信息”的存在导致了“信息的不对称性”，也就

是某些掌握的信息要多于其他的人。

私有信息的存在是信息不对称情况发生的根本原因。比如一个女

孩面对好几个追求的男生，这些男生的人品、上进心等信息对于这个

女孩来说都是私有信息，女孩与追求的男生之间就存在着信息不对称

的现象，因此这个女孩到底选择哪一个男生往往就带有很大的不确定

性。

私有信息掌握与否也是委托代理关系的重要概念。委托代理关系

的概念来自法律。在法律上，当A授权B代表A从事某种活动时，委

托代理关系就发生了，A称为委托人，B称为代理人。一般的委托代

理关系泛指在任何一种涉及不对称信息的交易（合同、协议）中参与

者之间的经济关系。掌握信息多、处于信息优势的一方称为代理人，

掌握信息少、处于信息劣势的一方称为委托人。简单地说，“知情者”

是代理人，“不知情者”是委托人。

社会是由众多个体构成的，人与人之间时刻发生着各种各样的联

系。由于不对称信息在社会经济活动中相当普遍，所以许多社会经济

关系都可以归结为委托代理关系。例如，政府与企业、股东与经理、

雇主与雇员、消费者与厂家、计算机用户与服务商、信息经纪人与信

息用户、病人与医生等等，他们之间都可以构成委托代理关系。除了

正式的有书面合同（协议）的委托代理关系，以及有口头委托的较为

明显的委托代理关系外，社会经济关系中还有大量的隐含的委托代理

关系，诸如老百姓与政府官员、选民与议员的关系等。

同一种社会经济关系中可能包含有多种不同的委托代理关系。例

如软件生产商与软件用户的关系，对于软件的生产成本、软件性能等

方面的信息，生产商掌握的比用户多，生产商是代理人，用户是委托

人，从这一方面来说是“用户委托生产商进行生产”；对于需求欲望、

支付能力等方面的信息，用户掌握的比生产商多，从这一方面来说又

是“生产商委托用户进行消费”。可见，委托代理关系是与不对称信

息相联系的，针对不同的不对称信息，可以构成不同的委托代理关系，

对于参与各方，我们不能简单地说某一方是委托人、某一方是代理人。

一般来说，私有信息指的是现状，如买卖双方交易商品的质量状

况、追求女孩的男生人品、健康状况、求职者的能力等。总而言之，

私有信息是双方博弈时已存在的事实。在信息经济学中，一般把这种

关于现存事实特征的私有信息，叫做“隐蔽特征”。

前面所说的私有信息造成的信息不对称是一种事前的信息不对

称，举个例子说，消费者到商家去买商品，在购买之前就不清楚商品

质量的好坏。然而，还有一种信息不对称是在一定的环境下，博弈的

一方无法判断并观察到另一方未来的行为。在信息经济学中，这种未

来别人难以判断或观察到的行为这种隐蔽信息，特别称为“隐蔽行

为”。比如，一个民营企业雇佣了一个职业经理人，并授予此人极大

的权力，然而这个资本所有者无法判断并观察到将来这个经理上任之

后是否会偷懒甚至是将公司的利益据为己有。这种由于无法实现全天

侯监督而产生的雇员进行欺骗或偷懒的可能性，就是隐蔽行为。又比

如公务员都宣誓要一心为民、廉洁奉公，但是若无有效的监督机制，

公务员寻租就成了一种隐蔽行为。

简而言之，隐蔽信息分为两大块，是合同前已经发生的和已经存

在的有关事实，就叫做隐蔽特征，是合同后发生的有关事情，就叫做

隐蔽行为。

正是因为参与博弈者掌握的信息并不完全，往往有很多私有信息

的存在，其决策结果必然会有很大的不确定性。所谓“不确定性”，

不管是对未来、现在或过去的任何决策，只要是我们不知道确切的结

果的都具有“不确定性”。不确定性可分为两大类：主观不确定性和

客观不确定性，主管不确定性是指决策者由于有关资料的缺乏而不能

对事物的态度做出正确的判断，而这种不确定性的判断却是其它掌握

资料的人可以有的。例如：消费者对商品的质量不如生产者更为了解，

换句话说，商品质量对于消费者更加具有不确定性。和主观不确定性

相关的信息常常具有不对称性，一些人掌握事物状态的信息，而另一

些人则缺乏事物状态的信息。信息的不对称性可以通过信息的交流和

公开以及寻找而消除；客观不确定性是指事物状态的客观属性本身具

有不确定性，对此，人们可以通过认识去把握不确定性的客观规律，

但是，认识本身并不能消除这种不确定性。

当存在不确定性时，决策者的决策就具有风险。不确定性和风险

有密切的联系，但又是两个不同的概念。不确定性，直观上很容易理

解，一件事情可能出现的结果越多，这件事情就越具有不确定性，结

果越不明确（概率分布越分散），不确定性的存在就越显著。

风险的必要条件是决策面临着不确定性的条件。当一项决策在不

确定条件下进行时，其所具有的风险性的含义是：从事后的角度看，

事前做出的决策不是最优的，甚至是有损失的。决策的风险性不仅取

决于不确定因素之不确定性的大小，而且还取决于收益的性质。所以，

风险通俗地说，就是从事后的角度来看由于不确定性因素而造成的决

策损失。

对个人来说，拥有信息越多，越有可能作出正确决策。对社会来

说，信息越透明，越有助于降低人们的交易成本，提高社会效率。在

绝大部分情况下，我们根本无法掌握影响未来的所有因素，这使得作

确定性的决策变得困难重重。信息本身的价值正在于此。博弈参与者

一旦掌握了更多信息，其决策获得更大收益的可能性就增大。比如，

一个消费者买一部二手手机需要化1000元，而这部手机的真实价值

也许只有500元，如果消费者购买了这部手机，就净损失500元，如

果他和二手手机老板很熟，请老板吃顿饭支出100元，老板决定给这

个消费者一部价值1200元的二手手机，很自然，获取这部手机真实

信息的价值或信息成本就是100元，但是不仅没有亏掉500元，反而

赚了200元，一反一复投入100元的信息成本所得到的收益是

500+200＝700元。

因此，市场参与者的决策的准确性取决于信息的完整性，准确的

决策需要更多信息的支持，所以信息的获取有减少风险的可能性。这

就是说，信息的搜取有可能增加决策者的收益。信息的价值就可以用

获取信息后可能增加的收益来衡量。当然信息的获取需要成本，有的

时候这种成本可能会高到决策者无法承受的境地。

2. 从形象工程谈道德风险

《新京报》2004年9月26号的一篇文章说,建设部官员披露：

中国662个城市、2万多个建制镇中，约有1/5的城镇建设存在“形

象工程”。宽大的马路、宏伟的广场、豪华的政府办公楼等已经，这

些现象无论是在经济发达地区还是落后地区都不同程度地存在。甚至

有的地方，出现一个5万人口的城市，却要修能容纳6万人的大广场

的笑话。

尽管国家出台了各种政策严禁搞“形象工程”，然而很多地方政

府搞形象工程却仍是屡禁不止、层出不穷，并有愈演愈烈之势。地方

政府甘冒政策风险、屡闯中央禁区频频将一些耗资巨大的形象工程立

项上马。

在解释这种现象之前，我们先来看一下什么是“道德风险”（moral

hazard）。所谓道德风险，就是人们利用市场的不成熟或者市场的扭

曲，违背一般社会道德规范而做出符合经济理性的举动。道德风险始

终存在，一个保过险的人在避免风险方面的积极性普遍有降低的可能

性。如果一个人对于他的行为后果只承担一部分责任，或者根本就不

承担任何责任，那他的行为动机就被彻底改变了。

一般地，当交易双方签约后，如果代理人的行动选择会影响委托

人的利益，而代理人选择了什么行动委托人又不知道，委托人利益的

实现就有可能面临“道德风险”。道德风险是指代理人在使其自身效

用最大化的同时损害委托人利益的行为，而代理人并不承担他们行为

的全部后果。

“道德风险”这一术语产生于保险业。在保险市场上，购买了财

产保险的人将不再像以前那样仔细地看管家里的财物，购买了医疗保

险的人可能让医生多开一些不必要的贵重药品，购买了汽车保险的人

可能更不注意保管自己的汽车。在这里，因为人们在投保后的行为保

险公司无法观测到，从而产生了“隐藏行动”，保险公司面临着投保

人松懈责任甚至采取“不道德”行为而导致的损失。

在人身意外伤害保险市场上，谁也不敢保证投保的人为了获得保

险赔偿而不对自己的手脚四肢或眼睛“下手”；在人寿保险上也是如

此，一个购买了大额保险的老人如果知道，万一他在保险期内去世，

可以使子女得到一大笔补偿，他要动“死”的念头，谁也没办法。保

险公司在制度设计上只是应当尽量避免那些可能出现。在这种情况

下，保险公司将很可能由于多数的投保人是高风险类型人士而破产关

门。比如很容易得病的人才投保健康保险，不容易得病的人不参加保

险，于是保险公司需要赔给保户的钱将远远高于他们按照平均得病率

计收的保费，从而带来损失。这里，私有信息的存在，使得投保人可

以就他们本身的身体情况或风险程度说谎。这样一来，从保险公司的

角度看，他们得到很多“逆向选择”得来的投保人。平常人们说“选

择”，都是往好的方面选。保险公司的上述市场活动带来的选择，“选”

出来的是比较不那么好的一群。所以这种选择叫做“逆向选择”。逆

向选择会导致保险公司因风险过高而破产。

实际上，“道德风险”在现实生活中是普遍存在的现象。病人到

医院看病动手术，手术能否成功，大夫在手术过程中的尽心尽责非常

重要；大夫不用心可能导致手术失败；如果不能将正常的手术风险和

医疗事故区分开来，大夫将不承担“不用心”行为导致的全部后果。

这时，病人面临着来自大夫的“道德风险”。学生选修某门课程，任

课老师是否认真负责，这些行动的选择取决于老师，而这些行动又会

影响到学生对知识的掌握。这时，学生即面临来自老师的“道德风险”。

现在我们再来用信息经济学的基本概念，来解释地方热衷于搞形

象工程的原因。在目前的体制下，地方政府官员事实上是一个个存在

相互竞争关系的经济体。无论是改善人民生活也好，显示自身政绩也

罢，推动经济发展是必由之路。而推动经济发展，在一个越来越开放

的环境下，投资尤其是外来的投资的作用越来越明显。因此，各个地

方政府都会将吸引投资作为自己的工作目标。资本方也在寻找婆家，

但是，往哪里投资却是个颇伤脑筋的事。这时，客观上就需要一种机

制来帮资本方进行选择。地方政府热建形象工程，就是为了设计这样

一种机制。宽马路、大广场对投资者来讲，是地方政府有经济实力的

一种信号，有了经济实力才会为外来投资者创造良好的条件，也才可

以保证不会引入资金后关门打狗，也就是人们惯常所说的增强投资者

的信心。

但是，这样讲并不是说建形象工程就一定是合理的，恰恰相反，

目前各地热建形象工程形成一种竞赛，这种竞赛的结果是一步步远离

发展经济、造福百姓的根本目标，演化成一场劳民伤财、逼民治富的

闹剧。引来凤凰并不是目的，留住凤凰才是根本，而这是需要条件的，

即梧桐树能够很好地存活而且枝繁叶茂。而现在竞赛形象工程的结果

是，由于不切实际地劳民伤财，不仅导致百姓怨愤，而且事实上降低

了他们的购买力。

3．逆向选择的困境：二手车市场为何建立不起来？

美国经济学家阿克洛夫（G.Akerlof）1970年提出了著名的旧车

市场模型，开创了“逆向选择”（adverse selection）理论的先河。

在旧车市场上，买者和卖者之间对汽车质量信息的掌握是不对称

的。卖者知道所售汽车的真实质量；但一般情况下，潜在的买者要想

确切地辨认出旧车市场上汽车质量的好坏是困难的，他最多只能通过

外观、介绍及简单的现场试验等来获取有关汽车质量的信息，而从这

些信息中很难准确判断出车的质量，因为车的真实质量只有通过长时

间的使用才能看出，但这在旧车市场上又是不可能的。所以我们说，

旧车市场上的买者在购买汽车之前，并不知道哪辆汽车是高质量的，

哪辆汽车是低质量的，他只知道旧车市场上汽车的平均质量。在这种

情况下，典型的买者只愿意根据平均质量支付价格，但这样一来，质

量高于平均水平的卖者就会将他们的汽车撤出旧车市场，市场上只留

下质量低的卖者。结果是，旧车市场上汽车的平均质量降低，买者愿

意支付的价格进一步下降，更多的较高质量的汽车退出市场。在均衡

的情况下，只有低质量的汽车成交，极端情况下甚至没有交易。

在旧车市场上，高质量汽车被低质量汽车排挤到市场之外，市场

上留下的只有低质量汽车。也就是说，高质量的汽车在竞争中失败，

市场选择了低质量的汽车。这违背了市场竞争中优胜劣汰的选择法

则。平常人们说选择，都是选择好的，而这里选择的却是差的，所以

把这种现象叫做逆向选择。

从上述分析过程还可以看出，产品的质量与价格有关，较高的价

格诱导出较高的质量，较低的价格导致较低的质量。逆向选择使得市

场上出现价格“决定”质量的现象。由于买者无法掌握产品质量的真

实信息，这就为卖者通过降低产品质量来降低成本从而争取低价格提

供了可能，因而出现低价格导致低质量的现象。逆向选择对经济是有

害的：高质量的卖者和需要高质量产品的买者无法进行交易，双方效

用都受到损害；低质量的企业获得生存、发展的机会和权利，迫使高

质量的企业降低质量，与之“同流合污”；买者以预期价格获得的却

是较低质量的产品。

如同“道德风险”一样，“逆向选择”这一术语也起源于保险行

业。因为保险市场上的逆向选择现象相当普遍。以医疗保险为例。不

同投保人的风险水平可能不同。有些人可能有与生俱来的高风险，比

如他们容易得病，或者有家族病史；而另一些人可能有与生俱来的低

风险，比如他们生活有规律，饮食结构合理，或者家族寿命都比较长。

这些有关风险的信息是投保人的私人信息，保险公司无法完全掌握。

如果保险公司对所有投保人制定统一保险费用（这属于总体保险合

同），由于保险公司事先无法辨别潜在投保人的风险水平，这个统一

的保险费用只能按照总人口的平均发病率或平均死亡率来制定，所以

它必然低于高风险投保人应承担的费用，同时高于低风险投保人应承

担的费用，从而使得低风险投保人由于保险费用过高而退出保险市

场，保险市场上只剩下高风险的投保人，即出现高风险投保人驱逐低

风险投保人的逆向选择现象。其结果是保险公司的赔偿概率将超过根

据统计得到的总体损失发生的概率，这将导致保险公司出现亏损甚至

破产。

资本市场上也存在着逆向选择。比如对于银行来说，其贷款的预

期收益既取决于贷款利率，也取决于借款人还款的平均概率，因此银

行不仅关心利率，而且关心贷款风险，这个风险是借款人有可能不归

还借款。一方面，通过提高利率，银行可能增加自己的收益。另一方

面，当银行不能观测特定借款人的贷款风险时，提高利率将使低风险

的借款人退出市场，从而使得银行的贷款风险上升。结果，利率的提

高可能降低而不是增加银行的预期收益。显然，正是由于贷款风险信

息在作为委托人的银行和作为代理人的借款者之间分布并不对称，导

致了逆向选择现象。

不仅在经济生活中存在很多“劣币淘汰良币”的现象，日常生活

中的逆向选择也随处可见。比如人们常说“巧妇常伴拙夫眠”，漂亮

女孩身边的男孩总是貌不出众、能力平常。而那些普通女孩倒是不乏

优秀男生与之相伴。

造成这种情况的真正原因就是信息不对称下的逆向选择。那些对

漂亮女孩向往已久的崇拜者们相互之间，以及和漂亮女孩之间都不能

沟通信息。漂亮女孩的追慕者会这样想：这么漂亮的女孩，怎么轮得

到我来追？肯定有那些比我有钱的阔佬，比如巴菲特，去追求她。于

是长叹一声，转而追求其他女孩去了。而巴菲特在华尔街上巧遇来纽

约观光的漂亮女孩之后，也颇为心仪，但是巴菲特转念一想：这么漂

亮的漂亮女孩，怎么轮得到我来追？肯定有那些比我有年轻的阔佬，

比如比尔·盖茨，去追求她。于是巴菲特长叹一声，转而与结发老妇

相伴去了。漂亮女孩去微软公司面试时，巧遇比尔盖茨。面对如此佳

人，比尔·盖茨再也不能正襟危坐了，心中一阵激动，但比尔·盖茨

转念一想：这么漂亮的女孩，怎么轮得到我来追？肯定有那些比我更

强壮的阔佬，比如乔丹，去追求她。于是比尔·盖茨长叹一声，埋头

继续与司法部周旋。漂亮女孩去观看篮球比赛时，邂逅飞人乔丹。面

对如此佳人，乔丹岂能坐怀不乱，脑海中翻起千层浪，但乔丹冷静下

来一想：这么漂亮的女孩，怎么轮得到我来追？肯定有那些比我更英

俊的小伙，比如她的什么同学同事，早就已经把她追到手了。于是乔

丹长叹一声，转身来个空中走步。这就是漂亮女孩的困惑。

那些想追求她的人相互之间都不能互通信息，也不了解漂亮女孩

的尴尬处境和真实想法。结果是每个想追求她的男人都根据自己的预

期来决定是否要去追求漂亮女孩。由于大家都预期追求金发女郎一定

是极高的门槛，最后造成大家都退缩不前。在这个困惑中，大家只观

察到了女孩的美貌，只发现了自己的不足之处，而根本不知道其他任

何信息。最后每个人都相信追求漂亮女孩的代价将是很高的，因而大

家都不采取行动。最后反而是那些不知天高地厚、懵懵懂懂的男生追

到漂亮女孩。

4.声誉、信号传递与制度设计

从上一小节我们可以知道，信息不对称是导致逆向选择的根源。

要减少逆向选择，就必须解决信息不对称问题。解决思路是委托人或

“高质量”代理人通过信息决策，减少委托人与代理人之间信息不对

称的程度。解决的途径有两个：其一是委托人通过制定一套策略或合

同来获取代理人的信息，这就是“信息甄别”，我们在后一节将会详

细解释；其二是“高质量”代理人利用信息优势向委托人传播自己的

私人信息，这就是“信号传递”。

记得有一部电视剧，其中有一个情节是一位武林豪杰在交通要道

边开了一个酒馆。生产十分兴隆，引起另一位武林高手的垂涎。这位

武林高手决定打败那位豪杰然后霸占酒馆。两强相遇，武林豪杰和武

林高手相互之间不知对方底细，于是来一番比试。本来，他们俩可以

通过打斗来解决问题，但打斗一场双方都会有所损伤，不如通过其他

方式比较武功高低。豪杰拿来5块砖，一掌将其击碎，高手也不示弱，

照样击碎5块砖。于是，豪杰又拿来十块砖，同样是一掌击个粉碎，

高手见之，心中没底，于是明白自己武功较豪杰还差一截。于是，这

位武林高手甘拜下风，放弃了原来的计划，弃剑而去。

这个电视剧中的情节就是一个典型的“信号传递博弈”。豪杰身

怀绝技、天下无敌。但其他人不一定会相信他是武林第一高手，除非

亲自与之交手并败于他。交战虽然可以决出高下，但对双方都会有损

失，打个头破血流对谁都不是好事。当然，豪杰可以对外宣布他的武

功非凡，其他人不是他的对手，但即使豪杰没有什么本事，也可以如

此对外宣布。所以，仅凭口头宣布是难以令人信服的。

俗话说，是骡子是马，拉出去蹓蹓。豪杰用过人武功劈掉别人难

以模仿的10块砖，就向别人发出一个信号。这个信号向外传递的信

息是：我的武功高强，你们可不是对手。这样，不用打斗就决出高下，

避免了打斗带来的更大损失。

在商品市场上也是相同的道理。当人们进行交易时，产品的质量

是重要的特征。在多数情况下，消费者在购买产品时并不能了解到每

种产品的具体质量，真正了解产品质量的是卖者。不同的卖者提供的

产品质量不同，那些劣质品的卖者为了自己的利益将产品的质量信息

隐藏起来。对于消费者来说，如果他们无法区分产品质量的优劣，就

只能根据对整个市场的估计支付价格，即根据平均质量支付价格。当

优质品和劣质品被消费者以同样的方式对待时，劣质品在成本上具有

优势，从而有可能在销售上占据优势；优质品因其机会成本超过市场

价格从而可能退出市场。但是，优质品的提供者不会甘心被劣质品逐

出市场，为了使自己的产品与劣质品区分开来，他们会选择适当的信

号，向消费者传递自己的产品是优质品的信息，以改善信息不对称的

状况，减少逆向选择的不利影响。

优质品的提供者可以采用多种方式发送信号。如质量保证和承诺

是一种成本低廉而且短期效果明显的信号传递方式，因为真正的优质

品因质量原因退换的概率非常小，保修期内的返修率非常低，因此从

整体上不会增加多少费用。而劣质品的卖者肯定提供不了这种保证和

承诺，因为这对于他们来说成本太高了。

再如名牌效应是一种投入成本较高但长期回报十分丰厚的信号

传递方式。如海尔电器、奇瑞汽车等，其品牌本身就传递了产品是优

质品的信息。在消费者心目中，名牌代表优质。尽管不是每件名牌产

品都是优质品，但是消费者在非名牌产品中搜寻优质品的成本通常很

高，而在名牌产品中搜寻优质品的成本相对较低，因此，希望购买优

质品的消费者通常会优先考虑选择名牌产品或自己熟悉的品牌。

广告也是一种信号传递的手段，是减少信息不对称的非常有力的

工具。卖者通过广告信息的传播，以较少的成本获得较高的宣传效用；

而消费者也可以通过非常小的成本，从卖者的广告信息中获得各种所

需的市场知识。

还有些商品广告既无商品的价格信息又无售货地点信息，只有明

星的表演。商业广告中通过一些电影明星使用新产品的图象，利用公

众的“追星”心理打造市场。这种关于新产品市场引导的广告在国外

的电视广告中特别常见，通常是一位当红明星在电视上用新产品表演

一番，既无价格，也无售货地点的介绍，除了显示一下商标外，完全

没有对产品性能的说明。

假设有一家企业A开发出一种很有市场潜力的饮料，该产品饮

后对人的健康确实有好处。但同时，另一家生产假冒伪劣产品的企业

B也准备向市场推出一种伪劣产品饮料。两个企业都会向公众宣布其

产品是上乘的，如何如何的好。但公众是理性的，不会仅凭商业宣传

就相信它们。但是，如果产品真的好，随着时间的推移，消费者能够

识别出来。所以，生产好饮料的的企业A对自己的市场有信心，它

相信随着时间的推移，企业B生产的伪劣产品终究会被消费者识破，

顾客会跑到自己这里来，从而自己的市场会不断扩大，销售收入及利

润会不断增长，而企业B开始可以蒙骗一部分消费者，但时间一长，

产品的问题会暴露出来，市场会不断缩小，收入及未来利润都不会有

企业A的大。这样一来，企业A的未来预期收入远大于企业B。因

此，如果企业A请一位当红明星打广告，由于是当红明星，他们打

广告有很高的市场价格，就可以使企业B不敢模仿。譬如，假定企

业A的预期收入为3千万元，企业B的预期收入为1千万元。当红

明星打广告的市场价格为2千万元，那么，企业A可以请明星打广

告但企业B就请不起。

消费者也明白这个道理，从而会在一开始就识别出不能请当红明

星打广告的企业B是生产伪劣产品的。这样，企业B一开始就没有

市场。当企业A请了当红明星打广告时，企业B发现这位明星的市

场价格太高，自己难以模仿企业A，开始就会放弃生产伪劣产品的计

划。所以，企业A通过请当红明星打广告而清除掉了潜在的市场模

仿者，它向公众传递自己是生产好产品的信号，这种信号的价值在于

其所请来的当红明星有着较高的出场价格，而不在乎明星在广告节目

中说了什么，表演了什么，当然更无所谓广告节目是否介绍产品价格

等信息了。企业A请当红明星打广告就为公众传递了它是生产好产

品的企业的一个信号。

然而，并不是所有产品都适用于做广告。对于低质量产品，消费

者最多只会购买一次，如果做广告的成本高于产品一次销售所得的利

润，这时低质量产品做广告就不合算。可见，较高的广告成本将屏蔽

掉一部分低质量产品。如果广告成本高于产品第一轮销售所得的利

润，又低于多轮销售所得的利润，那么高质量产品做广告将有利可图。

从这个角度说，高成本广告中的产品应该是高质量产品。结果，广告

作为市场信号，传递了高质量产品的信息。

5．所罗门故事与信息甄别

人们都知道垄断企业可以获得垄断的超额利润，然而许多垄断厂

商并未如人们所料想的那样高价格销售商品，而是以低价长期销售某

种产品。譬如，发达国家的私营铁路、航空、海运码头等的价格都长

期远低于按照其垄断定价方法定出的价格。其实，这个问题的解决方

法就是差别定价，比如飞机、轮船等设立头等舱、经济舱。

无论是买票乘飞机、火车还是轮船，不同的人所愿意支付的价格

实际上是不一样的。有的人收入高一些，或对花钱看得比较松一些，

就可以支付较高的价格，相反，收入低的人或对花钱看得比较紧一些

的人，就只愿支付较低的价格。但是，如果你问他们愿意支付什么样

的价格，他们都必定说愿支付较低的价格，因为既使有钱人有也会在

同样服务下以低价购买划算一些。

飞机或轮船公司为了将这些在经济学中被称为具有不同支付意

愿的人区分开来，让能支付较高价格的人支付较高价格，就设计了一

种信息甄别机制。所谓信息甄别机制，用专业的术语来说，就是委托

人事先制定一套策略或设计多种合同，根据代理人的不同选择，可以

将代理人区分为不同的类别，这就是信息甄别。与信号传递不同，信

息甄别是通过委托人的信息决策来获取代理人的信息，从而减少信息

不对称。这是减少逆向选择的又一种途径。通过这种机制在飞机、轮

船公司就是设立头等舱、二等舱、三等舱，……等。这种机制发挥作

用的道理是这样的，我们可以用著名的“所罗门王断案”的故事来说

明。

所罗门王是古代以色列国的一位智慧、英明的君主。有一次，两

个少妇为争夺一个婴儿争吵到所罗门王那里，她们都说自己是婴儿的

母亲，请所罗门王作主。所罗门王稍加思考后作出决定：将婴儿一刀

劈为两段，两位妇人各得一半。这时，其中一位妇人立即要求所罗门

王将婴儿判给对方，并说婴儿不是自己的，应完整归还给另一位妇人，

千万别将婴儿劈成两半。听罢这位妇人的求诉，所罗门王立即作出最

终裁决：婴儿是这位请求不杀婴儿的妇人的，应归于她。

这个故事讲的道理是，尽管所罗门王不知道两位妇人中谁是婴儿

的母亲，但他知道婴儿真正的母亲是宁愿失去孩子也不会让孩子被劈

成两半的。所罗门王正是了解这一点，很快就识别出谁是婴儿真正的

母亲。所罗门王的这种方法在博弈论中被称为“机制设计”，即设计

一套博弈规则，令不同类型的人作出不同的选择，尽管每个人的类型

可能是隐藏的，别人观察不到，但他们所作出的不同选择却是可以观

察到的。观察者可以通过观察不同人的选择而反过来推演出他们的真

实类型。

当飞机或轮船的舱位条件和价格完全一样时，不同支付意愿的人

都会以最低价格买票，不会有人愿支付比别人更多的钱去买相同的舱

位的票。于是，航空公司或轮船公司将舱位分成头等舱、二等舱等，

价格稍有不同，当然服务也不同，就将不同支付意愿的顾客区分开了。

头等舱比其它较低等级舱位的价格高许多并不主要是因为它的

服务要比其它舱位的服务好很多，而是因为那些坐头等舱的人的支付

能力比其它舱位的旅客的支付能力要强许多，说白了，就是坐头等舱

的人比坐其它舱位的人更有钱或更能花钱而已。但是，如果航空公司

或轮船公司不对舱位作如此区分，即使是有钱人也不会愿意坐同样的

舱位而支付比别人支付的更高的价格。

这里，支付能力是旅客的类型，选择舱位等级是他们的选择。支

付能力无法观察，但买什么舱位的票却能够观察，航空或轮船公司因

此而识别出可以支付更高价格的顾客而赚取更多利润。譬如，有两位

旅客A和B乘飞机。A的最高支付能力为1000元，B的最高支付能

力为1500元。经济舱的服务成本为800元，头等舱的服务成本为1200

元。

经济舱带给A和B的消费满足感为1000元，头等舱带给A和B

的效用为1800元。如果没有头等舱，航空公司最多把票价定到1000

元，利润为2×（1000-800）=400元。因为票价一旦高于1000元，A

和B就不会买票了。但当设立头等舱后，航空公司将经济舱票价定

为1000元，将头等舱票价定为1500元。此时，A以1000元买经济

舱。

B如果买经济舱，则其净效用（也就是获得的消费满足感减去付

出的代价的净值）为1000-1000=0，但当B买头等舱票时的消费者剩

余或净效用为1800-1500=300元，所以B会买头等舱。A的支付能力

只有1000元，所以甲只有买经济舱。这时，航空公司的利润增大为

(1000-800)+(1500-1200)=500元>400元。

通过机制设计增大了公司利润，在商品市场上也存在同样的甄别

方法。大家都知道，消费者为了自身利益有时也会隐藏自己的私人信

息，从而出现消费者信息在买卖双方间不对称的情况。例如，同一种

软件产品对于不同的消费者其效用是不同的。一般来说，企业用户对

软件的最新版本需求较大，自然其愿意支付的最高价格较高；高校用

户的需求较低，愿意支付的最高价格也较低；对于普通用户来说，也

许继续使用早期版本同样可以完成工作，因而他们对软件最新版本的

需求更低，愿意支付的最高价格更低。再如，客户的需求信息在供应

商与客户之间是不对称的。客户知道自己的需求，而供应商不完全知

道，因为高需求客户为了以更低的价格成交，往往会隐藏这种“其具

有高需求”的信息。在这种情况下，差别定价方式可以甄别出不同需

求程度的客户，从而使供应商可以获取尽可能多的利润（对于高需求

客户以较高的价格成交，对于低需求客户以较低的价格成交）。比如，

在推出一本新书时，通过提供精装本和平装本两种版本，出版商可以

将读者分为两大类：一类对书的评价较高，另一类对书的评价较低；

在提供电信服务时，服务商可以对手机用户提供两种收费标准：一种

是单位时间通话费用较低但需交纳一定的月租费，另一种是单位时间

通话费用较高但不需交纳月租费。根据用户的不同选择，服务商可以

将用户区分为高频率用户和低频率用户两类。

对于前面提到的保险困境的问题，也可以采用差别保险合同的方

式解决。如果有高风险和低风险两种类型的潜在投保人，而保险公司

无法辨别。为了获取投保人的信息，保险公司可以提供给投保人两种

可供选择的合同，一种是“高保费高赔付”，一种是“低保费低赔付”。

显然，高风险投保人更愿意选择前一种合同，而低风险投保人则愿意

接受后一种合同。这样一来，保险公司就可以从投保人的挑选中获得

潜在投保人的类型信息，将两类投保人区分开来，从而降低了逆向选

择的。

第七章讨价还价的策略

1．从情侣博弈谈起

有这样一对热恋中的情侣，不妨称为男A和女B，他们都是工作

繁忙的公司主管，下班的时候他们约好去看电影。男A想看战争片，

对艺术片毫无兴趣；女B则想看艺术片，对战争片没有一点兴致。不

妨用定量地来分析，假设男A看战争片的满意程度为10分，而看艺

术片的满意程度为2分；女B看艺术片的满意程度为10分，而看战

争片的满意程度也为2分；两人在一起看电影满意程度各会提高10

分。这个时候，我们可以得到如下的图。

20

12

2

2

10

10

12

20

很显然，男女都要么都去看战争片，要么都去看艺术片，这两种

情况达到了该博弈的纳什均衡。这个博弈还有一个特征就是，每一个

参与者都不存在优势策略，因为不管是男A或是女B，都会发现自己

的最优策略取决于对方的选择。如果男A选择看战争片，那么女B选

择看战争片的满意程度最高；如果男A选择看艺术片，那么女B选择

女B

战争片
身边的博弈论：博弈论与信息经济学浅说

艺术片

艺术片

战争片

图12 法律模型

男A

看艺术片的满意程度最高。男A的策略选择亦然。另外，这个博弈的

两个纳什均衡点都达到了帕累托最优的结局。当处在两个纳什均衡点

时，如果男A或女B改变他们的策略选择，导致的结果是让双方都不

满意。

如果时间紧迫，双方来不及联系并且事先也没有商量好，每个人

只好单独决定自己去看什么电影。这个时候，很可能会出现的情况是

男A去看战争片，女B去看艺术片，更糟糕的情况是，男A和女B都

很尊重对方意见反而各自去看对方想看的而自己不想看的电影，这时

的整体满意程度只有4分。很明显的，尽管情侣博弈中的两个纳什均

衡都是有效率的，但这个博弈的不确定性却导致低效率的情况可能发

生。

当然，这对恋人约会看电影事先打个电话，商量好再约定看什么，

这比双方不进行沟通而私自决断要好的多。比方说，情侣双方可以随

便定个规则，如双方商议，在看电影的前一天猜硬币，谁猜中了就听

从谁的意见。说到猜硬币，笔者想到在历史上，曾经发生过堂堂一朝

宰相录用官员竟然用抽签的方式去决定，这实在荒谬透顶。假如这对

恋人都是非常较真的人，根本就不可能用猜硬币的方式，而是强行承

诺，比如男A是个大男子主义者，直接告诉女B他是一定会选择战争

片，完全不会去看艺术片，如果这个女主角B是个柔顺的小女人，结

果当然仍是达到纳什均衡：双方都去看战争片。女B用威胁的手段亦

然。

问题是，男A是大男子主义者，女B是女权主义者，双方都威胁

对方不会去选择去看对方喜好的电影。这样的结果将达到次优，也就

说无法达到帕累托最优的纳什均衡局面。好心办坏事，更糟糕的情况

是，双方虽然在口头上严辞相对、威胁对方，但内心里反而是相互体

谅对方，最后进行策略选择的时候反而都作出让步，各自选择了对方

所爱看的电影。最终的结果很显然是效率最低的局面。

更进一步地分析这个问题，男女恋人任意一方在谈判（男女双

方对片子选择的协商本质上就是一种讨价还价的谈判）中承诺要看什

么电影，关键是其可信度取决于作出诺言的一方是否证明，除了遵守

承诺以外，其它的选择并不是更痛苦。比如说，女B能够向她男朋友

A证明：即使她一个人独自欣赏艺术片，也能津津有味地享受电影的

乐趣，获得极大的满足感。这个时候，女B所作的一定要看艺术片的

承诺就是可信的。

但是，假设男A正在追求女B，男A对女B的依赖性就会增强，

他要考虑如何让女B开心来获得她的欢心。反过来说，男A向女B提

出要求的能力自然就下降了。生活当中就是这样的道理，所谓“吃别

人的嘴短，拿别人的手短”，不同的人在一起合作，有求于对方的人

在讨价还价的谈判中一定是处于劣势的。

2．先发优势与后发优势

为了更清楚的了解讨价还价的谈判，我们来看切蛋糕的故事。如

果男女双方不是看电影，而是在切一块蛋糕，怎么才能保证分配的公

平合理呢？很简单的一个方法，就是一方将蛋糕一切两半，另一方则

选择自己分得哪一块蛋糕。不妨假设切蛋糕这种累活分配给男A，女

B则在两块蛋糕中选择一块。很显然，男A在这种切冰淇淋蛋糕的规

则下一定是努力让两块蛋糕切得尽量相同大小。这就是著名的最后通

谍博弈（Ultimatum games）。然而在现实中，谁都不可能将两块蛋糕

切得完全一样大，就算使用精密仪器去测量，用精密刀具去切割，这

样做的成本太高，还不如用手去切。如果这个男A与其女朋友B都是

个斤斤计较很小家子气的人，那么在这种规则下，男A分得的蛋糕一

定是小的那块。

我们不妨假设，男A与女B都不愿意先去切这块蛋糕，于是又出

现了另一种分配蛋糕的规则。不妨假设蛋糕总量为1，男A和女B各

自同时报出自己希望得到的蛋糕的份额，如4/5，8/9。他们之间约

定，两人所报出的份额相加总和必须等于1，否则从新分配。从数学

上可以得到，这个两人博弈的纳什均衡点会有无数个，只要两人所报

出份额相加为1的组合都是均衡结局，比如男A报1/2，女B报1/2；

男A报2/3，女B报1/3,依此类推。这里的问题是在于如果女B报

8/9，男A报1/9，这个时候男A也只有接收这个条件，因为这是一

次性博弈，如果男A不接收那么双方连一丁点的蛋糕都分不到，从理

性人的角度来看这显然不存在的。

在实际生活中，除了绝对的利他主义者，或者带有其它目的的博

弈参与者，显然8/9的蛋糕归某一参与者，剩余的部分仅仅1/9的蛋

糕留给另一参与者的情况是很难发生。就这个例子来看，男A一定不

满足于只能分到1/9的蛋糕，他一定要求再次分配。这种情况下，分

蛋糕的博弈就不再是一次性博弈。

事实上，当分蛋糕博弈成为一个动态博弈时，这就形成一个讨价

还价博弈的基本模型。在经济生活中，不管是日常的商品买卖还是到

国际贸易乃至重大政治谈判，都存在着讨价还价的问题。比如中国加

入WTO的时候，为了国家或民族利益与许多发达国家的讨价还价，进

行了漫长而又艰难的谈判。我们从这个漫长过程的谈判中可以发现，

讨价还价的过程实际上就是一个谈判的过程，比如发达国家首先对中

国提出一个要求，中国决定是接受还是不接受，加入中国不接受，可

以提出一个相反的建议，或者等待发达国家从新调整自己的要求。这

样双方相继行动，轮流提出谈判要求，形成了一个多阶段的动态博弈。

我们先来看这样一个故事。在某个朝代有个破落贵族的后代A，

穷困得实在没有办法过下去，不得不将家中主传的古字画拿到一个大

财主B家去卖。这副字画在A看来至少值200两银子，财主B认为这

副字画最多只值300两银子。这样看来，如果顺利成交，字画的成交

价格将在200～300两银子之间。这个交易的过程不妨简化为这样：

首先由B开价，A选择成交或还价。这个时候，如果B同意A的还价，

交易顺利结束；如果B不接受，则交易结束，买卖没有做成。这是一

个很简单的两阶段动态博弈的问题。

我们应该解决动态博弈问题的倒推法原理来分析这个讨价还价

的过程。首先看第二轮也就是最后一轮的博弈，只要A的还价不超过

300两银子，B都会选择接收还价条件。回过头来，我们再来看第一

轮的博弈情况，A拒绝由B开出的任何低于300两银子的价格，这是

很显然的，比如B开价290两银子购买字画，A在这一轮同意的话，

只能卖得290两；如果A不接受这个价格反而在第二轮博弈提高到

299两银子时，B仍然会购买此副字画。两项比较，显然A会还价。

细心的读者可以发现，这个例子中的财主B先开价，破落贵族A

后还价，结果卖方A可以获得最大收益，这正是一种后出价的“后发

优势”。这一优势在这个例子中相当是分蛋糕动态博弈中最后提出条

件的人几乎霸占整块蛋糕。

事实上，如果财主B懂得博弈论，他可以改变策略，要么后出价，

要么是先出价但是不允许A讨价还价，如果一次性出价，A不答应，

就坚决不会再继续谈判来购买A的字画。这个时候，只要B的出价略

高于200两银子，A一定会将字画卖于B。因为200两银子已经超出

了A的心里价位，一旦不成交，那一文钱也拿不到，只能继续受冻挨

饿。

在博弈理论上，已经证明出，当谈判的多阶段博弈是单数阶段时，

先开价者具有“先发优势”，而双数阶段时，后开价者具有“后动优

势”。这在我们的生活中是非常常见的现象：非常急切想买到物品的

买方往往要以高一些的价格购得所需之物；急切于推销的销售人员往

往也是以较低的价格卖出自己所销售的商品。正是这样，富有购物经

验的人买东西、逛商场时总是不紧不慢，即使内心非常想买下某种物

品都不会在商场店员面前表现出来；而富有销售经验的店员们总是会

劝说顾客，“这件衣服卖得很好，这是最后一件”之类的陈词滥调。

3．谈判的要诀:掌握对方心理与妥协

上一节中的博弈仅仅是模拟实际生活，实际上任何讨价还价的过

程都不可能无限制地进行。因为讨价还价的过程总是需要成本的，在

经济学上这个成本称之为交易成本。比如前面说的恋人之间是看战争

片还是看艺术片的谈判所耗费的时间就是有成本，而恋人之间的争执

对双方心理的伤害也是巨大的，这些成本往往远高于交易所带来的收

益。事实上，很多家庭中夫妻感情破裂，情人分手，就是因为这种小

事无法妥协而造成的。如果是恋人分手还好说，夫妻离婚随之而来的

财产分割、小孩的处理等问题又将会引起耗费交易成本的讨价还价问

题。

为了能够简单说明这种耗费交易成本的讨价还价过程，我们不妨

假设男女恋人之间不是分配一般的奶油蛋糕，而是分配冰淇淋蛋糕。

冰淇淋蛋糕会随着男女恋人之间的讨价还价过程而融化，不妨仅简单

地认为被融化的那部分蛋糕就是这个讨价还价过程的交易成本。这

时，讨价还价的过程和前面买卖古字画的过程相同：女士优先，第一

轮由女B提出要求，男A接受条件则谈判成功，若男A不接收条件进

入第二轮；第二轮由男A提出分蛋糕的条件，女B接受则谈判成功，

女B不接受，于是蛋糕融化，谈判失败。

对于女B来说，刚开始提出的要求非常重要，如果她所提的条件，

其男友完全不能接受的话，蛋糕就会融化一半，即使第二轮谈判成功

了，也有可能还不如第一轮降低条件来得收益大。因此女B第一轮提

出要求要考虑两点，首先要考虑是否可以阻止谈判进入第二阶段，其

次，考虑她自己的男朋友是如何考虑这个问题的。

首先看最后一轮，蛋糕在第二阶段只有原先的1/2的大小，因此，

女B在第二阶段即使谈判成功，也不只得到1/2蛋糕，而谈判失败则

什么都得不到。从最后一轮再反推到第一轮，男A知道女B在第二轮

时所能得到的蛋糕最多为1/2，，因此当女B在第一轮时只要占据的

蛋糕大于1/2，他都可以表示反对将这个谈判延续到第二轮。女B对

男A的如意算盘都很清楚，经过再三考虑，她在第一阶段的初始要求

一定不会超过1/2的蛋糕大小。因此女方B在初始要求得到1/2个蛋

糕时该谈判顺利结束，这个讨价还价的结果则是男女恋人双方各吃一

半大小的蛋糕。

这种具有成本的博弈最明显的特征就是谈判者整体来说应该尽

量缩短谈判的过程，减少耗费的成本。就分冰淇淋蛋糕谈判来看，就

是尽量不让蛋糕融化太多。

我们再来看看当谈判有三个阶段时是什么样的结果。为了便于论

述，不妨假设这个时候，蛋糕每过一个讨价还价的轮次就融化1/3大

小，到最后一轮结束时由于过了两个谈判的阶段，蛋糕全部融化。动

态博弈一般都是采用倒推法，从最后一个阶段看，即使谈判成功，女

B最多只能得到剩下的1/3个蛋糕。男A知道这一点，因此在第二阶

段轮到自己提要求时要求两人平分第一轮剩下的2/3个蛋糕。女B在

第一轮时就知道男A第二轮的想法，于是在第一阶段刚开始提要求

时，直接答应给男A蛋糕的1/3大小，男A知道即使不同这个条件，

进入第二轮也一样是最多得到1/3个蛋糕，到了第三轮几乎就分不到

蛋糕，因此男A一定会接受这个初始条件。这个三阶段的分蛋糕谈判

最终的结果是男A分得1/3的蛋糕，女B分得2/3个蛋糕。

从数学上可以证明，分蛋糕博弈只要博弈阶段是双数时双方分得

的蛋糕将会是一样大小，博弈阶段是单数时，后提要求的博弈者所得

到的收益一定会好于先提出要求的博弈者，然而随着阶段数的增加，

双方收益之间的差距会越来越小，每个人分得的蛋糕将越来越接近于

一半。如此看来，对于任何实际的谈判，谈判者要注意，首先采取后

发制人的方法，根据对方的行动来行动；其二，尽量摸清对方的底牌，

了解对方的心理，根据对方的想法来制订自己的谈判策略；其三，就

是耐性，谈判者中能够忍耐的一方将获得利益，这一点凭借直觉可以

判断，越是急于结束谈判的人将会越早让步妥协，或作出越大的让步，

在前面分冰淇淋蛋糕的博弈中，如果考虑每一方谈判时间的价值，就

可以在数学上严格地证明这一直觉的合理性。

4．独裁者博弈与劳资谈判

实际上，在前面的博弈案例中，都隐含了这么几个假设条件，首

先博弈双方都是完全追求收益最大化的理性人，其次博弈双方都是处

于均等且相同的地位。然而在实际生活中，参与博弈的双方不可能绝

对的平等。比如，正常的恋人之间往往是女方先吃蛋糕，吃不下了才

将剩下的蛋糕留给男方，这才像对如漆似胶、爱意浓浓的的恋人。再

比如，对于国内的劳动力市场来说，由于人力过剩，雇员对老板的谈

判地位明显是处于劣势。即使是在菜市场买菜，经济困难的人常常会

与小贩一而再、再而三的讨价还价，而富人则山珍野味，一掷千金不

在话下。

来看不平等条件下谈判博弈的一个经典案例，那就是独裁者博弈

（Dictator games）。假想，一个独裁者与一个无权者之间分配一笔固

定资产。讨价还价只能进行有限次，最后一次博弈的决定者理所当然

是独裁者。按照理性人假设，自私自利的独裁者一定是独吞这笔财富。

然而，从历史上来看，大部分的当政者并不会这么做。实际上，这个

博弈的独裁者并不仅仅只是考虑资产多少，他还要考虑名誉、地位与

统治的稳固与否。如果将这些因素都考虑成收益，从广义上来说，这

样的独裁者仍然是理性的。可见，对于平民来说，收益可能仅是资产

分得多少，而对于当政者来说，资产并不是其全部的收益。反过来说，

仅仅考虑自身经济收益的当政者反而是非理性的人。

劳资谈判与独裁者博弈倒是有些类似。在劳动力市场上，劳动力

价格是在综合考虑知识、技能、劳动强度等因素的基础上通过博弈机

制来最终确定的。这一过程虽然并不能保证完全实现按劳分配，但确

实是一种在现实中可操作的而且分配结果比较符合按劳分配原则的

分配方案。掌握特殊技能的、技术好的或付出劳动较多的劳动者有条

件得到相对较高的工资；而技术差、知识少、工作少的劳动者只能得

到相对较低的工资。但劳动力市场的“按劳分配”是有局限的。劳动

力市场在基本可以实现劳动者之间的“按劳分配”的同时，在买卖双

方之间却存在系统性的不公平交易。为了说明这一问题，让我们先看

看资本主义社会劳动力市场的情况。

市场决定劳动力商品价格的机制与一般商品市场是相同的，劳动

力的成本就是生产这一劳动力所需的生活费用和教育费用。劳动力商

品的使用价值很特殊，是产生价值，所以劳动力商品的价值也是可以

用货币来量化的。劳动力市场上的卖方是劳动者，劳动者能够接受的

最低报酬是劳动力的成本价值。如果仅得到这个价值，劳动者的生活

将非常艰苦，仅够维持劳动力的再生产。劳动力市场上的买方是资本

家，资本家能够接受的最高价格是劳动力商品的使用价值，如果按照

劳动力使用价值成交，资本家将没有利润。交易之所以能够发生是因

为劳动力的使用价值和成本价值之间存在差距，因而存在高于劳动力

的成本价值而低于劳动力的使用价值的价格区间。最终，劳动力的实

际价格将处于这个区间，具体为多少则由博弈机制决定。资本家所赚

取的就是劳动力价格和使用价值之间的差价。

劳动力市场上买卖双方的不公平交易就产生于博弈环节中。在博

弈中，作为卖方的劳动者自然要争取尽量高的工资，而作为买方的资

本家为了获取更多的利润也要尽量压低工资，这是可以理解的。问题

在于，从博弈的观点看，劳动力市场上买卖双方在博弈中的地位是不

平等的。资本家先占有了商品交易过程中实现的全部价值，再由他决

定分配，而劳动者则只能被动的选择接受或不接受这份工作。资本家

在博弈中处于较有利的地位，而劳动者处于不利地位。在这种情况下，

资本家可以出这样一个价格：与劳动者的贡献相比明显偏低，但是比

他在别处可能得到的工资略微多一点点。此时，劳动者将面临这样一

个处境：自己得到的报酬低于自己的贡献，但如果不接受这个价格，

则得到的将更少，甚至什么都得不到。从博弈角度讲，虽然这个价格

并不公平，但此时最明智的选择还是接受这个价格。

所以，即使不考虑在现实博弈中资本家还经常可以利用劳动者的

其他弱点扩大胜利，就像在零和竞局的股市中庄家照样可以利用散户

的弱点获利一样，仅仅博弈地位的不平等已经足以让资本家得到一个

有利的价格了。取得这个价格用不着特殊的博弈技巧，因为这是博弈

地位本身提供的。这种不公平的报酬体现了资本家对劳动者的剥削。

第八章如何做好一个老板

1．管理需要建立预期

很多人都认为：在计划经济时代，企业员工缺乏激励，偷工减料，

效率低下，因为都是吃大锅饭没有足够的动力；而在市场经济下，企

业有赚取利润的驱动力，自然企业都会努力降低成本，提高效率以赚

得更多的利润。实际上，即使在市场经济体制下，企业员工业并不都

是个个勤奋，人人努力。一般的企业领导人采用的不过是古已有之的

胡萝卜加大棒的方法来统驭下属。

管理学家孔兹对领导的界定是：“领导可定义为影响力。它是影响

他人，并使他们愿意为达成群体目标而努力的一种艺术或方法。这种

观念可以更扩大到不仅是使他们愿意工作，同时也愿意热诚而有自信

地工作。”其中最关键的理念是“影响他人使他们愿意为达成群体目

标而努力”。管理者为了对组织的目的负责，达成企业“群体目标”，

必然用一种艺术或方法去影响被领导者，使之愿意工作，甚至是热情

而自信地工作。

对于下属来说，管理者的信用、权威必须要通过管理者长时间发

给下属的各种信号与相互之间的良好交流才能达到。比如一个民营企

业的老总若要建立起良好的名誉，必须乐意给下属高出劳动力市场上

一般的福利待遇，让下属认识到企业对员工的关心与认可。

权威本身也要具有伟大的人格，优良的品质和出众的才能。权威

并不是脱离群众的，他也要采纳群众的意见。只有部属能尊重上司的

权威，而上司也能采纳部属意见的公司，一切才可以顺利推动。

管理者与员工交流能够大大提高领导者建立信誉的能力。如果员

工发现分享管理者的私人信息和代价很高的努力是值得而理性的，这

种信任就是必不可少的。管理者若无法得到员工的尊敬，上下级之间

就会相互猜疑，信息沟通极少。用于尊敬员工以及敢于谈论他们自身

缺点的领导者将赢得下属的尊重。一旦员工信任并尊敬一个管理者，

真正的进步就成为可能。

管理者应该能够帮助员工建立对未来的预期。对未来的预期，是

影响员工行为的重要因素。预期分为预期收益和风险，也就是员工这

样做将来会有什么好处，同时这样做又可能面临的问题。这些将影响

员工个人的策略，如员工是否会将精力真正的投入到企业的成长中。

有这样一个有趣的故事。一只绰号叫“无敌手”的猫打得老鼠溃

不成军，最后老鼠几乎销声匿迹了。残存下来的几只老鼠躲在洞里不

敢出来，几乎快要饿死。“无敌手”在这帮悲惨的老鼠看来，根本不

是猫，而是一个恶魔。但是这位猫先生有个爱好：喜欢向异性献殷勤。

有一天，这只猫爬得又高又远去寻找相好。就在它和相好癫狂时，

那些残存的老鼠来到了一个角落里，就当前的迫切问题召开了一个紧

急会议。一只十分小心谨慎的老鼠担任会议主席，一开始它就建议必

须尽快地在这只猫的脖子上系上一只铃铛。这样，当这只猫进攻时，

铃声就可以报警，大伙儿就可以逃到地下躲藏起来。会议主席只有这

么个主意，大伙儿也就同意了它的主张，因为它们都觉得再没有比这

个主张更好的建议了。但问题是怎样把铃铛系上去。没有哪只老鼠愿

意去栓这个铃铛。到了最后，大伙儿就散了，什么也没做成。看来，

给猫系上铃铛无疑是一个绝妙的主意，但对于一群已经被吓破胆的老

鼠来说，这个主意意味着只是无法实施的美好梦想而已。在企业中，

也是一样的道理。

对于一个管理者来说，应该本着务实的精神，制定切实可行的计

划，让他的团队有一个可以实现的目标，而不是做出一个不可能实现

的决定，同时管理者要对这个目标做出承诺。在承诺的同时，上级下

之间要能够相互沟通，建立一个交流网络来寻求共同的价值观与信

念。同时，管理者能够以身作则，以自己的个人行为作为员工学习的

典范。

许多公司现在也开始在一些社会议题上彼此互相合作，同时也透

过一些公有与私有合伙关系的重组，以及制作各种保护环境，改善教

育水准，发展提升医疗保健等计划，来回馈社会。在这里，就有许多

机会，可以吸引各行各业以及各层面的优秀分子的注意。

通过领导者自己与下属之间的“互动过程”，有效地协调了子系

统之间的竞争与合作关系，树立了领导权威，促进了系统的有序化，

这才是现代领导的本质所在。显然这种领导权威不是领导者个人素质

的单独结果，而是领导者与下属双方相互作用的结果。这也是有别于

传统的新理念。

在中国企业发展的进程中，管理者更应该从博弈论中学习到发挥

更大作用的方法与技巧。当然，由于职业化管理的条件不成熟，因此，

企业家主导经营管理的管理模式还将一直持续相当的时间。

2．奖罚分明

兵法上说，“用赏贵信,用刑贵正。”从我国企业的实践来看，对

员工的管理激励与约束机制还没有很好地建立起来。如在一些企业

中，不仅缺乏有效的培育人才、利用人才、吸引人才的机制，还缺乏

合理的劳动用工制度、工资制度、福利制度和对员工有效的管理激励

与约束措施。当企业发展顺利时，首先考虑的是资金投入、技术引进；

当企业发展不顺利时，首先考虑的则是裁员和职工下岗，而不是想着

如何开发市场以及激励职工去创新产品、改进质量与服务。

我们不妨先从一个例子入手，来看企业如何制订有效的激励制度

才可以有效的驱动员工工作。设想有一家游戏软件企业老总，打算开

发一种新的网络游戏，不妨叫做“大话水浒”。如果开发成功的话，

根据市场部的预测将得到2000万人民币的销售收入。如果开发失败，

那将是血本无归。而企业新网络游戏的成功与否，关键在于技术研发

部员工是否全力以赴、殚精竭虑来做这项开发工作。如果研发部员工

完全投入工作，有80％的可能，这款游戏的市场价值将达到市场部

所预测的程度；如果研发部员工只是敷衍了事，那么游戏成功的可能

性只有60％。

研发部全体员工在这个项目上所获得的报酬如果仅有500万元，

那么这些员工对于这款游戏的激励不够，他们都是得过且过，敷衍了

事。老板要想让这些员工得到高质量的工作表现，就必须要给所有员

工700万元的酬金。

这样的话，如果老板仅付500万总酬金，那么市场销售的期望值

有2000万×60％＝1200万元，再减去500万的固定酬金，老板的期

望利润有700万元。如果老板肯出700万的总酬金，则市场销售的期

望值有2000万×80％＝1600万元，再减去总酬金700万，老板最终

的期望利润有900万元的剩余。

然而困难在于，对于研发部的员工，老板很难从表面了解到这些

员工在进行工作时到底有未敬忠职守，兢兢业业地完成任务。即使给

了全体员工700万的高酬金，研发部员工也未必就尽心尽力地完成这

款游戏。由此看来，一个良好的奖罚激励机制对于企业极其重要。

公司最好的方式就是若是游戏市场反映良好，员工报酬提高，

若是不佳，则员工报酬缩减。“禄重则义士轻死”，如果市场部目标达

到，则付给全体研发人员900万元，若是失败，则让全体研发员工付

给企业100万元的罚金。这种情况下，员工酬金的期望值是900万×80％-100万×20％＝700万元，其中900万元是成功的酬金，成功的概

率为80％，1万元则是不成功的罚金，不成功的概率为20％。在理

论上，采用这样的激励方法会大大提高员工工作的努力程度。

从某种意义上来说，这种激励方法相当于赠送一半的股份给企业

研发部员工，同时员工也承担游戏软件市场失败的风险。然而这种方

法在实际中并不可行，因为不可能有任何一家企业能够通过罚金的方

式来让员工承担市场失败的风险。可行的方法就是，尽量让企业奖惩

制度接近于这种理想状态。更加有效的方法，就是在本质上类同于奖

励罚金制度的员工持股计划。我们可以将股份中的一半赠送给或者销

售于研发部的全体员工，结果仍然是和罚金制度是相同的。

通过这个例子，我们可以看到，员工工作努力与否与良好的激励

机制密不可分。然而我们现实中的很多公司却不明白这个道理。比如

很多公司的奖惩制度上写着：“所有员工应按时上班，迟到一次扣10

元，若迟到30分钟以上，则按旷工处理扣50元。”国外有弹性工作

制，即不强求准时，但是每天都必须有效地完成当天工作。笔者认为，

即使有人迟到、早退、被扣除工资，但是在实际工作中很有可能并不

是努力工作，其因扣除工资而产生的逆反心理导致的隐性罢工成本反

而有可能高于所扣除的工资。从表面上看，老板似乎赚得了所扣工资

的钱，实际上是损失更多。可见，这并不是一个有效的奖罚激励制度。

再比如有的公司规章条例写着：“公司所有员工应具有主人翁意

识，应大胆向公司领导提出合理化的建议，可以直接提出也可以以书

面形式提出，若被采纳后奖励50元。”笔者试问，不同的合理化建议

对公司所创造的效益是不同，假设一个人所提建议可以提高效益5万

元，另一个人所提建议则只能提高效益500元，都用50元的奖金来

进行物质激励，其条例本身明显就不是合理化的制度。

总而言之，一个良好的奖惩制度首先要选择好对象，其次要能够

建立在员工相对表现基础之上的回报，简单的说，就是实际的业绩越

好，奖励越高。只有这样的奖罚分明的制度才能够对员工创造出合适

的激励。

3．强强如何有效联合？

一个企业按照系统论的说法，是一个开放耗散结构系统，与外部

环境不断发生联系与交换，如寻找供应商采购，寻找销售商销售，在

企业外部招聘员工，和其它企业进行合作等。在企业合作推出品牌的

例子中最著名的莫过于1990年4月，由安徽省烟草专卖局（公司）

大力推荐，国家烟草专卖局（总公司）出面牵线搭桥，英美烟草（香

港）有限公司与芜湖卷烟厂的合作。1991年，双方合作生产的“都

宝”牌卷烟非常顺利地占领了首都市场，成为北京的畅销品牌，并远

销内蒙古、河北等18个省市自治区。

一般来说，两家企业达成合作协议，推出双方共同拥有的新品牌，

就意味着在很大程度上，合作双方开始相互依赖。没有任何一方可以

在不牺牲自身利益的情况下回到原来独立经营的轨道上去。芜湖烟厂

与英美烟草合作的都宝就是这样，如果其中有一方放弃合作，希望从

对方身上榨取好处，整个合作的进程就会中断，造成许多不必要的损

失。

我们不妨认为，英美烟草公司的技术水平要高于芜湖烟草，而芜

湖烟草本土化的营销手段与网络则是英美烟草所缺乏的。因此，英美

烟草与芜湖烟草之间的合作主要是英美烟草提供技术，而芜湖烟草开

发市场。设想英美烟草支持芜湖烟草的技术开发分为低技术开发与高

技术开发两种，技术开发成本分别为9000万人民币与1.5亿人民币；

芜湖烟草上新生产线的投入也分为低投入与高投入两种，开发成本分

别为1.8亿人民币与3.0亿人民币。因此，我们可以得到双方合作的

总成本有四种可能，见下图。

3.3亿

2.7亿

4.5亿

3.9亿

不妨双方合作都预期到，都宝香烟的市场利润在一年内可以达到

3.9亿人民币的利润。双方都以一年内收回成本为目标，但赚取多少

钱并不在考虑之列，主要是试探性地进行这个项目。很显然，芜湖烟

草高投入上生产线，英美烟草采用高技术投入，此时的总成本达到

4.5亿，明显一年内这个合作项目的成本无法收回。

我们不妨假定合作双方采用两种策略的概率都是1/2，由此，双

方总成本为3.3亿、2.7亿、4.5亿和3.9亿的概率都是1/4。那么，

双方总成本的期望值为（3.3亿+2.7亿+4.5亿+3.9亿）×1/4＝3.6

亿元，因此双方的预计利润为3.9亿-3.6亿＝0.3亿元。

芜湖烟草

低投入（1.8亿）

高投入（3.0亿）

低技术（0.9亿）

高技术（1.5亿）

图13 合作模型

英美烟草

那么在英美烟草与芜湖烟草进行合作协商的时候，就要考虑到项

目启动成本是否高于0.3亿元。这个例子中的项目启动成本包括双方

谈判成本、人员培训成本、沟通成本等。如果项目启动的初期投资超

过3000万，双方就没有合作的可能性，项目自然被否定掉。

在企业的实际合作中，最大的困难并不是作出这样的预期，关键

在于每个企业是否真实地提供自己所负担的投入成本。比如这个例子

中，英美烟草可以将其技术开发成本报为最高的2.5亿元，芜湖烟草

报为最高的3.0亿。这种情况下，很明显合作双方的项目第一年的目

标无法达到，更谈不上弥补先期的项目启动成本。自然，项目只会泡

汤，双方无法达成合作。

看来让两个公司有效地合作一个项目，并不是一个简单的事情。

我们不妨采取这样一种策略：加入芜湖烟草决定将合作项目继续下

去，它必须要补偿英美烟草的成本，然后保有余下的利润。无论双方

的成本总和是不是低于利润目标，芜湖烟草都将决定继续下去，它的

收入为总收入减去自身上新生产线的成本，再减去对英美烟草的补偿

之后的剩余。

双方不妨同时宣布自己投入的成本，并且在总成本低于利润目标

的前提下，项目才能进行下去。对于芜湖烟草来说，补偿英美烟草成

本的剩余利润必须要高于它实际付出的成本，它才能继续这个项目。

由此看来，芜湖烟草最好的作法就是报出真实的投入成本。如果芜湖

烟草所报的是虚假数字，很有可能这个项目就无法进行，芜湖烟草就

失去了一个赚钱与技术更新的好机会。因此，芜湖烟草报出真实成本

是一个优势策略。

同理，这种激励机制当然也可以用在英美烟草身上，报出真实成

本自然也是英美烟草的一个优势策略。

然而，这种方法的局限在于，不管用在哪一方身上，都只能保证

其中一方报出的是真实成本，无法约束另一方也是说真话。为了让双

方都能够真实报出真实成本，在设计合作协议的时候是最重要，这份

协议要能够激励两家公司都报出真实成本；这份协议要有确保有效继

续项目或取消的决策。能够让大家精诚团结的协议，就是要使公司将

它们通过自身行动加在对方身上的成本考虑进去。比如在这个例子

中，一旦公司夸大自己的成本，项目不得不取消，反而自己所获收益

减少。

4．如何接到一个项目？

很多公司，尤其是工程公司的项目，都是通过公开投标的方式来

获得。随着我国政府办公公开化、透明化进程的不断加快，政府项目

公开招投标方式的应用也会越来越广泛。

在招投标中，最常见的是片面的、无标底的“最低价中标”。项

目招投标可以通过竞争性的公开一次性报价，选择报价最低者中标，

以达到降低投资的目的。有这样一个故事，称为“旅行者困境”就说

明了这种方法的好处。这个故事说的是有两个旅行者A和B从一个

以出产花瓶的著名旅游胜地回来时，他们都买了花瓶。提取行李时，

发现花瓶被碰破了。他们向航空公司索赔。航空公司估计花瓶的价格

在80～90元的价位左右，但不知道这两位旅客购买的准确价格。航

空公司要求两位旅客在100元以内自己写下花瓶价格。若两人写的相

同，说明他们说了真话，就照他们写的数额赔偿；如果两人写的不一

样，那就认定写得低的旅客讲的是真话，按这个低的价格赔偿，但是

对讲真话的旅客奖励2元钱，对讲假话的旅客罚款2元。

如果两人都写100元，他们都会获得100元。但是，给定B写

100元，A改写99元，则他会获得101元。B又想，若A写99元，

他自己写98元，比写100元好，因为这样他获100元，而写100元

当A写99元时自己却只获97元。而给定B写98元，A又会写97

元，……这样，最后落得每人都只写1、2元的境地。当然这个博弈

是一种理想状况，实际的企业招投标往往都有一个成本底线。

比如现在有一个政府项目，是公开招标选择网络公司建立政府

网，某公司是投标者之一。对于这个公司来说，根据过去的经验能够

预算出接手这个项目的真实成本是100万人民币，然而这个公司并不

了解其它竞争对手的真实成本。该公司根据市场行情推断，其他公司

的真实成本在50万～150万元之间。从概率的角度去看，在50万～

150万之间的任何一个价格都有可能是最终的胜利者。我们简化这个

问题，假设每个公司的成本只能是50～60万、60～70万、……120～

130万、130～140万、140～150万这样的整数，总共有10种可能，

因此最终获得胜利的公司落在这10种价格区间中的任何一个的概率

是1/10。

如果这个公司报价90万，很显然，公司即使胜出，仍然要亏本

10万元，看来100万的报价是底线，低于这个价格的报价对于该公

司毫无意义。当然这只是这一机制的理想状况。实际当中，如果价格

低于成本，破坏了市场均衡，毫无疑问会影响项目质量，不但损害中

标者利益，最终还会损害招标政府自身利益。

自然从理论上说，该公司投标报价一定要高于100万元，不妨假

设报价120万，根据这10种价格的概率，其他公司报价低于120万

该公司惜败的概率是3/5，即使开价100万，该公司不能中标的概率

也有2/5。当然开价120万胜出时可以赚取20万利润，而开价100万

时即使胜出也仅仅是能够弥补成本而已。由此可见，开出一个较高的

价码是该公司的优势策略。每一个投标公司都这么考虑的话，所有公

司的报价都会高于实际成本，结果就是所有的开价都被人为抬高。

如何让公司投标报价接近于真实成本的问题关键在于采用某种

激励机制来驱动投标者不说谎。比如这里有这样一种激励方式，就是

将合同判给开价最低者，但是却让他付开价第二低者的价格。这个时

候该公司如果开出的还是120万的报价并且时第二低的价码，而另一

家公司开出的价格比这个公司要低，比如是低于该公司成本价的90

万元，该公司最终的价格120万反而成了这个胜出公司的最终项目价

码。在这种招投标方式下，任何一个公司的优势策略就是开出一个接

近其真实项目成本的价格。

按照博弈论的观点具体分析招投标行为我们还可以发现：就象博

弈的参加者独立决策、独立承担后果那样，投标各方也如同分别隔离

审问，而不能串供，是处于“两难困境的囚徒”，各家只能依据自身

实力、期望利润和所掌握的市场信息，自主报价，独自承担风险。

不难看出，机制设计的关键是如何让每个公司的报价有利于集体

选择，并最终达到“纳什均衡”。这里其实靠的是两个制度安排。其

一是阻止公司之间的合作，其二是制订了一套“坦白从宽，抗拒从严”

的赏罚规则。可见在招投标的机制设计中，通过博弈竞争使中标价接

近成本价，达到均衡合理，为招标人节约投资，提高经济效益；通过

优胜劣汰，使市场竞争力低下的投标人无力参与竞争而退出市场，让

有实力的投标人脱颖而出，使资源达到均衡配置，市场秩序得以规范。

第九章民主的悲剧

1.社会选择的形式

人类社会一经出现便存在者社会选择的问题，如重要职位的人选、

政策的制订甚至是国家政治体制的确定等。一般来说，这些问题的解

决主要有4种方式，即社会传统习惯、个人或集团的专制独裁、投票

表决和看不见的手的市场机制。

传统习惯可以是社会的风俗习惯乃至宗教法规等包罗甚广的惯

例。如我国古代的以孝治天下的王朝就是以孝道这种社会习俗作为整

个国家大政方针制订的原则与标准。从中世纪欧洲各国的宗教裁判所

到当今中东国家的政教合一，都是典型的根据神的意志也就是宗教法

规来进行社会性选择。

独裁专制是由个人或少数人集团对社会进行统治，按照个人或少

数人集团的意志进行行政管理并代替公众进行社会性选择。中国长达

2000多年的封建专制统治的本质就是以独裁方式进行社会选择，各

个封建王朝的更迭不过是“皇帝轮流坐，明天到我家”换汤不换药的

独裁权力交替而已。中国几千年的独裁专制统治并不是天上掉下来

的，而是有其深刻的历史、地理、文化原因的。先哲马克思认为，水

利灌溉在亚洲地区的生产方式当中占有重要的地位，“气候和土地条

件，特别是从撒哈拉经过阿拉伯、波斯、印度和鞑靼区直至最高的亚

洲高原的一片广大的沙漠地带，使用水利工程的人工灌溉设施成了东

方农业的基础。”亚洲高原干旱的自然环境，与沙漠地带是几近相似

的。这使得兴修水利灌溉渠道成为亚洲农业生产方式的首要条件。治

水产生了公共行政管理机构。马克思说：“那些通过劳动而实际占有

的公共条件，如在亚细亚各民族中起过非常重要作用的灌溉渠道，以

及交通工具等，就表现为更高的统一体，即高居于各小公社之上的专

制政府的事业。”亚洲社会的政府起源于兴修灌溉的需要。因为灌溉

渠道工程的规模之大，决不是局部的生产机构或个人所能够进行和完

成的，必须由能够跨越地区和个别组织的社会公共机构来承担，所以

只能是“专制政府的事业”。这正如马克思所说：“但是在东方，由于

文明程度太低，幅员太大，不能产生自愿的联合，所以就迫切需要中

央集权的政府来干预。因此亚洲的一切政府都不能不执行一种经济职

能，即举办公共工程的职能。”亚洲社会的公共权力机构由治水而产

生，因此其产生的公共权力机构不是议政机构，而是作为行政机构的

政府。行政本位而不是议会本位，才是亚洲国家政治机构的基本模式

和特征。

德国学者卡尔·威特福格在1957年出版了《东方专制制度》一

书，试图就马克思的理论提出了“水利文明——水利垄断——水利官

僚制”的观点。他认为对灌溉用水进行控制和集中管理是亚细亚生产

模式和东方专制制度的基础。这种模式在埃及、两河流域、印度、中

国等都发生过，它所造成的中央专制是国家、城市、手工业和文字的

起源，也是社会停滞不前的基本原因。

独裁专制一旦与传统习俗相融合，社会往往就僵化成铁板一

块，文明的发展将停滞。中国传统文化是以儒家为代表的。儒家亚圣

孟子说过，“民为贵，社稷次之，君为轻。”按理说，这是典型的民主

思想。在中国源远流长的历史中，闪烁着无数这样可贵的思想火花，

在中国文化习俗中也包含这种民主思想的萌芽。在这种传统思想的影

响下，历朝历代的王朝法律中也白纸黑字的写着类似于“王子犯法与

庶民同罪”的条款。似乎中国古代就有了法律面前人人平等的观念。

然而这些法律法规只能由上层少数人的统治集团作出明确解释，这些

掌握解释权的人就成了以天地良心为幌子的事实上的独裁者。正如柏

杨先生所说：“中国古代统治者也爱护人民，也喜欢人民，也需要人

民。可是，他和人民的关系，他是用什么心态来保护人民呢？他用一

种‘我是牧羊人，你是羊’那样的心态。所以，古代的‘民主’的观

念，爱护人民的观念，是统治者作为一个牧羊人的姿态来爱护他的羊。

基督教里面有所谓‘耶稣是我的牧者’。为什么耶稣是我的牧者呢？

耶稣等于是牧羊人，那么我呢？是他的羊。如果一个人是羊，一个人

是牧羊的，这种关系不是民主关系。它指的是民本，民为邦本，是本，

人本关系，而不是民主的关系。”

在西方资本主义社会，社会选择的方式则又有两种，那就是投票

制度与市场经济。投票制度往往用于政治决策，市场机制毋庸多言即

用于经济决策。在德国、法国以及北欧诸国，投票制度使用范围极其

广泛，常常直接或间接地通过投票作决策而较少采用市场机制，难怪

很多人将这些国家称为社会市场经济国家，或福利国家。实际上，市

场机制是投票的一种特殊形式，市场机制中人们手中的选票就是货

币。

2.非排序式投票

大家都知道，原始社会时，部落内部的重大事务，如各个部落的

酋长与部落联盟之间的统领都是通过投票表决的方式完成的。马克思

称这种社会形态为“原始共产主义”。可见，投票表决是一种古老的

表达民意的制度。最近湖南台的“超级女声”冠亚季军的产生则是通

过短信投票的方式评选出的，经常上新浪（www.sina.com）或搜狐

（www.sohu.com）的网民们经常会看到这些网站会在通过网络投票方

式就某一问题调查人们的意愿。投票在当代中，已经成为我们生活中

必不可少的要素之一。

投票制度最根本的思想是少数服从多数。或者说，通过投票制度，

绝大多数人的意愿得以表达，当然这要建立在投票者确确实实的表达

了自己真实意愿的基础上。在这个前提条件下，投票的过程又分为投

票和计票。投票涉及到所有投票者，有些时候比如政治选举，投票者

人数太多，容易产生混乱局面，这就要求投票的过程应该尽量简捷快

速。计票和投票不同的是，其参与者是少数人，如公共管理的专家和

政府公务员等。计票过程则要求计票人不能徇私舞弊，计票数据真实

可靠。

一般来说，投票分为两种方法，非排序式投票与排序式投票。在

2004年美国小布什与戈尔两人在最终的总统竞选中，采用的就是非

排序方法的计点式选举，这种方法式有多个候选人参加选举，每个投

票人只有一票，并且以无记名投票方式给自己喜好的总统候选人投上

“神圣”的一票。这种方法的计票方式式最简单的多数票法则，也就

是获得票数较多的候选人当选。

当候选人的数目超过两个人时，这种方法就不可靠了，这时，往

往采用两种方法：其一，得票最多的候选人获胜，这叫简单多数法则

或相对多数法则，有的时候采用半数代表制时，候选人必须要获得

1/2以上的选票才算胜出。其二，采用二次投票或反复投票表决等方

法来产生获得半数选票的人选。二次投票法规定，在第一次投票后若

无任何候选人获得半数选票，则应对在第一次投票中得票最多的两个

候选人之间进行第二此投票，从中选出一位得票超过半数的获胜者。

反复投票表决法对每次投票表决中候选人的人数不做规定，而希望得

票太少的候选人自动退出竞选，或由投票人因自己原先所支持的候选

人得票太少，当选无望，转而支持其它得票较多的候选人。就这样，

投票反复进行，直到产生某个得票超过半数的当选者为止。美国共和

党和民主党选举总统、副总统候选人时就采用这种方法。如在北京申

办2000年奥运会时，前几轮都是北京遥遥领先，但在最后以一票之

差惜败于悉尼，当时所采用是取舍表决法。这种方法规定在第一次投

票后若无过半数者，就将得票最少者淘汰，对其余候选人则进入下一

轮投票，如此继续不断直到产生过半数的候选人为止。

这种不具有投票人偏好排序的方法是由内在缺陷的。所谓偏好，

就是说在现有苹果、香蕉、桔子，你喜欢吃哪一个，比如说有的人最

喜欢吃香蕉，其次苹果，再次桔子，而有的人则是最爱吃苹果，其次

桔子，再次香蕉。这就是他们的偏好不同。我们来看一下中国申办

2000年奥运会失败的例子。北京1992年开始大张旗鼓、志在必得地

申请主办2000年奥运会。申办奥运会的投票规则是取舍表决法。前

两轮投票中北京一直领先。经过两轮投票，最后剩下3家：德国的柏

林、澳大利亚的悉尼以及中国的北京。在第三轮投票时，北京获得最

多的票，悉尼第二，柏林第三。这一轮投票结束后，柏林被淘汰掉。

如果就这一次投票，北京就获胜。但问题是还得再投一次票。当在北

京与悉尼之间角逐时，北京输了，悉尼获得了举办2000年奥运会的

主办权。之所以这样的原因就是原来支持柏林的投票人大多数转而支

持悉尼。这就是悉尼获胜的原因。没有人敢说这是公平的投票方法，

这种不公平的内在原因正是非排序的投票规则不反映投票者的偏好

排序。

再比如，2000年台湾所谓“总统”选举的结果是民进党的陈水

扁上台，台湾第一大党国民党输给了弱小的民进党。这次选举是汉贼

李登辉“弃连保扁”阴谋得逞的结果。李登辉做国民党主席时，主张

统一的宋楚瑜被李登辉开除出党。宋楚瑜原来是李登辉政治上坚强的

合作伙伴，因为他的资历，他得到大批的国民党党员的拥护。李登辉

与宋楚瑜分道扬镳使得宋楚瑜另立山头，成立了新党。国民党被李登

辉肢解。

李登辉推出连战作为国民党的“总统”候选人，但是身为国民党

主席却在不同场合下支持陈水扁，使得民进党得以快速发展。“总统”

的竞争最后在宋楚瑜、陈水扁、连战以及独立候选人李敖四者之间

角逐。最后，陈水扁以微弱优势获胜，而宋楚瑜和连战均告失败。如

果李登辉不耍“弃连保扁”的政治伎俩，或者维护国民党的统一而不

使其分裂，使得国民党只有一人参加竞选，那么支持宋楚瑜加上连战

的总票数肯定超过陈水扁。

另外一种情况是，假如台湾选举不是直选，选举规则是先角逐出

两个而不是多个候选人，然后再在这两个候选人之间进行竞选，会出

现什么结果呢？我们可以看一下，假定陈水扁能顺利过第一关而成为

两个候选人之一，而宋楚瑜、连战有一个成为候选人，假定是连战，

在连战与陈水扁之间的最后角逐中，支持宋楚瑜的选民这次会支持连

战——因他们的政治主张相近，那么连战获胜的机会肯定大于陈水

扁。但是事实上不是这样，选举中各候选人同时竞选，国民党因分裂

而使陈水扁得以上台。

以上所说的都是投票选出一个人的情况，当投票要选出两人或多

人的投票表决就不能应用简单多数原则。一般说来，有以下几种投票

方法。

一次性非转移式投票表决方法，这种方法规定每个投票人只有一

票，用无记名投票方式，按照简单多数法确定当选者。在日本议员选

举中采用的方法就是这样，在若干个候选人中根据得票多少排序，选

取其中的前几位当选。复式投票表决。在选举中要产生多少当选者，

每个投票人就可以投多少张票，但对每个投票人只能投一票。但是这

种方法有一个巨大缺陷，由于一个人有多张选票，选票具有了放大效

应，就是在投票中，当各利益集团的实力相差不大，利益冲突却白热

化时，很有可能所有当选者都集中于实力稍强一些的某个集团。比如，

在投票时，有两个利益集团，其中一个利益集团的派别可获得稍微超

过50％的投票人，当选人就将全部选自这个集团。显而易见，这种

投票方式的效率是不高的。为了克服这种方法的缺陷，又出现了受限

制的投票表决方式。这种方法规定每个投票人可以投的票数必须小于

当选人数。在1868年英国大选中，这种方法被实际应用，可惜的是

最终却以失败而告终，该方法仅仅稍稍改进而无法从根本上克服复式

投票方法的缺陷。

其实这些非排序的投票方法很容易被某些野心家所操纵，非排序

投票的任何一个法则都不能保证人民当家作主的真正实现。假设有一

个由3000人组成的原始部落，对部落酋长候选人A和B进行选举，

并假定进行一次性投票，此时有2/3的人反对A而选举B，1/3的人

选A而不选B。我们完全由办法设计另一个制度，通过“民主”的投

票规则使A能够当选。

假定大家都同意服从大多数原则，但程序可以商量。我们把这

300人构成3组——这3组既可以天然地形成，也可以设计。每组中

候选人获得该组的大多数选票，他就赢得这组的选举，3组中赢得2

组即赢得大多数，就算赢了。我想，在实际中这些是任何候选人都能

同意的，并且也认为是公平的。我们假定每组的人数不是一样的：第

一组是50人，第二组是100人，第三组是150人——我们这里人数

的确定完全是随意的。假定第一组中有30人赞成A而反对B，第二

组中有60人赞成A而反对B，第三组中10人赞成A而反对B。即：

第一组A与B的比例是：30∶20；第二组A与B的比例是：60∶40；

第三组A与B的比例是：10∶140。

在这样一种规则下进行投票，A获得了3组中2组的赞成票。A

获胜。在这个例子中，如果不分组就选一次，那么B肯定获胜。这

个例子中，使B获胜的是直选机制，使A获胜的是间接选举机制。

台湾采取的是前者，美国采取的是后者。

除了上述的一些方法以外，非排序式投票制度还有其它很多原

则，如北欧各国采用的名单制，著名的可转移式投票，笔者这里就不

一一作出详细介绍了。然而在这里，不得不提及18世纪的著名法国

思想家孔多塞（M De Condoret）提出的孔多塞法则。他说，当存在2

个以上的候选人时，只有一种办法能够严格真实地反映多数投票人的

意愿，那就是对候选人进行成对比较，若存在某个候选人，他能够按

过半数决策规则击败其它所有候选人，则他被称为孔多塞候选人，应

该由该人胜出。在后面的章节，我们可以通过分析知道，孔多塞法则

实际上也是由内在缺陷的。

3．孔多塞投票法则

所谓排序式的投票制度就是，在投票时不仅要让投票人表达他最

希望看到的多个候选人种的哪一个被选上，还应当让投票者说明他是

以何种方式对这些候选人排序的，即在投票时表达他对各候选人的偏

好次序。上一节提到的孔多塞法则就是最早的排序式投票方法。200

多年前的孔多塞提出这个方法理所当然在他那个时代是一种富有创

造力的制度创新，然而今天的人们已经很清楚这种方法的缺陷。

在博弈论名著《策略思维》中举过这样的一个案例。这个例子以

法国大革命为背景，当时的革命者们攻陷巴士底狱之后，要从三个候

选人种选出一个新平民主义领导者，这三个候选人分别是罗伯斯庇尔

（Robespierre）、丹东（Danton）和拉法日（Lafarge）夫人（后面我

们不妨简称为R、D、L）。革命者们分为三个同等的集团，分别代表

左派、中间派和右派，他们的偏好如下图。

左派的偏

好

中间派的偏

好

右派的偏

好

第一选

择

D

L

R

第二选

择

L

R

D

第三选

R

D

L

择

若是R对D的选举，那么前者会以2：1的比分获胜；如果是L

对R的选举，那么前者也会以2：1的比分获胜；如果是D对L的选

举，那么前者仍然是2：1的比分获胜。我们很清楚看到，三个候选

人都是对等的。至于哪一个能够胜出，完全是看哪一场选举最后进行。

从这个例子中，我们可以看到孔多塞法则下的选举也不并能够完全多

数民意。

根据前面章节所说的位置博弈的原理，不管哪个政党当选，其政

策都是接近的，因而对于大多数中下层的民众来说，无论谁当选（不

过像希特勒这样的国家社会主义者当选元首则是另当别论），日子还

是照常地过，选举孰胜孰败意义并不大。

在公元前一世纪，罗马发生过这样一个真实的故事。从古代罗马

的法律传统来说，一般一个案件的结果有三种可供选择的结果，分别

是：根据现实状况，首先裁定无罪或有罪，若是有罪再考虑合适的惩

罚；根据罗马法体系，听取证词之后，从最严厉的惩罚开始，一路下

寻找合适的惩罚。首先要考虑要不要判处死刑，加入不要，考虑要不

要判处终身监禁。依此类推，如果没有一种刑罚合适，那么该名被告

就将无罪释放；强制性确定该被告的所犯罪行的合适惩罚，然后确定

该不该判处其有罪。

三名罗马法官对一个嫌疑犯的判决意见分别是：A法官认为被告

有罪，应该被判处死刑，其次是终身囚禁；B法官认为被告有罪，应

图14 革命者的偏好

该终身囚禁，其次是无罪释放，并坚决反对判处死刑；C法官认为该

被告无罪，应该被释放，其次是死刑，绝对不能赞同终身囚禁的判决。

这名嫌疑犯生与死的命运无疑掌握在这三个法官手中。由此，我们得

到下图。

A法官的

偏好

B法官的偏

好

C法官的

偏好

第一选

择

死刑

终身监禁

无罪释放

第二选

择

终身监禁

无罪释放

死刑

第三选

择

无罪释放

死刑

终身监禁

如果三个法官能够应用倒推法，正确地预料到如果被告证明有

罪，投票结果是以2：1决定判处死刑。这意味着，原本的投票其实

就是要决定判处无罪释放或死刑。投票结果是以2：1决定判处无罪

释放，这里B法官的宝贵一票决定了被告的判决结果。然而，当法

官们采用罗马法时，首先决定要不要判处死刑，如果死刑不成立，法

官们通过倒推法意识到终身监禁将成为第二阶段的投票结果，由此投

票结果是A和B法官决定判处死刑，而C法官投反对票，被告被判

死刑。如果是首先决定本案的合适惩罚，情况又有不同，仍然采用倒

推法的思路，我们可以推断出该被告会被判处终身囚禁。由此看来，

图15 法官的判决

法庭运作方式或法律体系的不同，即使法官们都是非常公正廉洁的

人，相同的案件也会出现不同的结果。

在数学上，人们已经证明出，只要存在两个或三个以上的选择，

少数服从多数的任何投票方法都会出现循环，投票的人数越多，选择

的候选人越多，就越容易出现多数循环。

4．BORDA法则及其他

由于少数服从多数规则的这些缺陷，一些人又寻找到一些新的投

票方法。最著名的就是两个世纪以前法国大革命时期，伯达（C De

Borda）提出的新方法，一般被称之为Borda法则。

与多数规则不同的是，Borda法则不依赖于一系列两两投票对决。

每个投票人递交一张选票，上面的内容包括他对所有方案的完整的排

序。如2005年春节期间共有《天下无贼》、《功夫》、《一石二鸟》三

部贺岁片，一次根据投票人的偏好，比如笔者本人就比较喜欢看《天

下无贼》，其次是《功夫》，而《一石二鸟》则目不忍睹。如果用数学

符号来表示，则为《天下无贼》＞《功夫》＞《一石二鸟》。每个人

排在最末尾的方案或候选人得到1票，每个人排在倒数第二的得到2

票，依此类推。最后得票总和最多的方案获胜。以投票的多数规则来

确定社会或集体的选择会产生循环的结果，这就好象一只狗在追自己

的尾巴，会没完没了地循环下去。结果，在这些选择方案中，没有一

个能够获得多数票而通过，这又被称作“投票悖论”(Voting paradox)，

它对所有的公共选择问题都是一种固有的难题，所有的公共选择规则

都难以避开这种两难境地。

举个很简单的例子，某公司营销部决定在今年十一国庆节由公司

报销，集体到外地旅游，营销部经理决定让营销部全体成员用Borda

法则投票表决来选择最终的旅游目的地。不妨假设营销部所有员工为

60人，有去黄山、张家界、泰山3个方案供大家选择。这个时候在

60人中3个方案的排序如下图。

员工的偏好

员工数

量

认为黄山最好，其次泰山，

最次张家界

23

认为泰山最好，其次张家

界，最次黄山

19

认为张家界最好，其次黄

山，最次泰山

2

根据Borda法则，去黄山这个方案排在倒数第三位（也就是第一

位）的次数是23次，得23×3＝69票，排在倒数第二位的次数是2

次，得2×2＝4票，排在倒数第一位的次数是19次，得19×1＝19

票，因此去黄山整个方案最终的得票数位为19＋4＋69＝92票；同样

的算法，可以得到去张家界的总票数为67票，去泰山的总票数为103

票。因此该营销部全体员工最终选择的旅游目的地是泰山。

除了Borda法则以外，在我们的身边还有一些其它的投票方法。

图16 旅游方案选

比如，在投票表决时，除了采用过半数决策规则之外，常见的还有

2/3多数原则，该原则规定得票超过投票人数或法定投票人数的2/3

多数票时才能当选某个职位或通过某个方案。比如在美国的议会中，

一会通过的法案在总统行使否决权后，要在参议院与众议院获得2/3

多数票时才能通过该法案。除了2/3原则以外，还有更加严格的3/4

绝对多数原则，比如美国宪法修正案要有3/4以上的州立法机构认可

才算通过。我们在新闻中经常听到的联合国安理会表决中，5个常任

理事国中的任何一个国家都具有一票否决权也是一种特殊的投票方

法。

5．投票操纵的方法：民主的悖论

民主的本质就是每个人都有发言与选择的权利，并且对于其整体

是少数服从多数。从形式上看，投票制度是民主的最佳形式。然而从

实质上看，投票制度却有着根深蒂固的难以克服的内在缺陷。笔者

2003年12月曾在天涯社区经济论坛发过一篇文章，名为《论民主与

人类自私本性的不可调和性与民主的不可行性》，表达的意思是：任

何一种民主的方式都会被操纵，甚至在极端的情况下甚至会转化为独

裁。换一种表达方式就是，无论是少数服从多数的规则，还是Borda

法则，或是任何其他投票机制，都不可能完美无缺，完全可能会被个

人或集团所操纵，以人民的意愿为表象实施少数人的独裁。

先看这样一个例子。假设某国总统候选人有三位，分别是A、B、

C，A、C分别是两种持极端观点的党派或者团体推举的候选人，B

为中间立场的候选人。有3000个投票人，其中三派的力量对比是13：

9：8，其真实的态度是：1300人认为A最好，B其次，C最次；400

人认为B最好，C其次，A最次；900人认为B最好，A其次，C最

次；800人认为 C最好，B其次，A最次。现在有个投票委员会制订

投票规则，分别有是取舍表决方法和Borda法则。

当我们采用过取舍表决方法原则时，第一轮投票，A得1300票，

B得900票，C得800票，C被无情淘汰。这时，进入第二轮，A得

1300票，B得1700票，按照常理，B是众望所归、理所当然的胜出

者。

如果候选人A的1300人支持者是严密组织起来的，并且事先通

过调查已经了解到B和C的支持者大概人数。A这时只要让其支持

者中的200人在第一轮投票中，转而投C的票，第一轮票数比例变

成了11：9：10，B居然在第一轮就被淘汰；很自然进入第二轮后，

A的票数将为1800票，C得票1200票，通过这种合法手段，A候选

人顺利当选。

当委员会采用Borda法则时，情况则是这样，A得票总数为

1300×2+500×1=3100，B得票总数为900×2+2100×1=3900，C得票总

数为得分800×2+400×1=2000，可见，候选人B仍然当选。

事实上即使采用Borda法则，A候选人仍然有策略可以改变竞选

的结果。支持A的1300人只要让其中的1000人慌报其偏好顺序即

可，也就是这1000人转而认为A最好，C其次，而B最次。其余的

300人仍然保持A最好，B其次，C最次的顺序不变。这个时候，A

的总得票数为3100，B为2000，C为3000，很显然，候选人A通过

操纵选票仍然可以当选。这在选举中被称为，个体慌报偏好而使其所

属集团获利。

苏联在最后的岁月里，也曾就或“联”或“散”问题搞过一次全

民公决。公决的结果是约75％的公民主张维护苏联的统一。然而，

在除了俄罗斯以外的十几个加盟共和国内部，其各自的全民公决结果

却是至少有80％以上的公民赞成本共和国从联盟中独立出来。其最

终的结果我们大家都看见了：前苏联一分而成15个独立共和国。这

个结果很难说是公平或者不公平。

由此看来，民主投票不能得出惟一的结果，其选举结果取决于民

主投票的程序安排以及每次确定的候选人的多少，即投票规则。不同

的投票规则将得出不同的选举结果。这就是说，民主投票有内在的缺

陷。

我们再来看一个案例，在一些书中，这个例子被称为三个火枪手

的对决故事。设想一下，有个具有民主气氛的家庭由父亲A、女儿B、

母亲C组成，3个家庭成员组成家庭协调委员会协商有关购买空调的

事宜。假设存在两种购买方案，其一是在两个卧室各装一个空调，其

二是在客厅买一个中央空调。不妨以数字代表A、B、C对两个方案

的满意程度，比如父亲对两个卧室各买一个空调的满意程度为20；

父亲A喜欢抽烟，如果在客厅买空调，由于爱人C的管束，就没有

办法独自跑客厅抽烟过瘾，因此父亲A对仅仅买一个中央空调的满

意程度为-5；当然，如果买三个空调，以C的节俭性格自然不会让中

央空调与卧室空调同时运转，抽烟的问题也就解决，因此其满意程度

为15。A、B和C的满意程度见下图。

家庭成

员

卧室各买两

个空调

仅买一个中

央空调

买三个

空调

父亲A

20

15

15

女儿B

-5

15

10

母亲C

-5

-5

-10

合计

10

5

15

如果两个采购方案分别进行投票表决的话，若家庭每个成员都表

达真实的满意程度，两个方案都只有1票赞同，却有2票反对而不能

被采纳。然而当父亲A与女儿B私下协商，进行家庭“选票交易”

时，父女二人在两个方案的选择中均投赞成票，家庭表决的结果一定

是既在两个卧室各装一个空调，也在客厅买一个中央空调。这时父亲

A的满意程度为15，女儿B的满意程度为10，母亲C则是心疼不已，

成为父女“私下交易”的“牺牲品”，满意程度仅为-10或者说是不满

程度达到10。

由此可见，投票方式的政治民主实在是知易行难，由于排名内部

的模棱两可，造成狡猾的候选人有极大的操纵空间，无论什么规则都

有可能扭曲选举的公平性。所有政治演说也常谈到尊重人民意愿，却

很难做到。通常宣称实行民主制度，远比实际实施民主要容易得多。

毫无疑问，任何一种“民主”形式，只要它不能有效抑制私下交

图17 家庭成员满意程度

易的形成和蔓延，那么终究不可能形成稳定的民主。尽管如此，以上

的这些例子不过是勾结、串通、获取一定利益，但终归在形式上还是

民主。我们再来看下面这个案例，形式的民主居然可以转化为独裁。

假设有一个原始部落，总共有100个猎人，部落规定每次这些猎

人早出晚归地打猎，并把所有打到的猎物带回部落，然后这些猎物在

这100个猎人中平均分配。年复一年，日复一日，多少年来，多少代

来，都是如此。设想某个年代，其中一个猎人富有政治头脑，并具有

与生俱来的领袖气质与领导才能。他采用各种方法，拉拢了50个人，

组成一个利益集团，并和剩下的49个人协商，要求进行投票以确定

每个猎人的打猎技术高低，以此确定猎物每个人各分多少。很自然地，

以51：49的过半数原则，剩下的49人分到得自然很少，不妨假设猎

物的95%被51人的集团平均分享。这个猎人当然不会就此满足，他

仍然采用同样的投票表决的方法，又组成了26人的小集团，从新分

配这90%的猎物。结果不妨假设21人集团分到了85％的猎物。如果

这被排挤的25人中胆敢有人表示不满，这个富有谋略的猎人就可以

威胁冒犯者，如果不满意就通过投票让他得到的猎物更少（当然也是

投票操纵，26人集团当然是支持，而被排挤的剩下的那24人可以告

知他们可以投票分享这个冒犯者的应得猎物，自然他们也会持有支持

态度），分享到的猎物会更少。如果这25个人都屈服了这种分配的状

况，那么猎物的绝大部分被这26人的联盟分享。依次类推，26人转

化为14人，……，最终的结果居然变成了极少数人甚至是这个领导

者占有猎物的绝大部分。这个时候，这个领导者可以用手中的猎物当

成诱饵来招募武士保卫其特权的地位，拥有这样的特权，领导者还可

以分得更多的猎物，有了更多的猎物可以招募更多的武士来维护自己

的特权。这样就形成了一个正反馈系统，两者之间互相加强，这种独

裁专制的系统一直循环到这些猎人可以维持基本生存为止。读者可以

看到，最不可思议的事情发生了，那就是民主投票的结果竟然是选出

了独裁者。

6．阿罗不可能定理

五四以来，民主与科学一样，成为中国人孜孜以求的理想目标。

民主一词源于古希腊的“demos”，原意为人民。其本意是：在民主制

度下，公民拥有超越立法者和政府的最高主权。而在中国民主观念被

简单化、理想化，似乎全民投票就代表了主。的确，在许多中国人观

念里面，民主就是一种投票制度。

然而，从上一小节的分析中，我们看到投票制度采用不用方法得

到不同结论，并且很多方法都有操纵选票的策略，投票制度实在是一

种充满着矛盾的制度。实际上，以代议制投票为核心的民主，并不是

真正的民主，而是一种具有内在的不可调和的假民主。通过投票方式，

欺骗者可以制造一种虚幻的公平与民意氛围，以此实现他的权力意志

或达到其它目的。比如印度、南美、东南亚一些国家的民选政治的结

果往往是只能产生无能、低效和腐败的政府。

对于这种问题，斯坦福大学教授肯尼思·阿罗(K· Arrow) 采用

数学的公理化方法对通行的投票选举方式能否保证产生出合乎大多

数人意愿的领导者或者用专业术语说“将每个个体表达的先后次序综

合成整个群体的偏好次序”进行了研究，在《社会选择与个人价值》

中，他总结出著名的阿罗不可能定理。

事实上，阿罗本身也是以一种绝对理想的假设状态下的“理想选

举”来对这个问题进行研究的。因此，这个结论实际上意味着：即便

在绝对理想状态即每个社会成员的偏好是明确和相对稳定（不受宣传

等因素的严重干扰）、没有种种的具体社会政治生活中的消极因素（通

过种种宣传工具对对手的诋毁、以经济等手段迫使投票人违背自己的

意愿作出选择等等）等的绝对理想情况下，一种能够通过一定的程序

准确地表达社会全体成员的个人偏好或者达到合意的公共决策的方

法也是不可能存在的。人类所能想出的任何办法，都注定无法依赖票

选民主的手段达到实质民主的目的。因为问题就出在选举本身。

毫无疑问，对于一个没有受到特定的外力压迫和挟制、以及有着

正常智力和理性的独立的投票者来说，这些要求没有任何过分之处。

坦白说，如果一名投票者连这些最基本的要求都满足不了，那么我觉

得他要么根本就不是投票而是去捣乱的，要么——精神病院会是更适

合他的居住场所。阿罗的第二步是将选举视为一种规则，它能够将每

个个体表达的偏好次序综合成整个群体的偏好次序，同时满足“阿罗

定理”的要求。

所谓“阿罗定理”也就是：

首先，所有投票人就备选方案所想到的任何一种次序关系都是实

际可能的。也就是说：每个投票者都是自由的，他们完全可以依据自

己的意愿独立的投出自己的选票而不致因此遭遇种种迫害。

其二，对任意一对备选方案A或B，如果对于任何投票人都有A

优于B，根据选举规则就应该确定 A方案被选中；而且只有所有投

票人都有A与B方案等价时，根据选举规则得到的最后结果才能取

等号。这其实也就是说：全体选民的一致愿望必须得到尊重。但是一

旦出现A与B方案等价的情况就意味着可能投票出现了问题。比如

两个方案A、B受两个投票人C、D的选择。对C来说，A方案固然

更好，但B方案也没什么重大损失；但是对D来说，却是A方案就

是生存B方案就是死亡，那么让C和D两个人各自“一人一票”当

然就绝非是公正平等的。在几乎所有的私企之中，我们都能见到类似

的状况。

其三，对任意一对备选方案A、B，如果在某次投票的结果中有

A优于B ，那么在另一次投票中，如果在每位投票人排序中 x 的位

置保持不变或提前，则根据同样的选举规则得到的最终结果也应包括

A优于B。这也就是说：如果所有选民对某位候选人的喜欢程度相对

于其他候选人来说没有排序的降低，那么该候选人在选举结果中的位

置不会变化。这是对选举公正性的一个基本保证。比如，由一位家庭

主妇来决定午餐应该买物美价廉的好猪肉吃还是质次价高的注水肉

来吃，我们很清楚：她对好猪肉和注水肉的“喜爱程度”应该不可能

发生什么变化——然而这一次她却买了注水肉。这一定说明在主妇对

猪肉的这次“选举”中有什么不良因素的介入。当然，要是原因其实

是市场上已经百分之百都是注水肉，那也就意味着“选举”已经不复

存在，主妇已经被注水肉给“专制”了。那不在我们的讨论范围之内。

其四，如果在两次投票过程中，备选方案集合的子集中各元素的

排序没有改变，那么在这两次选举的最终结果中，该子集内各元素的

排列次序同样没有变化。这也就是说：某一组候选人在选举结果中的

相对位置不应该受除他们以外的其他候选人选举地位变动的影响。还

举那个主妇的例子：现在主妇要为自己家的午餐主食作出选择，有三

位“候选人”分别是一元钱一斤的好面粉、一元钱一斤的毒面粉和一

元钱一斤的生石灰。主妇的选择排序就不说了罢。然而现在的情况却

是：在生石灰先生出局之后，主妇居然选择了毒面粉！这一定意味着

有这次“选举”之外的因素强力介入。比如主妇丈夫的单位领导是这

家毒面粉厂家老板的姐夫之类，所以为了照顾小舅子就强制要求属下

员工必须每月购买200斤“指定产品”的毒面粉，不然就不发工资穿

小鞋什么的。阿罗定理3和4的结合，其实也就意味着候选人的选举

成绩应该只取决于选民对他们作出的独立和不受干预的评价。

其五，不存在这样的投票人，使得对于任意一对备选方案A、B，

只要该投票人在选举中确定A优于B，选举规则就确定A优于B。

这也就是说：不存在能够仅凭个人意愿就决定选举结果的投票者。这

也可以表述为：反而产生出**者的选举方式是不可以被接受的。这同

样毫无疑问。

这五条法则无疑是一次公平合理的选举的最基本的要求。然而，

阿罗发现：当至少有三名候选人和两位选民时，不存在满足阿罗定理

的选举规则。也即“阿罗不可能定理”。这其实也就是说：即便在选

民都有着明确、不受外部干预和已知的偏好，以及不存在种种现实政

治中负面因素的绝对理想状况下，也同样不可能通过一定的方法从个

人偏好次序得出社会偏好次序，不可能通过一定的程序准确地表达社

会全体成员的个人偏好或者达到合意的公共决策。人们所追求和期待

的那种符合阿罗定理五条要求的最起码的公平合理的选举居然是不

可能存在的。这无疑是对票选制度的一记最根本的打击。更通俗的表

达则是：当至少有三名候选人和两位选民时，不存在满足阿罗定理的

选举规则。或者也可以说是：随着候选人和选民的增加，“形式的民

主”必将越来越远离“实质的民主”。

西方哲学大师苏格拉底之死是对阿罗不可能定理一个绝佳的证

明。口若悬河的大哲学家苏格拉底是一个在西方文化中不亚于孔圣人

的天才人物。苏格拉底因言出名，也因言获罪。据史书记载，获罪的

苏格拉底面对着公民大会的判决，此次公民大会也经历了初审和复

审，初审中五百个公民进行了投票，结果是280票对220票判处苏格

拉底有罪；复审是决定苏氏是否该判死刑，复审之前，苏氏有为自己

脱罪的辩护权利，希腊民众不仅没有被苏格拉底的口才所政府，反而

被激怒，结果是360人对140人判苏格拉底死罪。这就是希腊的民

主，这个民主甚至被认为比西方民主更先进的民主形式，但仍然从肉

体上把一个对人类社会作出巨大贡献的巨人碾作了尘土。

参考文献：

[1]王则柯（1999）：《博弈论平话》，中国经济出版社

[2]张维迎（1999）：《博弈论与信息经济学》，上海三联书店

[3]谢识予（1997）：《经济博弈论》，复旦大学出版社

[4]施锡铨（2000）：《博弈论》，上海财经大学出版社

[5]王则柯（2001）：《对付欺诈的学问——信息经济学平话》，中信出

版社

[6]白波（2004）：《博弈游戏》，哈尔滨出版社

[7]潘天群（2002）：《博弈生存:社会现象的博弈论解读》，中央编译

出版社

[8]白波、郭兴文（2005）：《博弈：关于策略的63个有趣话题》，哈

尔滨出版社

[9][美]盖瑞·J·米勒（2002）：《管理困境——科层的政治经济学》，

上海三联书店、上海人民出版社

[10] 王国成黄韬著（1996）：《现代经济博弈论：市场经济中的竞争

与对策》，经济科学出版社

[11] 崔之元（1988）：《博弈论与社会科学》，浙江人民出版社

[12][美]迈尔森(Myerson R.B.)著于寅费剑平译（2001）：《博弈论：

矛盾冲突分析》，中国经济出版社

[13][美]朱·弗登博格(Drew Fudenberg)，[法]让·梯若尔(Jean

Tirole)著黄涛等译（2002）《博弈论》，中国人民大学出版社

[14] [英]肯·宾默尔,王小卫、钱勇译（2003）《博弈论与社会契约

——公平博弈(第一卷)》,上海财经大学出版社,

[15] 冯·诺伊曼（2005）：《博弈论与经济行为》，三联书店

[16] 阿维纳什·K·迪克西特、巴里·J·奈尔伯夫（2002）：《策略

思维：商界、政界及日常生活中的策略竞争》，中国人们大学出版社

[17] 岳超源（2003）：《决策理论与方法》，科学出版社

爱华网本文地址 » http://www.413yy.cn/a/25101012/123604.html

身边的博弈论：博弈论与信息经济学浅说

更多阅读

博弈论与信息经济学-----YXY(1) 博弈论与信息经济学

不完全信息动态博弈：精炼贝叶斯均衡-《博弈论与信息经济学》

博弈论的基本概念及战略表述-《博弈论与信息经济学》微观经济学博弈论

贴现因子(discountfactor)-《博弈论与信息经济学》博弈论和信息经济学

《<货币战争>批判》第五章之摩根的官司：罗斯福与银行家的

声明:《身边的博弈论：博弈论与信息经济学浅说》为网友拾荒者分享！如侵犯到您的合法权益请联系我们删除