谢邀
我来讲讲囚徒困境。
囚徒困境的定义我承认,对于大部分稍微略懂一些经济学的人来说,囚徒困境都不会是一个陌生的名词。
在维基百科上,对于囚徒困境的经典背景设定如下:
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人有罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。若二人都互相检举(互相“背叛”),则二人同样判监5年。如果囚徒困境博弈只进行一次,那么对于双方来说,“背叛”是“占优策略”(即,无论对方选什么,“背叛”都比“合作”更好),因此双方均会选择背叛,这构成了“占优策略均衡”(“纳什均衡”的一种)。同时应当注意到,如果双方都选择合作,将会得到一个对双方都更好的结果(称为“帕累托优”)。综上所述,(单次)囚徒困境可以总结为:
存在占优策略均衡,其结果帕累托劣于均选择被占优策略的结果。
有很多稍微多了解一些囚徒困境的同学,往往会迫不及待地进入下一步,比如: 这个问题就有1200人关注。
相比之下, 这个问题却只有107人关注,整整小了一个数量级。
很抱歉,这个答案已经注定要和那1200人分道扬镳,而加入那107人的行列了。如何应对囚徒困境自然很重要,但是我们与其像批判家那样解构一件艺术作品,不如先学会如何拥有一双发现美的眼睛。接下来,我将从经典的例子开始,带大家走进日常生活中方方面面潜藏着的“囚徒困境”,领略“囚徒困境”在真实生活中惊人的解释力。
一些经典的囚徒困境一提到囚徒困境,大家脑海里会想到哪些经典的例子呢?即使排除掉“警察和嫌犯”的故事,以下这些例子几乎必然会出现在大部分与博弈论、纳什均衡相关的教科书或科普书籍上:
1. 价格战(现实案例:艰难维持的OPEC石油输出国组织)
双方企业可选择高价或低价,价格较低者将获得更高的市场份额,因而获得更高的利润。结果是,双方企业均选择低价,市场份额不变,但收入减少了。
2. 广告战(现实案例:美国烟草行业的广告战)
双方企业可选择打广告或不打广告,然而打广告的一方将抢走更多的顾客,因此双方都会选择打广告,结果是双方该有多少顾客还是有多少顾客,却白白花费了广告的费用。
3. 军备竞赛(现实案例:美苏两国的军备竞赛、考试前大家都熬夜复习)
两个超级大国,为了避免受到对方在军事上的压制,无论对方是否发展军备,自己选择发展军备都更加有利,结果双方搞起了军备竞赛,相互仍然势均力敌,而耗费了大量的军费。
4. 公地悲剧(现实案例:北大西洋鳕鱼濒临灭绝)
在一片草场上,有许多牧民在放牧。由于草场是公共物品,不属于任何一个牧民,那么对于每个牧民来说,无论其它牧民放多少只羊,自己多放一些羊都比少放来得更好,于是所有牧民都增加了羊的数目,最终把草场都吃光了。请大家先记住这些例子,这有助于你构建对于囚徒困境的一个直观理解,你就能够更快地发现下面这些现实案例当中潜藏的囚徒困境了。
更多不经典的囚徒困境首先,来举一些我的回答中涉及到的囚徒困境:
1. 为什么工会罢工常常不能如期进行?
一些美国的Uber司机打算进行一场罢工以提高自己的收入,比如他们希望在APP上设置小费的选项,提高起步价和每公里价格,于是他们做了上面这样的海报。
然而,Uber司机相互之间存在费用的竞争。在路上的其它司机越少,某位司机自己揽到客人的几率越高;同时,当用车的需求远超司机的供给时,Uber会启动“浮动定价”来增加供给。所以一名司机如果不参加罢工,不仅能够获得更多的生意,而且每英里的费用还能提高。这给不参加罢工提供了很强的激励。
结果是,在本应当是罢工的时间段,芝加哥路上的Uber司机数量仍然非常巨大,甚至没有达到启动”浮动定价“的程度。
2. 亿万富翁如何不花一分钱操纵议会?
从图上就可以看出:均选择“支持”并不是最优解,最优解应该是均选择“反对”。法案通过了,双方虽然表面都没拿到那十亿打了个平手,但是双方都没得拿软钱了,比原来的处境更加糟糕。
更加气人的是,因为法案通过了,那位古怪的亿万富翁按照约定,也不需要付那十亿美元。
3. 为什么会有“中国式让梨”?
在“中国式让梨”的过程中,双方都试图通过“让梨”来发送自己有更好“品德”的信号,但是双方又都预期到对方发送这样的信号本身是误导的(显然双方都想要大梨),结果是最后双方对于对方的品德的评价也没有改变。但是如果任意一方选择不发送信号(不让梨),那就会被对方认为是“更”没有品德的表现(相反方向的评价偏离)。于是双方只能选择都让梨,增加了沟通的无谓损失。
4. 为什么地铁乘客往往不遵循“先下后上”的规则?
所以如果你和另一个leader站在地铁前面,各自可以选抢和不抢:
对方抢,你不抢,则要等另一列都上车或者下车的都下车才有可能上车;你也抢,那僵持一小会儿成功上车。抢更好;
对方不抢,你不抢,等下车的都下车再上车;你抢,你先上车。抢也是更好;
于是大家都抢了。
接下来这些例子主要来源于平时的一些阅读材料:
5. 为什么不同学校同一专业的研究生项目在相近的时间发Offer和截止回复?
对于任何一个学校来说,如果别的学校早发Offer早截止,那自己晚发就会吃亏,所以也要早发;反过来,如果别的学校晚发Offer晚截止,那自己早发可以抢到更好的学生。结果是所有学校都会早发,留给各个学校的行政工作人员的审阅材料时间就减少了,但各自能录取到怎样的学生并不会发生改变。这种提前会一直进行下去,直到审阅材料的时间只能让行政人员堪堪卡着点完成,各校才会停止继续提前。
6. 为什么美国许多学校规定入学不得晚于多少岁?
对于孩子来说,入学时是6岁还是7岁,意味着在智力、体格发育各方面有很大的差别,年龄更大的学生因而能够获得更好的资源(比如在社团中更快晋升、比如在橄榄球赛中充当四分卫)。于是家长倾向于让孩子晚入学,结果是所有孩子都晚入学,原先因为年龄更大带来的优势就丧失了,只会让孩子耽搁一年上学。因此学校不得不规定入学最晚年龄,以免家长们把孩子入学的时间一拖再拖。
7. 冰球、曲棍球比赛为什么规定运动员必须戴头盔?
不戴头盔的运动员,将比戴头盔的运动员获得更好的视野,相比之下,潜在的受伤风险带来的损失要小得多。然而,如果所有运动员都不戴头盔,则在视野上不会有哪一方更占据优势,但双方一旦受伤,其严重程度将比戴头盔时有大幅提高。因而冰球、曲棍球比赛索性直接规定运动员必须戴头盔。
8. 为什么女性要化妆?
显然,如果别人不化妆,化妆能帮助你提高姿色;而如果别人都化妆,那你就更有理由化妆了。结果是,化妆前后的美貌程度排名并没有多大变化,然而大家都得花银子去买一大堆化妆品放在家里。
9. 为什么鹿角那么大?
鹿角越大,雄鹿在争夺配偶的斗争中就占有更大的优势,因此在演化中鹿角不断变大。然而,如果所有鹿的鹿角都变大了,那么争夺配偶的胜率并不会有变化,相反,过分硕大的鹿角反而会成为累赘,比如在树林中被树枝缠住结果活活饿死。
10. 为什么会出现GPA通货膨胀?
对于评教系统很完善的学校,如果教授给学生打的分数高低会影响到学生对教授的评价,那么无论其它教授如何打分,每一个教授自己的选择总是越高越好,结果是GPA水涨船高,直到实在无法继续上涨为止。这一论断也能从反面得到印证:曾经有一位教授给我们上课时表示,反正我已经评上正教授了,你们给我评教的分数不会影响我的教职,所以我打分绝对不会注水。
11. 亚马逊的零售书店项目是如何推广的?
亚马逊Amazon给零售实体书店提供了两种项目:一种是零售书店可以以很大折扣购入Kindle,另一种是零售书店可以以较小折扣购入Kindle,同时用户用这些Kindle买书可以给零售书店返利。对于零售书店来说,参与这样的项目可以获得额外的营收,然而,如果大部分零售书店都加入这个项目,那么亚马逊的电子书市场势必对零售书店的市场造成巨大的冲击。
12. 应该买额外的便宜筹码吗?
在一场扑克锦标赛上,你可以花65美元买2500个筹码,在这个基础上,你还能再多花5美元再多拿500个筹码。然而,后面这5美元不会进入奖金池,而是被比赛组织方直接抽走了。对于大多数人来说,后面这5美元的500个筹码显然很合算。然而,如果你多买了5美元500个筹码,奖金池中的奖金没有增加,摊在每个筹码上的奖金额度就降低了,如果所有人都买了那额外的5个筹码,你的3000个筹码的价值仍然是65美元。
13. 两党谈判的死局(Deadlock)
为了解决美国2011年债务上限危机,两党将组建一个超级国会,各选派6名代表。对于两党来说,将更极端,更具备谈判能力的议员放在超级国会中,都是更优的选择,说不定能够让对方直接放弃。然而,如果双方都选择这样的议员,意味着超级国会的谈判将很难达成共识。
总结理性人总是最大化自己的效用,这一点是不会变的,也因此在我们的日常生活,在世界的运转中,会有那么多“囚徒困境”的例子。然而,倘若因此得出“人心险恶”的论断,并将大棒打在“理性人”的假设上,那也大可不必。
首先,有些囚徒困境的结果,比如价格战等等,在不利于商家的同时,却是有利于消费者的;
其次,即使同样是占优策略均衡,有时候均衡结果也可以是帕累托最优的;
再退一步说,我们常常说在现实生活中可以避免或者说解决囚徒困境,然而避免和解决的方法,仍然没有脱离理性人假设:
为什么重复博弈能够维持合作?因为合作的长期收益高于单期的背叛;
为什么契约可以维持合作?因为契约改变了囚徒困境博弈中相应的支付,使得修正过的博弈中合作成为新的占优策略。
如此等等,其实更加说明了一个问题:
与其对利己行为作口诛笔伐的无用功,不如想想,如何用合理的制度和激励来引导人们的利己行为,使得人们在作出最优化自己效用的选择的同时,能够为社会创造最大的裨益。