经济与社会的自发秩序协调着人们在各种互动交往中的行为:市场规则协调发生在特定时间和特定地点的特定商品的交换;货币协调交易;语言协调交流;礼仪准则协调着我们相互间应如何进行社会交往;而习惯法限定了对人及财产所采取的可接受的行为的界限,并告诉我们逾越这一界限将意味着什么。这些非正式制度如同其他许多正式制度一样,至少部分地都是演化力量的结果。它们是经由人们在长期的、重复的交互作用的互动行为中积累而形成的。
本章中,我们采用博弈分析对自发秩序型构所作的解释,尽管也运用了均衡的制度观,但不同于新古典经济学的是,我们所主张的均衡是在一个动态博弈的框架中才能被理解的。演化博弈的动态过程在于解释自发秩序的均衡是如何形成的。换言之,如果说新古典经济学旨在描述的是,一旦尘埃落定后世界看上去会怎么样的话;那么演化博弈的制度分析则对尘埃是如何落定的过程感兴趣。另外的一个特征在于,尽管演化博弈中行为人的理性对于决策十分关键,但是我们并非新古典之超理性的主张者。我们认为,任何弈局中的行为人尽管不乏理性,但他们只是有限理性而非超理性的。如同我在本章第7.2节指出的那样,自发秩序旨在解决社会群体内部反复出现的诸多事态或问题。根据玛格丽特和肖特所总结的四类博弈问题型构自发秩序的事实,我们论证了自发秩序在无限次的超博弈中得以型构的客观事实。这些过程说明,自发秩序本身只是基于选择压力的自发演化力量作用的结果,它表现为人们互动交往行为的结果,却不是人类理性的创造物。习俗和惯例之类的自发秩序一经确立,并且如果能在足够长的时间内有效扩展的话,那么演化力量导致的对自发秩序的遵循,常常替代很高程度的个人理性。
但是,正如我们看到的那样,习俗与惯例之类的自发秩序并不是永久不变的。即使我们将其视为一种演化稳定均衡的结果,其驻存也仍然只具有阶段性特征,而长期来看,自发秩序仍然是处于动态演化之中的。这就需要我们再次重申演化博弈论的均衡观与新古典经济学均衡观的差异[1]。首先,演化博弈假定博弈方是不固定的,而是取自大量的潜在博弈群。其次,个人之间交互作用的概率依赖于外生的因素,例如关于他们生活空间的一个定义适当的接近性或交往可能。再次,博弈方并非具有完全理性,也并非充分了解他们所处的世界;他们只能根据零散的信息进行决策,因此任何模型都是不完全的;而且由于他们无法在足够长久的时期内具有良好的前瞻性,因此演化稳定的均衡注定是阶段性的。最后,演化博弈假定动态的过程会受到随机扰动的冲击,这些扰动可能来自于不确定性引起的外部冲击和行为的不可预见性,也可能来自于信息不完备造成的互动交往中的机会主义等。[2]但正如演化博弈指出的那样,正是由于这些随机扰动的冲击扮演着如同生物世界中的“变异”角色一样,它们不断地测试着当前的自发秩序以及身处于该自发秩序之下的行为人的适应性和自生性(viability)。进而,它们意味着演化动态博弈永远不会停止,它总是处于变动之中。
从上文的分析中,我们已经指出,习俗与惯例作为人们经济活动和互动交往中的“子博弈完美纳什均衡”型构而成的自发秩序,其特征就在于稳定性,(韦森也将这一特征描述为“驻存性和延续性”[3])。相对于子博弈完美纳什均衡的演化稳定性而言,动态博弈中的纳什均衡具有一种内在不稳定性,其原因在于它不能有效排除博弈方策略中所包含的不可信的行为设定,也不能解决动态博弈的相机选择引起的可行性问题。由于动态博弈中的纳什均衡概念的这种缺陷,导致在动态博弈分析中行为人常常无法依据纳什均衡而做出可靠的判断或预测,其作用和价值也随之受到限制。托马斯·谢林(Thomas Shelling)在他的一系列社会实验中发现,有限理性条件下行为人在协调博弈中相互协调决策的能力,远比博弈论所描述的适应性要灵活的多。[4]那么人类协调彼此活动并做出有效决策的能力从何而来呢?谢林对此的解释是,这种能力来自于人们在社会生活中所共享的某种“凸显性”(prominence)或“凝聚点”(focal point)。即每个人似乎都是不约而同地做出能够恰好彼此协调的决策,来协同彼此的意向和预期。换言之,每个人好像都可以预见别人会如此行事。谢林指出,这种“凸显性”或“凝聚点”并不完全来自行为人的逻辑推理的理性算计,而是可能出于某种“想象力”(imagination),亦可能出自某种模仿、前例、偶然安排、对称,以至美学或几何学所称的“组态”(configuration)等因素。[5]韦森也指出,这种协调能力也可能来自凡勃伦所说的“本能”或艾尔斯特(Jon Elster)所理解的“个人感情和行为的内在倾向”,亦可能来自奥克肖特(Micheal Oakeshott)所谓的“实践知识”或吉登斯(Anthony Giddens)所说的“实践意识”,抑或是博兰尼(Polanyi.M)所指出的人们在获取他们的技术性习惯和技能方面的“默会理解”,又或者是演化博弈论者在假设中采用的“共同经验”。[6]但不论何种解释,这种“凸显性”和“凝聚点”对于经历一定阶段的社会过程的社会主体而言,都较有说服力,但对于那些在原初意义上参与协调博弈的行为人而言,似乎就无法得到解释。因为,上述说明无疑都是基于一定的认知进化水平和有限理性所做出的。而对于那种史前人类,或者在奥菲克意义上进化的人类而言,则缺乏说服力。相反,倒是认知科学和脑进化理论对于这一现象的解释更令人信服。拉兹洛在他的广义进化论中指出,“正是在多细胞、细胞抑或亚细胞组织层次上的不那么复杂的系统,都具有对环境的那种感受性或应激性,都有对内、外环境的含混的‘感受’,而人的精神不过是这种感受的高级的、精巧的、复杂的变体。而各种感受本身又是不同层次复杂系统求生的特征功能。随后则进化生产出越来越多的系统,离平衡越来越远的系统,求生存的要求就变得更加强烈了。……在进化的生物物种的生理学中,神经系统是从原始的神经而进化到复杂的大脑。” [7]我也曾在第6.2.3节指出,认知得以形成的社会范畴化的基本策略依赖于一种“二元编码机制”(binary codings)。所谓二元编码机制,乃是作为被驱动的策略家的社会行动者,在对人和物以及各种事实现象等进行分类的过程中,采用对立概念来进行区分的方式或策略[8]。二元编码机制,是人类物种最基本的认知逻辑,甚至是人类最基本的生存现实描述。因此,据此反思谢林实验中的各种协调结果就不难发现,在缺乏有效的共享知识和交流沟通条件下,行为协调的决策依赖于人们认知当中最为容易辨识的一些带有“凸性”或标志性的“记忆碎片”。由于人脑对外部信息编码过程的生理相似性,在某些协调类型博弈中,即使规则禁止交流或是由于受共享编码的限制而无法交流[9],这些带有“凸性”或标志性的“记忆碎片”,也可以为互动主体协调彼此行为提供基本的、认知指导方面的“逻辑坐标”。而一旦这种逻辑坐标在适应性和适存度方面达到一定的临界值,就会导致行为协调中出现(谢林所谓的)“凸显性”和“凝聚点”。
然而,一个较为麻烦的问题是,各类博弈问题在无限次重复的超博弈中型构的自发秩序并非只具有一个均衡解。例如在重复的斗鸡博弈中,一旦双方选定了某种强占优或精炼纳什均衡的演化稳定策略,他们就会在重复博弈中固守各自的策略,从而形成一种“习俗或惯例”,但这种由博弈双方强占优策略组成的唯一均衡解的情况只是一种特例,在其他协调博弈中仍然存在选择的困难。例如,考虑表7-1的交通博弈时,在重复博弈的收益矩阵中存在三个均衡解:即(靠左,靠左)、(靠右,靠右),以及两个博弈者随机选择一个各占50%的靠左或靠右的策略概率。因此,在这类协调博弈中,由于每个博弈者并没有关于对方策略的准确信息,所以博弈的均衡解并不是唯一的。换言之,不同群体系统内部的交通惯例是选择靠左还是靠右,最终仍然取决于互动主体之间的协调能力。但各种自发秩序都明确显示了谢林的凸显性和凝聚点的特征。因此,我们需要借助协调过程进一步说明三个问题:(1)在特定群体内部的既定的自发秩序(习俗与惯例)是如何型构而成的;(2)不同群体系统内部的不同自发秩序状态是如何形成并有效运行的;(3)从长期的历史发展来看,既定的习俗与惯例之类的自发秩序又是如何演变的。以下我将结合演化博弈论制度分析中揭示的三种演化效应,对此做出说明。
[1] 转引自:培顿·杨,《个人策略与社会结构:制度的演化理论》(中译本),上海:上海人民出版社,2004年,第6页。
[2] 关于演化博弈的动态模型的假设和基本规定,亦可参考:韦森,《经济学与哲学》,上海人民出版社,2005年,第178-179页。
[3] 参:韦森,《经济学与哲学》,上海人民出版社,2005年,第178页。
[4] Shelling(1960)曾在他的学生中做过一些实验和调查,发现人们在社会活动的决策方面,有远比博弈论所描述的丰富得多且令人惊奇的协调他们的相互决策的能力。Shelling做了如下四个结果十分惊人的实验: 例一,在相互没有沟通的情况下,让两个人同时要一个硬币的正面或反面。如果两个人要的相同,他们就会赢一笔奖金。实验结果是,36个人要正面,6个人要反面。例二,告诉一个学生与另一个学生在纽约一处相见,但既不告诉他和谁相见,也不告诉他在何处相见,更不准任何人互相沟通,而只让两个人猜测到一处相见。实验结果是,大多数学生均选择了纽约中央火车站。 例三,在例二中亦不告诉任何人约见时间。但结果几乎所有人都选择了中午12点。例四,让两个学生在不沟通的情况下分别把100美元分成A、B两份。如果这两个学生分的A、B两份相等,二人各得这100美元。如果不等,谁也得不到一分钱。实验结果是,42个学生中有36人把100美元分为50美元两份。这四个实验例子非常简单,但却触及到社会现象研究中的许多最深层的问题,即人类有非常惊人的协调他们活动与决策的能力。(参见韦森,《经济学与哲学》,上海人民出版社,2005年,第153页。)
[5] 转引自:韦森,《经济学与哲学》,上海人民出版社,2005年,第153-154页。
[6] 参:韦森,《经济学与哲学》,上海人民出版社,2005年,第154页。
[7] 参:拉兹洛,《人类的内在限度》(中译本),社会科学文献出版社,2004年,第185页。
[8] 参:施密特,2003,《政治的概念》,刘宗坤等译,上海人民出版社,第138页。
[9] 一种情况是,我们可以在现在的研究中假定博弈规则为非合作博弈,那么交流沟通就会被禁止,而协调博弈只能依据行为人分散的个人知识或共同经验;另一种情况就是,设想在不存在语言和文字的情况下,受制于交流工具的限制,交流也不可能时,协调就只能依据分散的、缺乏共享编码的个人认知。