摘要:在规范参与人行为时,制度是重要的。如何以较少的执行成本设计出高效率的制度,减少实施过程中所产生的冲突,是制度经济学研究的重点。本文通过建立一个简单的进化博弈模型来分析制度设计、形成与演化速度,重点讨论如何以最小成本或者最快速度使经济系统达到制度设计者意想目标等问题,为制度设计提供理论依据。最后应用本模型分析了“休克疗法”与“渐进式改革”方法的选择问题。
关键词:制度设计;逆转成本;随机稳定性
On the cost and the velocity of institutional change and institutional design
Abstract: Institution is critical to regulate the behavior of participants. How effective and efficient institution is developed with comparatively lower operation cost and conflict is the keystone of researches on institution economics. By developing a simple evolutionary game model, the paper tries to analyze the installation of institution and their formation and evolution speed, with emphasis on discussion of a series of issues, which are to develop the economic system with the lowest cost and in the fastest way, satisfying the mechanism designers, to provide theoretical basis for institution design and to analyze with the model the selection issues related to “shock therapeutics” and “evolutionary reform”.
Keywords: institutional design; adverse cost; stochastic stability
引言
在有关人类互动问题上,社会科学一直存在着理论与证据之争。实验经济学显示人类行为要比单纯的理性行为假设所描述的情况来得复杂。1992年诺贝尔经济奖得主加里·贝克尔认为个人有强调整体取向与强调自私取向的两类偏好[2],决策时需要在两者之间进行权衡取舍。现实中,影响人类行为因素是非常复杂的,特别地存在交易成本时制度就变得非常重要。制度是人为制定的限制,用以约束个人互动行为及其选择范围,它包括了人类制定来规范人际互动限制的任何形式。制度约束包括:规定个人不可以从事的行为及何种条件下个人可以从事的行为。制度有效运行的关键在于判定犯规的成本以及处罚的轻重,处罚依赖于判定违规的可能性,它多种形式,没有处罚的制度是无效的。制定规则时通常都要考虑实施成本,也就是说一定要有办法确知有人违反规则、衡量违反的严格程度以及抓到违反的人,当实施成本超过收益时就不值得设立制度。制度的制定是非常复杂的系统工程,随意设计的制度可能会招至极大的成本而不利于经济社会的发展,甚至可能引发社会冲突。如何设计出最小成本的制度成为学术界研究的重点。本文将运用进化博弈理论方法来探讨制度设计成本、演化速度等问题,为制度设计者提供理论依据。
一、制度的起源及其变迁
如果在一些问题上形不成某种共识,一个人就不可能与另一个人相互交往,人们相互交往依赖于某种信任,信任是以一种秩序为基础,而要维护这种秩序就要依赖各种禁止不可预见行为和机会主义行为的规则(柯武刚、史漫飞)[2],制度通过影响交换与生产的成本来影响经济绩效, 要深入讨论制度就必须清楚地了解制度的起源与变迁。
1.1 制度起源
根据柯武刚、史漫飞《制度经济学》一书给出的定义:制度是人制定的规则,规则限制人们可能采取的机会主义行为[3],制度保护个人的自由领域,帮助人们避免或缓和冲突,增加行为的可预见性,减少摩擦和不确定性。有关制度的起源问题一直是学术界研究的焦点,到目前为止,主要包括“演化”与“设计”两种观点。
持“演化”观点的学者认为:某种规则被越来越多的人采用时,就会演变成一种传统被长期保持下来,通行于整个共同体,由这种方式演变而来的制度称之为内生制度,它包含着大量经过精炼和检验的先人智慧。内生制度诉诸自愿协调且随经验演化而来,对每个参与人来说存在一个退出机制,并且只有当采用某项经验的人数超过一个临界点以后,经验才会变为一项内生制度。内生制度可以为分四种类型:一是习惯,人们出于自利动机而遵守这类规则(不遵守就会将自己逐出交往圈);二是内化规则,是指人们通过习惯、教育和经验形成的规则,并达到在正常情况下无反应地、自发地服从规则的程度。人们将许多规则内化为了自己的偏好,并始终如一地运用着这些规则,违反它将会使自己感觉到内疚;三是习俗或者礼貌,违反这种制度并不会自动地引发有组织的惩罚,但共同体内的其他人都会非正式地监督遵守规则的情况,违反者会落下不好的名声或者发现自己被社会排斥,在极端的情况下,甚至会遭到谴责;四是正式化的内生规则,这种规则是随经验而出现的,但它们在一个群体内是以正规的方式发挥作用并被强制执行的,共同体内生地创造大量的如行业自律这样的规则,然后由第三方以有组织的方式在其中间执行。内生制度有时也被称为“软制度”,因为它们留下了变异的余地,附属于内生制度的惩罚在许多时候是可变的,这就增强了它们的演化能力。
持“设计”观点的学者认为:制度是由一个诸如政府那样的、高踞于社会之上的权威机构设计出来并强加于共同体即外生制度,它被自上而下地强加的执行的,是人有意识地制定的、立法通过的以及由政治过程决定的并靠政治行为由上面强加于社会的规则(青木,122页)[3]。外生制度配有正式的惩罚措施,这些惩罚措施以各种正式的方式强加于没有退出机制的共同体各成员。外生制度由于规定参与人不可以做什么,是以恶制恶的,但在执行时需要付出较大的验证成本,需要较多的信息,缺乏灵活性。另外,外生制度可以以突变的方式产生,但并不是每一种突变都会产生赖以成立的外生制度,只有那些与内生制度形成一种互补关系才可以成为具有自动实施作用的制度。
1.2 制度变迁
制度变迁决定社会随时间演进的方式,所以研究制度变迁是理解历史演变的关键。制度通过改变人们的选择而不断地演化,由于这种改变涉及到参与人利益的重新分配,具有关联性和互补性,变迁并不是非常容易发生的。原因有四:首先,制度是参与人关于博弈重复进行方式的共有信念系统,它对环境的微小而连续变化是稳固而耐久的。其次,制度化和参与人能力发展之间的反馈机制将强化制度的耐久性,制度以特定方式根据参与人物质和人力资产情况而赋予不同的内生价值,作为反应,参与人沿着增加其价值的方向积累资产和发展潜能,继而强化制度沿该方向演化;再次,制度按参与人的政治权力和技能赋值方向演化,从现存制度获益较多的参与人赋有维持现状的资源和能力;最后,各种制度关联将产生关系网而阻碍制度创新。正式制度是非正式制度根基,但是在日常生活互动中很少区分开来。内生制度来自社会传递的信息,而且代代传承为我们称之为文化的一部分。文化是指通过教育与模仿,从上一代传承下一代的知识、价值和其他影响行为的因素,文化提供了一套以语言为基础的认知构架,使其能记录,诠释感官所传至脑中的信息,因而影响非正式制度或规范的形成。
通过共同体成员的经验等自发演化而来的内生制度可能并不是最有效率的,存在与社会经济发展不相适应的可能性。在许多时候需要通过外在力量采取合适的措施改变系统演化的均衡使之演化到管理者意想的均衡,形成有利于实现管理者目标的制度。由于外在措施的实施对任何人而言都没有退出机制,不当的措施极易引发系统的冲突,招来极大的社会成本。采取何种措施、如何采取措施才可以使系统能够以尽可能快的速度、最小的执行成本演化到意想均衡是值得深入研究的。
二、制度变迁的进化博弈模型及其基本结论
进化博弈理论至少自Lewontin(1960)[4]用于解释生态现象就已经产生了,并被广泛应用于生态学、社会学及经济学等领域来研究群体行为的演化过程及其结果。该理论从有限理性的个体出发,以群体行为为研究对象,认为现实中个体并不是行为最优化者,个体的决策是通过个体之间模仿、学习和突变等动态过程来实现的;系统的均衡是达到均衡过程的函数,即均衡依赖于达到均衡的路径。进化博弈理论包括了大量描述参与人是如何产生适应性行为及如何提供使信念与行为一致的协调装置的模型。制度就是一定范围内的所有参与人都遵守的一种行为规则,制度的存在就是使参与人之间的行增加可预见性,也就是说参与人行为之间必须满足一种协调机制。应用进化博弈理论中的协调博弈模型对之可以进行很好的解释,因为制度的目的无非就是使博弈协调于某一个有效率的均衡,制度设计的实质就是协调博弈中的均衡选择问题。下面运用进化博弈理论方法通过对分析系统的影响因素及行为调整的动态过程来研究演化过程的随机稳定性,以达到驾驭系统实现意想均衡之目标。
2.1 确定性动态下的制度变迁
以进化博弈理论中经典的猎鹿博弈[4]为例来考察某个社会的制度变迁。我们把某社会所有参与人看成一个大群体,其中每一个体都有两种可供选择的策略:猎兔与猎鹿,这是一个典型的对称协调博弈模型。假定该社会可能形成猎兔与猎鹿两种制度(可以看出猎兔制度是风险占优的,而猎鹿制度则是帕累托占优的),博弈的支付矩阵见下表:
该对称协调博弈有两个纯策略纳什均衡,(猎鹿,猎鹿)与(猎兔,猎兔)与一个混合策略纳什均衡(是不稳定的鞍点均衡)。用Harsanyi, J. and Selten, R. (1988)[5]的定义,前者是支付占优均衡;后者则是充分考虑到非均衡路径上支付的风险占优均衡。假定整个猎人群体共有15个参与人[5],在确定性支付单调动态[6]下。计算可得:如果群体中超过6人选择猎鹿则随着时间的推移,整个群体最后都会选择进化稳定的猎鹿策略而形成猎鹿制度;如果群体中超过9人选择猎兔,那么猎兔均衡是进化稳定的,随着时间的推移,整个群体将会趋于选择猎兔制度。如下图:
从整个社会来看系统最后是处于哪一种制度,依赖于系统的初始条件。显然,系统极可能进化稳定于低效率的猎兔制度。为了使社会向猎鹿这一理想制度变迁,就需要采取强制性措施。如果不考虑随机因素影响,那么至少有两种方法可以人为地改变社会制度而使之达到高效率的猎鹿制度:一是采取措施使得选择猎鹿的人数超过9人,使得系统初始状态处于猎鹿均衡的吸引域中,这样系统就会自动演化到意想猎鹿制度;另一是采取改变博弈支付的强制性措施而使得猎鹿成为唯一占优均衡或者缩小猎兔均衡的吸引域,那么系统也会自动演化到猎鹿制度。然而,该模型仅仅考虑到单次非重叠冲击对系统的影响,而现实中系统在演化过程会受到许多随机因素影响,这些因素极可能使得系统发生转向而演化非意想均衡。因此,为了使系统能够演化到意想均衡,形成意想制度,就需要把随机因素纳入到模型中。
2.2 随机动态下的制度变迁---基于不变突变率
上述模型没有考虑到随机因素影响,难以现实地描述系统行为演化。为了更现实地描述系统的随机稳定性,需要在协调博弈动态演化过程中引入随机冲击。
随机稳定状态是由Foster and Young(1990)[6]提出描述系统长期均衡的概念。说向量是随机稳定的,如果随着随机影响,极限密度对的每一个小邻域都赋有正概率;更精确地说, 其中。其中是当时,的极限分布,表示随机因素对系统所产生的影响。粗略地说,一个状态P是一个随机稳定的,如果在长期中,随着随机冲击因素影响的不断变少,系统几乎一定(nearly certain)不会离开P的任意少的邻域。它有如下性质:随着及,它是一个最小闭集。从定义可以看出,随机稳定状态是一个统计意义的概念,系统的随机稳定状态取决于吸引子对应吸引域的宽度,吸引域越宽则系统回到该吸引域可能性就越大,回来的次数就会越多,随着突变率趋于零,系统几乎一定会处于该吸引域,对应吸引子就是随机稳定状态。
Peyton Young 1990假定存在背景突变率,并在此基础上引入不随系统变化而变化的突变率,那么系统在状态之间的转移概率矩阵中各个元素不为零,马尔可夫过程就满足遍历性要求,从而存在平稳分布,利用Michihiro Kandori, Greorge J. Mailath, Rafael Rob (KMR,1993)[7]的结论可得:上述博弈存在唯一的随机稳定状态即猎兔,该社会在多数时间都会选择猎兔这一并不具有帕累效率的制度。
2.3 随机动态下的制度变迁---基于可变突变率
引入不随系统状态间变化而变化的背景突变率就会使系统在两个均衡之间来回跳跃,由此可得,系统在每个状态停留的概率完全是由支付决定的,随机稳定状态也就由此决定了。只要各状态的吸引域宽度不一样,总存在一个最宽吸引域的状态,那么随着突变率趋于零,系统花费在该状态的概率一定会趋于1,即最宽吸引域的均衡就是随机稳定状态。现实中,影响参与人选择非最优反应行为不仅包括突变而且也包括错误,已有研究没有考虑到突变与错误的不同,因而,难以更好地描述系统的长期均衡。心理学、社会学研究表明,参与人在不同状态下会有不同的错误率[7],为了讨论方便且不影响模型的主要结论,本模型将区分突变与错误。突变是无目的随机性选择,并且突变率是保持不变的,这样就可以保证马尔可夫过程满足遍历性要求;错误来源于参与人的有限理性,它使得人们驾驭演化系统成为可能。
2.3.1 基本模型
考虑到社会惯习的存在,当某种行为被重复使用时,经过一段时间演化,参与人行为经历接受、认同、自觉到内化的过程,随着行为演化,要改变这种内化行为的难度就会相应增加,犯错误的可能性就会越来越少;当一种行为被社会越来越多人选择,这种流行的行为可能使得参与人盲目模仿而使得错误可能性减少;心理研究表明,人们对同样的损失与收益有不同的看法,即同样的损失给参与人带来的痛苦会大于收益所带来的快乐,这样人们在已经取得高支付的情况下发生错误的可能就少。因此,要现实地考察系统演化就必须考虑到这些因素。
考虑到以上原因并应用Peyton Young(1993)[8]、Ellison(2000)[9]方法,在模型中引入突变率与错误概率来求系统的随机稳定状态,具体步骤如下:
第一步,引入不随系统状态变化而变化的突变率,并由此计算突变边界,显然,包涵了非均衡路径上的支付;
第二步,引入错误率,首先引入参与人对制度的偏好参数(对应猎兔制度;对应制度猎鹿),该值越大反映参与人对均衡的偏好程度越高则错误的可能性就越少;其次,在阻抗中引入博弈均衡处的支付,支付越大则错误可能就越少;再次,引入达到均衡的人数,选择某策略的人数越多则犯错误的可能性就越少[8]。
初始时,由于某种原因有一个选择猎兔的参与人由于突变或错误转而选择猎鹿策略的可能性设为(为离开阻抗)[9];第二个选择猎兔转而选择猎鹿策略的可能性为;第三个为,依此类推,根据定义,的指数越大,则突变或错误的可能性就越少,这里的指数相当于Freidlin, M. I and Wentzell, A . D. (1984)[10]方向树法中的离开阻抗。六个参与人同时选择了猎兔策略的逆转概率为:
。九个参与人同时选择猎鹿策略的逆转概率为:
该模型既考虑到了不同状态对突变率的影响,也考虑到其他因素的影响,还考虑到了社会惯习的作用,两个不同的原因在于参与人对两个均衡有不同的偏好程度。如果所有离开阻抗都为1得到不变突变率的情形,根据计算可得随机稳定状态就是猎兔(风险占优状态),从长期来看,整个社会多数处于猎兔制度,这正是不变突变率模型的基本结论;
若把的指数设定为2;
把的指数设定为1,则就得到BL可变突变率文章中例子的情形。显然,已有研究是本模型的特例。
有了以上准备,根据方向树法就可以直接计算两种可能制度对应的离开阻抗。由KMR(1993)引理1、定理1 及Ellison(2000)吸引域的定义可以得到:突变或错误可能性越大,则对应制度的吸引域就越窄;突变或错误可能性越少,对应制度的吸引域就越宽。按照方向树法中离开阻抗的定义,离开阻抗[10]与吸引域宽度是正相关的:猎兔制度的吸引域宽度可以用表示;猎鹿制度吸引域宽度可以用表示。直接运用Ellison(2000)定理1得到:当,猎鹿制度就是随机稳定状态;当,猎兔制度就是随机稳定状态。不变突变率模型得到“系统随机稳定状态由博弈支付确定”的结论是很自然的,因为,它们引入突变率唯一作用在于使系统在不同状态之间来回跳动,以保证平稳分布的存在性,再确定系统的随机稳定状态。
就上述例子而言,两个系数180,63概括了心理学中羊群行为、社会学中惯习对参与人行为的影响,也考虑到了博弈支付对均衡的影响;两个偏好参数反应了广告、舆论、宣传等的影响。对某一特定博弈而言,前者相对固定,而后者的可变性较大,也正因为这一点增加了驾驭系统的可能性。系统的驾驭性主要表现在以下几个方面:通过采取强制性的措施如法律、法规等来改变博弈支付;通过增加某种策略的选择人数来影响上述系数;通过广告、宣传、舆论等方式来改变参与人个人的偏好参数等等。采取这些措施直接影响博弈均衡的吸引域的宽度,进而改变系统的随机稳定状态,使得系统演化到意想的均衡状态。
2.3.2 制度设计与演化时间
下面进一步考察该模型向意想均衡的演化时间。我们知道尽管采取措施可以使得系统向意想状态演化,但所需时间可能很长而不利于效率。因而,如何使得系统以最快的速度达到意想的均衡状态,常常是决策者非常关心的问题。下面应用Ellison(2000)的定义:期望等待时间表示从状态到状态所花费的时间,其中表示从状态进入到状态的离开阻抗。本文模型中只有猎鹿与猎兔两个状态[11],相对于猎鹿状态而言,其进入阻抗就是另一个状态猎兔的离开阻抗,也就是;状态猎兔的进入阻抗就是。可以看出:进入阻抗越大则所花费的时间就越长,反之就越少。要使系统以尽可能快的速度演化到意想均衡状态,一方面可以通过采取相应的法律、法规来改变博弈的支付,即减少其他状态对应的博弈支付;另一方面也可以减少另一状态中参与人的数量;还可以降低参与人对另一状态的偏好程度。在上述的模型中,可以采取上述方法尽量减少指数而使系统向猎鹿状态演化。在制度设计时,通过采取强制性措施来增加意想均衡支付;通过减少参与人对非意想均衡的偏好程度等来缩短意想均衡时间,等等。
2.3.3 中间过程与逆转成本
不变突变率模型难以定量考虑系统由中间过程[12]某一点起向意想均衡演化的成本与速度。本文模型则可以很方便地考虑中间过程的演化状态。仍然以上面的例子来说明系统在中间过程向意想均衡演化成本与速度,由模型可知下面数据分别对应于一个、二个、三个、四个、五个、六个参与人选择猎兔策略所对应的离开阻抗:。下面数据对应于一个、二个、三个…九个参与人选择猎鹿策略所对应的离开阻抗:。假定系统已经有四个人选择猎兔,那么此时要使系统转而选择猎鹿制度所需的逆转成本就是;如果系统有5个人选择了猎兔,那么要使系统转而选择猎鹿所需要的逆转成本就是;如果系统有7个人选择了猎鹿,那么使系统选择猎兔所需要的逆转成本为。显然,随时间的推进,系统从一个状态到另一个状态所需要的逆转成本就会越来越大。另外,逆转成本越大则系统逆转时间就越长。因此,在制度设计时,管理者不仅要考虑到博弈的支付,更重要的是需要对系统在演化过程中所处状态进行更现实的分析,在此基础上有针对性地采取合适的措施,以便以最快的速度达到预期的目标。
2.3.4休克疗法与渐进式改革的解释
目前许多学者认为前苏联休克疗法带来了社会动荡,是一个错误的选择。事实上,经过近十多年的阵痛之后,俄罗斯[13][12]经济已经进入到健康的发展轨道上来了,2005年其人均GDP已达3000美元,经济增长率达6%,事实证明它的改革不是失败的。另外,北朝鲜没有改革,现在依然处于落后的状态,难以保障人民的基本生活需要。我们的渐进改革使我们享受了经济十几年的快速增长,经济实力大大增强。为什么这两种完全不同的改革方法都取得了巨大的成功呢?目前学术界还没有寻找到好的解决方法,难以给出合理的解释。下面我们将利用本文模型来给予解释:前苏联在计划经济轨道上走了近七十年的时间,形成了许多利益集团,因而,采取渐进式改革所需要的逆转成本就会很大,返回到市场经济体制所需的时间也就很长,不利于效率的提高,在这种情况下,采取如休克疗法[14]这种直接改变博弈支付的强制性措施是合适的。强制性措施中所有人都没有退出机制,一段时间的阵痛是难免的的,这种痛苦不仅表现在利益的调整,而且表现人们思想必须经历一个痛苦的转变。中国在计划经济道路上可以说仅仅处于起步阶段,严格意义上的计划经济可能只有二十几年的时间,这时,由计划经济转向市场经济所需要的逆转成本很少,因而,选择渐进式改革返回到市场经济体制上来所需要的时间不会太长。渐进式改革虽然速度慢,但却不必要经历短期的阵痛,中国的渐进式改革也是成功的。因此,改革方式的选择取决于速度与效率之间进行权衡,取决于系统所处的演化过程,不能简单地说哪种方法好哪种方法不好。
三、进一步研究
本文模型中加入心理学、社会学等研究的成果,更实际地考虑到系统的随机稳定状态,增加了模型的可操作性及其现实性,使得模型能够更好地解释实验经济学所观察到的结果,为制度设计者提供理论指导。当然,模型之中还有许多情形无法考虑到,如系统有三状态或者更多状态时,如何确定每一条路径上的突变边界;影响参与人均衡偏好的其他因素还有许多,本文没有给予更为具体的分析等等。
参考文献
[1] 加里·贝克(著),李杰、王晓刚译(2002):《口味的经济学分析》[M],首都经济 贸易大学出版社
[2] 柯武刚, 史漫飞(2000),韩朝华译:《制度经济学》[M], 商务出版社, 2000年11月, 第一版.
[3] 青木昌彦(著),周黎安译(2001):《比较制度分析》[M],上海远东出版社
[4] Lewontin, R. C. (1960): Evolution and the Theory of Games[J]. Journal of Theoretical. Biology. 1, 382-403.
[5] Harsanyi, J. and Selten, R. (1988): A general theory of equilibrium selection in games[M]. MIT Press, Cambridge, MA.
[6] Young, P. and Foster, D. (1990): Stochstic evolutionary game dynamics[J]. Journal of theoretical biology. 38, 219-232.
[7] Kandori, M., Mailath, G. J., and rob, R. (1993): Learning, mutation, and long-run equilibria in games[J], Econometrica, 61, 29-56.
[8] Young, H. P. (1993): The evolution of conventions[J], Econometrica, 61, 57-84.
[9] Ellison, G. (2000): Basins of attraction, long-run stochastic stability, and the speed of step-by-step evolution[J]. Review of economic studies. 67, 17-45.
[10] Freidlin, M. I and Wentzell, A . D. (1984): Random perturbations of dynamical systems[M], Springer-verlag, Berlin/New York.
[11] 万学忠,《去莫斯科,不要带二锅头》[J],http://tour.cyol.com/content/2006-03/24/content_1341577.htm,,2006年3月,原载《法制日报》。
[1] 作者简介:张良桥,男,1968年11月生,湖南祁阳人,经济学副教授,中山大学岭南学院04级博士研究生,研究方向:经济模型博弈论与信息经济学。
[2]心理学家探讨了行为者的心理结构及行为的两大动力系统:一是基于“个人取向”、“自我需要”的动力系统,即为了生存、交往、发展甚至实现自我价值而产生的动力系统,在这一系统作用下,人是以“自我”为中心的,一切行为都是为了维护“自我”的利益与机会;二是基于“超个人取向”或者“超越自我”的、完全社会化的动力系统,在这一系统作用下,人是以“社会”为中心的,行为的目的是实现社会的价值、社会的理想,维护的也是社会的利益。
[3] 古典经济学所研究的理性经济人实际上就是机会主义者,这一点可以从经济学中研究的成本即机会成本看出。
[4] 这里我们仅考虑两状态的情况,三状态、四状态,…,的情况更为复杂,但不会改变模型的基本结论。
[5] 一般的社会学系统所考察的参与人群体规模较大,本文选择特殊的整数目的是使突变边界为正整数,其实它并不影响模型的基本结论。
[6] 所谓支付单调动态即是指本期中支付越多,则下期被该策略的人数就会越多。即策略的支付与选择策略的人数正相关。
[7] 本文把错误定义为:错误即为随状态变化而变化的非最优反应的行为。
[8] 为了简化,本模型中没有考虑其他因素的影响。
[9]与Maynard Smith(1973)定义进化稳定策略时一样的处理,本模型没有考虑到参与人是如何突变或者错误而选择该策略的,因为选择该策略的原因是多方面的;另外,在这里假设群体规模不变是考虑到现实中群体模型一般很大。
[10] 根据Gllison(2000)离开阻抗就是本文所说的逆转成本,也就是从一个状态向另一状态转变时所需要的成本。
[11] 如果是多状态情形,那么计算共轭半径就需要根据其定义进行计算,其中的计算相对复杂见Gllison2000。
[12] 事实上,不变突变率模型也考虑中间状态,但他们并不是着眼于系统的逆转成本,而是着眼于分析问题的角度。在KMR(1993)文章中,考虑到进化压力的存在而得出休克疗法不如渐进式改革,而在Ellison(2000)考虑了多步演化可以提高生存机会的可能性而得到渐进式改革不如休克疗法。尽管都假定不变突变率,但由于考虑问题的角度不同因而得出完全不同的结论,很重要的一点就是会他们的模型没有结合到具体的社会现实中去,所以结论缺乏解释力。事实上,我们不能绝对地认为某种改革的好坏而应该结合到具体的环境中考虑。
[13] 见http://tour.cyol.com/content/2006-03/24/content_1341577.htm,万学忠,《去莫斯科,不要带二锅头》,2006年3月。
[14] 根据此模型,前苏联向计划经济制度已经起了七十年,如果采取渐进式改革,那么转到市场经济体制可能需要很长时间,而选择休克疗法所需要的时间很短,但却需要经历一个非常痛苦的过程,这种阵痛一过就会恢复正常而走上快速发展的轨道。