作为习惯权利的形成和演化论文参考

时间:2021-08-31

作为习惯权利的形成和演化论文参考

  【摘要】对民俗的田野观察与对人类学文献的深入研究无疑为习惯和习惯法研究提供了洞察力的源泉。但一个根本性的问题是被观察或发现的习惯已经存在了。对于研究者来说习惯是既定的,习惯究竟是如何产生的则并不清楚。如果不能揭开习惯产生的“黑箱”,习惯法一直依赖既定习惯的状况在逻辑上可能会导致一直追溯历史的无限递归。新制度经济学和演化博弈论的结合使得揭开制度“黑箱”成为可能。因此这一融合后的理论也许是习惯法研究的一种新进路。

  【关键词】小费博弈;重复博弈;习惯

一、引言

  在欧美社会,一个人在诸如餐馆之类的消费场所消费后一般会给侍者一些小费,后者也不会有任何觉得不好意思的地方。消费者给服务者一定的小费,服务者提供优质服务,这在很多场合成为了一项清晰的习惯,并具有规范效力。

  任何习惯的生成固然有自己的历史,但这并非说我们要了解某一习惯的内在演化机理就必须回到它当初的历史当中。从理论上说,如果我们理解了习惯的内生机理,那么不仅可以解释既存的习惯,而且可以了解某一习惯产生的条件,甚至可以在一定程度上预测习惯的变迁。

二、小费博弈:习惯的演化

(一)小费博弈的构建

  我们构建一个小费习惯博弈模型来说明该习惯产生的过程。根据博弈理论,一个博弈是由参与人、规则、信息、策略、效用函数和时间等要素构成的结构化系统,或者说一个博弈就是一个制度。但演化博弈论不是从既定规则出发,而是经过博弈产生规则。这和我们欲求的习惯生成机制是完全兼容的。

假设1:假定存在一个封闭的社区,有一个不大的小餐馆,服务方和消费者几乎全是该社区的成员。这样交易就是在人格化关系的社会网络中展开的。

  假定消费者来这里就餐有两种需求:一是消费到价廉物美的美食;二是服务员的优质服务,也就是说他们就算很满意餐馆提供的美食也仍然希望享受到“微笑”服务。

  那么没有规则的博弈是从偶然开始,毕竟有无数的事物的产生和发展都是源于历史的偶然。小费博弈也同样开始于历史的偶然。

  我们假定:一个女服务员获得了爱情,在她服务时对顾客露出了迷人的微笑,这使顾客如沐春风,获得了异乎寻常的美好就餐体验。他也十分偶然的用“小费”[1]来表示自己的补偿,就是说在支付价格之外又给了她一张小额钞票作为对她服务的额外支付。这次偶然的巧合对服务交易双方来说均是一次十分愉快的经历。由于这是一个封闭的社区,交易是在人格化的社会关系网络中进行的,因而顾客和服务员可能会记住彼此的行为。如果这样的巧合只发生一次,或者虽然再一次发生但间隔期太长以至于上一次的巧合已被完全遗忘,那么的确小费博弈不能开始进行。如果巧合又一次发生了,间隔还在记忆容许的范围内,那么双方就可能对小费和微笑的交易有一个模糊的初步认识。

  在接下来的日子里当他们再次相遇时,服务员可能会想如果我微笑顾客是否会支付小费,而如果顾客不支付小费我为什么要微笑。同样顾客也可能会想如果我支付小费服务员是否会微笑,而如果她不微笑我为什么要支付小费。于是现在的问题就是对小费和微笑的交易已经有了初步认识的交易双方如何选择行为策略的问题。

  一个类似囚徒困境的小费博弈可以建构了。下面是该博弈策略组合矩阵:

  小费博弈

  小费博弈

  观察这个博弈,可以发现有两个纳什均衡:(5,5)和(0,0)。代表小费习惯的(5,5)是我们想要的均衡,代表维持原状的(0,0)是我们不想要的均衡。那么小费习惯有可能演化出来吗,答案似乎令人沮丧。因为在该博弈中(0,0)是双方占优策略组合的均衡,当然也就是说更有可能是维持原状了。

(二)小费博弈的重复博弈

  演化经济学家罗伯特?萨格登在论证交通博弈[3]时说明因为偶然原因走上了任一个均衡路径就会在重复博弈的过程中通过反馈而自我强化,所以即便存在一些干扰,但从长期趋势来说,习惯是自我实施的、稳定的,因而可以获得规范的效力。

  萨格登解决偶然因素对习惯的演化使用了一个发人深省的概念――突出性。萨格登借用突出性这个概念想要说明的是像交通博弈的这类博弈,有着两个均衡发展路径,具体往哪一个方向发展则可以通过突出性解决。所以像“靠左或右行使”的交通规则在经过重复博弈后究竟是靠右行驶的习惯演化出来还是靠左行使的习惯演化出来,则依赖某一地区人民自身当中的突出性因素。

  这里引入突出性的原因要表达的意思是试图对习惯进行分类,毕竟小费习惯只是众多的习惯之一。交通博弈代表的习惯是一种类型,它要求在博弈的重复进行条件上求解,通过参与人的社会学习来使习惯自发演化出来。而小费博弈代表的小费习惯是另一种类型,它的困境的解决不仅需要博弈重复进行,还需要参与人通过社会学习发现和接近这类博弈困境的解决机制――一报还一报(tit-for-tat)的策略组合。这是博弈论专家阿克赛洛德发现的解决有效率比较囚徒困境的策略机制。

  接下来就讨论小费博弈的重复进行过程中参与人是否能发现并内化一报还一报的策略机制。不过这要求我们把参与人的策略类型进行分类。利用萨格登的策略类型分类,稍微加以变通后,我们假定顾客和服务员的策略有下面几个类型:

  第一种是完全理性型[4]。这种类型的参与人,或者是天使或者是魔鬼,小费习惯或者一下子就演化成功或者永远不能成功。这是因为完全理性的人需要的只是理性、信息和逻辑,不需要任何习惯。 第二种是无知自私型。只要有一方是自私的且只“俯视脚下”,那么另一方就算是天使也可能无济于事。只有在天使自觉选择低效用的策略、无知自私的参与者选择高效用的策略时才能避免(0,0)的策略均衡。如果没有天使,上面的支付矩阵表明,不论是(0,8)还是(8,0)的策略组合都不可能在普通人中演化成稳定的习惯。

  第三种是自利型。这样的人一方面是自私的,但同时是理智的,也就是说尽管他们可能会尽可能地利用一切机会投机牟利,不过当需要与他人合作甚至需要利他才能更好地满足自己的需求的时候,他们也是会毫不犹豫地去利他,目的只是惟利是图。

  这样的策略类型对于习惯的演化来说,习惯是否能形成就取决于严格的初始条件和惊人的好运,也就是说这个封闭社区内的顾客和服务人员一开始就选择了(小费,微笑)并一直持续保持,因而不断自我强化,最后演化成清晰普遍有效力的规范。

  第四种类型是自利包容型。这是对自利型假定的放宽(普通人性要求的类型),也就是说这种策略类型允许随机的偏离,因为错误、试验、变异等有限理性条件下不可避免地会出现这些问题。那么这种策略类型是否可能使欲求的习惯形成呢?博弈论专家阿克赛洛德对重复囚徒困境的研究表明,一报还一报的策略组合是可以被重复博弈的参与人学习后发现和掌握的,从而在近似无限期的重复博弈中演化出某一习惯,不过它在帕累托意义上是次优的。

  假定获得爱情的女服务员因为爱情力量在博弈开始的几个周期比如5期内是不求小费回报的,即不管顾客是否给予小费,她总是在服务时向顾客微笑。这样对于前5期的博弈来说,顾客的最优策略是选择不给小费以使自己的效用最大化。而当服务员的爱情发烧期退热后,她发现自己的微笑并没有换来应有的回报(小费)后,她就决定在下一次的博弈中板起脸来让顾客尝尝惩罚的滋味。而在下一次博弈时顾客看到她的冷脸后觉得更没有理由支付小费了。于是这期博弈的结果是(无小费,不微笑)。在紧接下来的再次博弈中,如果双方记忆只有上一期的结果并以之为决策的根据的话,那么从此每期博弈结果就都是(无小费,不微笑),习惯不可能形成。

  发烧期内女服务员总是选择微笑,顾客如果每一期都选择给小费,这样双方博弈结果总是帕累托最优。如果一直不偏离的话,那么(小费,微笑)的美好体验持续强化一段时间后就会使小费习惯比较快速地演化出来。

  如果前5期内顾客总是选择不给小费,情况就比较复杂了。这需要顾客和服务员双方都认识到博弈中存在惩罚和回报的一报还一报的策略机制才可能形成。我们假定在前5期内女服务员总是选择微笑,顾客总是选择不给小费。现在假定在第6期女服务员还是选择微笑(爱情发烧和退热的过渡期不明确),而顾客可以选择给小费或者不给小费。如果顾客不给小费,那么本期博弈结束后他的效用是8单位而她是0单位。如果接下来连续几期他仍然像以前一样选择不给小费,那么爱情已经退热的她就不会再选择无偿的微笑了。假定这发生在博弈的第10期,那么本期博弈结束后双方的效用都为0。这对她来说倒没什么损失,但对他来说大不一样,前10期他的每期效用都是8单位,现在从8单位下降到0单位,损失很明显啊。如果(无小费,不微笑)的结果再连续发生几期,损失明显就更加确定。如果他还有记忆能力的话,他也许就要停下来问问为什么了。通过回忆以前的好日子他可能会想到每期8单位的效用不是免费的午餐,而是她选择微笑的结果。那么她现在不微笑了的同时他的效用明显下降了,这是否是她对自己的惩罚呢?

  认识到惩罚的他在接下来的博弈中就要看看是否有承担责任的精神了。如果没有这样的精神而继续选择不给小费,因而她也继续不微笑的话,那么从此进入恶性循环,小费习惯不可能形成。

  假定认识到了惩罚的他愿意承担责任或者说虽然没有承担责任的意识但他(有限理性的人)在连续的博弈中无心地犯了错或者试验等而在博弈的第12期选择了给小费。博弈结果是他的效用为0单位,而她的效用为8单位。这使她立即意识到从第1期到第10期的所有微笑终于有了回报,而(小费,不微笑)的策略组合导致的结果连续发生几次的话,她的回报意识就增强了,使她可能认识到博弈中存在回报。假定这发生在博弈的第14期。

  所以认识到惩罚的她在接下来的博弈中就要看看是否有承担责任的精神了,这和上面对顾客惩罚――责任机制的分析是一样的。但不一样的是在她选择承担责任甘愿接受惩罚的同时,他的每期效用是8单位,因而这使他能够认识到回报。

  至此顾客和服务员都认识到了无限重复的博弈中存在着惩罚和回报机制,在继续的博弈中社会学习可能使他们认识到惩罚的限度,用后验的观察修正自己主观的估计,从而无限接近博弈内在逻辑决定的客观的惩罚限度。当主观惩罚限度客观化后,一报还一报的策略组合就形成了。

  当这个策略组合被认识到并在持续的博弈中被接近和利用后,小费习惯最终就可能演化出来。