1. 引言
达尔文进化论观点认为物竞天择,适者生存。同种或不同种生物之间为了食物,地盘,配偶等生存资源会存在竞争,适应者得以保留,而不适者则被大自然所淘汰。古典经济学提出“理性经济人”(Smith, 1790),认为人都是自私利己的,理性经济人努力将自己的利益最大化。但是,生物界却存在一些让人困惑的现象,它们会选择合作,互利共生,常见的如蚂蚁,白蚁,蜜蜂等。不常见的如非洲吸食动物血液的蝙蝠会将吸食到的鲜血吐出一部分来喂食那些濒临死亡却与自己没有任何亲属关系的同伴(杨雅茹,陈博,2014);人类社会中的研究发现也表明人并非完全自利,还存在着利他,合作等亲社会的行为,并且人类会表现出更大规模的合作,个体层面,群体层面甚至国家层面,都讲求合作共赢。这些现象就很难用进化论的观点和“理性经济人”的观点来解释。
20世纪60年代,英国生物进化学家Hamilton提出“亲缘选择(kin selection)”理论(Hamilton, 1964),试图解释生物间的合作行为。该理论认为亲属之间存在共同的祖先,个体身上会携带共同的基因副本,生物个体为了使整个种群的基因在总体上达到最优的“适存度(fitness)”,会选择合作的行为,如蚂蚁、蜜蜂等动物的合作行为。Hamilton的理论能解释具有亲缘关系的同种类之间的合作行为(肖凤秋,郑志伟,陈英和,2014),却无法解释非亲属之间的形成的合作现象(Axelrod & Hamilton, 1981)。
20世纪70年代,Trivers提出“互惠利他(reciprocal altruism)”理论(Trivers, 1971)。该理论认为,互惠的个体会权衡付出/利益的比率,当施惠者需要付出的成本远小于受惠者所得到的利益时,这种互惠行为产生的可能性也就越大。个体选择合作只是为了获得短期或者长期的利益。一些相关的研究分析表明当个体配对进行重复的交互作用时,通过互惠可以产生合作行为(Aoki, 1984; Axelrod, 1980; Brown, 1982; Boyd, Lorberhaum, 1987; Peck & Feldman, 1985)。在彼此的交互作用过程中,会产生一种进化均衡的策略,即针锋相对(tit for tat):个体最开始会和另一个个体合作,但是只有当另一个个体也保持合作时,合作才会继续进行下去。后来,有研究者提出争论,Boyd & Richerson (1988)发现互惠利他模型在大规模人群交互作用时会受到限制。
80年代,Alexander进一步提出了“人类道德系统就是间接互惠的系统”(Alexander, 1987),用以区分直接互惠理论(人们通常把Trives的理论叫作直接互惠,因为直接互惠只涉及到交互的双方)。他在《道德体系生物学》中提到人类的大规模合作现象可以用间接互惠机制来解释:助人者帮助受助者,对这种帮助的回报不一定来自受助者,也可能来自第三方受助者(Alexand,1986;Boyd & Richerson, 1989; Zahavi, 1990;杜月,2007)。间接互惠也被亚历山大认为是“在有兴趣的观众在场情况下直接互惠的结果”(Alexand, 1987),而“有兴趣的观众”起着名誉评定的作用(杜月,2007),该名誉评定机制认为“个体会从第三方获得关于他们对手的信息,并根据这些信息决定如何做决策”(Buskens, 1995)。为了解释第三方对互惠行为的影响,Nowak & Sigmund (2005)提出了两种间接互惠的模型,即“上游式互惠(upstreamreciprocity)”和“下游式互惠(downstream reciprocity)”,并且将“名誉(reputation)”引入到模型中。“上游式互惠”指首先A帮助了B,然后B会帮助C,它是基于一种最近的情绪体验,一个接受过帮助的人可能会想着回报给别人帮助。“下游式互惠”建立在名誉的基础上,个体C帮助A,是因为A曾经帮助过B。实证研究支持下游式互惠(Wedekind & Milinski, 2000; Bolton, Katok, & Ockenfels, 2005),现在的研究基本上都将下游式互惠指代为间接互惠。对间接互惠的数学统计显示,自然选择可以支持这种策略。第三方观察者对互惠双方的行为会有一个评估,由于互惠方的意图不能确定,一些个体也会从不同的来源获取不同的甚至会有冲突的信息,亦或是根本获取不到任何信息,这时候,互惠方的名誉就会影响人们的判断和决策。
综上简要介绍了互惠理论的提出和直接互惠、间接互惠的基本理论模型。由于直接互惠并不能解释一次性的大规模的合作,而间接互惠理论家认为一次性的合作的发生是因为“有旁观者”,人们会和那些观察到的合作者合作,而拒绝与那些背叛的个体合作。下文将主要根据间接互惠理论模型来看其对合作的影响。
2. 间接互惠的名誉机制:形象计分策略和名声策略
2.1. 形象计分策略
Nowak & Sigmund (1998a, b)提出了间接互惠合作进化模型,称作“形象计分(image scoring)”。他们采用计算机模拟100人的群体,每个人一生会有2到3次交互作用(要么作为施惠者,要么作为受惠者)。每一代最开始,所有个体的形象分都为0。当个体表现出施惠行为时,形象分增加,而拒绝施惠时,个体的形象分减少。如果给每个个体定义一个形象分阈限值k,其阈限范围为(−5~+6),一个k = −5的个体会帮助任何大于或等于−5的个体,即他会选择无条件的提供施惠(无条件合作者),k = +6的个体会无条件的选择不去提供施惠(无条件背叛者),而k = 0的个体是最具区分性的,它会帮助具有0分及以上形象分的(区分者)。每一代结束后,留下与收益呈正比的子代继续上一代的策略进行博弈,模拟结果显示,在150代之后,最具区分性的策略会支配整个群体,并获得进化稳定性。Wedekind & Milinski (2000)采用每组诗人的真人实验验证了Nowak等人提出的形象计分策略:受惠者比没有得到受惠的被试具有更高的形象分,而施惠者有一种偏好,他们倾向于对形象分高的受惠者提供帮助。Seinen & Schram (2006)也发现了相同的结果。
后来该模型的鲁棒稳定性遭到了质疑(Leimar & Hammerstein, 2001),如果个体遵守形象计分模型,那么拒绝帮助那些具有较低形象分的个体同样会降低自己的形象分,以致于他们需要帮助时会遭到拒绝。作为一个理性的个体,他们会选择增加自己的形象分,无论其对手的印象分是高还是低都会选择合作。但是这与实际研究中个体会帮助形象分高的个体而拒绝帮助形象分低的个体的结果不同。Leimar & Hammerstein (2001)构造一个(基因)岛模型来研究间接互惠,其结果发现形象计分的演化只发生在严格限制的条件下,即基因漂移(genetic drift)具有实质性影响下,亦或是在帮助的成本非常小的情况下。而现实生活中基因漂移起到的作用是微乎其微的。
2.2. 名声策略
基于对形象计分存在的缺陷,Leimar & Hammerstein (2001)认为Sudgen’s (1986)提出的名声机制(good standing)对解释间接互惠引领合作更具优势。在名声机制模型下,个体最初都具有好的名声,当个体拒绝帮助名声好的个体时会损失自己的名声,而不帮助那些名声不好的个体则不会损失自己的名声。Leimar & Hammerstein (2001)认为名声策略似乎是基于间接互惠人类合作的一个可行的候选机制。一个个体如果不帮助名声好的个体会损失自己的名声,而不帮助名声不好的个体则不会损失自己的名声,但是会损失自己的形象分(Milnski, Semmann, Bakker, & Krambeck, 2001)。
Milinski,M.等人(2001)的研究用实证的方法试图区分间接互惠的这两种机制。他们研究了23组被试,每组被试7人,该实验设定一个秘密玩家,让他在交互过程中一直都选择拒绝分配金额(No player),在第一轮,让两个被试(donors of no player)与设定的玩家进行博弈,在第二轮,让另外两个玩家(donors of donors of no player)与第一轮的两个玩家(donors of no player)进行博弈,第三轮继续。如果第一轮的两位玩家(donors of no player)都用形象计分策略的话,他们会背叛那个设定的玩家(no player),而如果他们用名声策略的话,他们也会背叛设定的秘密玩家,因为他们会认为设定的玩家没有理由去选择背叛(拒绝分配)。而第二轮的玩家如果选择形象计分策略的话就会背叛第一轮中的选择背叛的玩家,而如果用名声策略的话,那么第二轮的玩家(donors of donors of no player)不会背叛第一轮中选择背叛的玩家,因为第一轮玩家(donors of player)背叛设定的秘密玩家(no player)并不会降低他自己的名声(因为根据名声策略,拒绝帮助名声不好的个体并不会降低自己的名声)。同时为了避免信息不完整造成的干扰,实验也设置了对照组。实验发现提供充分完整的信息能够帮助个体去使用名声策略,而对形象计分则不是必须。并且提供玩家同时做为施惠者和受惠者的决策信息比只提供一方面的信息,实验持续的轮回更多。最终Milinski,M.等人(2001)的研究证实人们会更多的采用形象计分或者类似于这种模型的策略,名声策略则需要更多工作记忆能量(Baddeley, 1974),需要更多的分析信息,而人们一般不会自觉利用更深层次的信息去辨别背叛者的意图,人们趋向于同等的对待公正和自私的背叛者(黄璜,2011)。
名声策略从直观上看似乎更具合理性,但在实际的研究中,形象计分策略似乎更符合日常的生活实际(Wedekind & Milinski, 2000; Milinski et al., 2001; Bolton et al., 2005; Seinen & Schram, 2006; Engelmann & Fischbacher, 2009),虽然两者存在差异,但是它们都是基于社会名誉机制。一个有区分性的个体采用形象计分策略只考虑对手在做决策时的名誉,并且只和形象分好的个体合作。采用名声策略的个体会考虑自己在群体中的名誉,并且会尽力去增强自己的名声,使得在未来能够接受到其他人提供的合作。在Ohtsuki和Iwasa(2004)的研究中,他们根据玩家在上回合中的分数,和玩家的对手的分数,以及他们之间的间接互惠行为得到了8种进化稳定的策略(the leading eight) (Ohtsuki & Iwasa, 2006),形象计分和名声策略都包括在内,这八种策略都能在一定的程度上解释合作现象。研究者会得到不同的结果,可能预示着我们需要充分地去考虑参与者策略选择的多样性和,实验背景,实验群体对个体决策的影响,公平知觉(Fehr & Schmidt, 1999; Bolton & Ockenfels, 2000)、信息的不完整性、知觉错误和工作记忆等都会影响玩家的策略选择。
而从信息的获取和评估上来看,名声策略需要更多的工作记忆能量(Baddeley, 1974)以加工足够多的信息,从而进行判断和决策,而形象计分则并非必须。可见需要的信息不同,人们选择的策略也不同,因此,信息的依赖和对不同信息的加工对于人们的互惠策略以及合作行为的影响同样值得深入研究。
3. 信息的加工和评估对于间接互惠解释合作的影响
前面所提到的形象计分策略,个体采用形象计分时所依据的信息是基于提议者上一回合所做的决定,Bolton (2005)将其称为一级信息(first order information),采用一级信息作为参考依据会存在一个威胁就是惩罚那些背叛的个体会导致其在下一回合中作为接受者时也遭到背叛,如果这样的话,个体就不会采用形象计分这种有区分性的策略,或者总是选择背叛,除非他能确定下一个对手是具有区分性的,能够明白自己的背叛并不是出于自私而是公正,否则合作将难以继续维持下去。因此,仅考虑一级信息并不全面,还需要考虑接受者作为提议者时所做的决策的公正性,即区分接受者作为提议者的背叛是公正的(惩罚名誉不好的个体)还是自私的(惩罚名誉好的个体)。因此这就需要考虑到参与者的二级信息(second order information),即接受者的名誉;如果个体不能够区分公正与不公正,那么要维持积极形象分就只能是选择无条件合作了。
Bolton (2005)等人研究间接互惠中个体在三种信息条件下的合作情况。其中三种信息条件分别为:无信息,一级信息,二级信息。被试配对匹配,所有配对的个体都不会进行重复配对,每个个体进行14回合的交互,其中作为提议者进行7次交互,作为接收者进行7次交互。对于无信息条件下,提议者对接收者过去的历史完全不知道,一级信息条件下,提议者知道接收者在上一回合中作为提议者时是选择合作还是背叛,二级信息条件下,提议者不仅知道接收者上一回合作为提议者的决策,还知道上一回合中接受者作为提议者时,其对手作为提议者的决定。结果显示当付出/利益比率小时,无论是在无信息,一级信息还是二级信息条件下,个体的合作率都达到了50%,而一级信息和二级信息对合作的影响存在差异,在二级信息条件下的合作率为86%,一级信息条件下的合作率为67%。结果表明当个体使用叠加的信息方式会促进间接互惠合作的稳定。尤其是在个体使用二级信息时,当个体认为接受者在上一回合中的合作是公正时,在这一回合中得到合作的概率更高。
在对信息的评估方面,人们一般采用的评估规则都是根据个体过去的信息判断一个人的行为是好还是坏(Brandt & Sigmund, 2004; Ohtsuki & Iwasa, 2004)。如果为对方提供帮助,则认为是好的,而拒绝提供帮助则可能会被看作是不好的。这被看作一阶评估,只关注个体的行为,是否提供帮助。Ohtsuki和Iwasa认为二阶评价考虑的是接受者的形象是好还是不好,而三阶评价需要其他的信息来判断提议者是好还是不好,从而形成一个稳定的相互合作。Pacheco, Santos, & Chalub (2006)提出的斯特恩判断(Stern-Judging,亦称为严格判断模型)就是一个三阶的评价标准。如图1所示。
在斯特恩判断模型中,外圈最外层代表提议者最新的名誉,对于里圈,由外到里,第一层代表提议者的行为,第二层代表接收者的名誉,第三层代表提议者现有的实际的名声。外圈提议者最新的名誉依赖于里圈接收者的名誉,提议者的行为和实际的名誉。由此,该模型认为,帮助一个好名声的个体和拒绝帮助一个坏名声的个体都会形成一个新的好名声,而帮助一个坏的个体或拒绝帮助一个好的个体则会形成一个新的坏的名声。这种评价规则没有道德上的质疑,即每一种形式的博弈都有一种好的行为和一种坏的行为,任何人的一个好的举动都可能受到认可,每一个坏的举动也将受到惩罚(通过减少玩家的分数的方式)。而这种不可缓和的惩罚能被立即的谅解所补偿,因而可以促进合作进化的成功。
斯特恩判断能稳定的促进合作的条件是在一个群体中,所有的成员都知道其他人的行为(基于公共信息:在人群中,所有的个体对任何一个个体的名誉都有相同的观点和看法,许多相关的资料可以搜集得到,如前文提到的形象分,名誉地位,以及无意背叛,背叛者瓦解稳定策略的能力,代价性信息传递,社会模范等。),并且人们也不会犯评估的错误,因此这就存在了一定的局限性。在日常生活中,人们在交互过程中会从不同来源的不同信息,也不可能在对他人评价时一定不会犯错误。Uchida,S.和Sasaki,T.通过描述人群中个体关于他人的私人看法的形象矩阵发现,私人信息(私人信息,不同的个体对他人的
资料来源:Pacheco, Santos, & Chalub (2006)
Figure 1. Stern-Judging model
图1. 斯特恩判断模型示意图
名誉有着不同的看法)和评估错误会瓦解斯特恩判断,人们判断他人好坏与否都是一个1/2的随机概率(Uchida, 2010; Uchida & Sasaki, 2013)。斯特恩判断瓦解的关键原因是其没有任何机制或功能能够修复两个观察者之间不匹配的观点。事实上,如果采用斯特恩判断标准的两个观察者对一个指定的玩家有不同的私人看法,那么无论观察到这个玩家选择什么样的行为,或无论接收者是什么样的,这种差异都将一直存在。因此,一旦两个个体之间出现了不匹配,这些个体就会有不同的观点,最终导致形象矩阵的混乱和不匹配。这也表明,除了私人信息和评估错误,可能会有其他的因素导致斯特恩判断的瓦解。例如信息的不完整性,个体获取的信息可能是通过直接或间接的观察,也可能是通过流言或八卦。错误的流言蜚语也会造成形象的不匹配从而打破斯特恩判断。还有可能是个体主观的错误知觉(Takahashi & Mashima, 2006),当个体错误的知觉是否该提供帮助,或者他们对接收者的名誉存在困惑时,即使他们以相同的方式去评价他人,也会有不同的观点。并且这些错误对高阶评价似乎更为重要。同时,个体认知风格,如场依存和场独立的人在对待信息的依赖和分析上也存在差异,因此,不同认知风格的个体对互惠策略的选择可能会存在不同的偏好。
4. 间接互惠引领合作的现实意义,局限和未来的展望
间接互惠对人类合作的进化起着重要的作用,虽然已经有很多理论和模型的提出,许多文献记载的也是采用计算机模拟运算或实验室的个体博弈(Nowak & Sigmund, 1998; Wedekind & Milinski, 2000),但是将理论和实验室结果推广到实际生活中还存在一定的限制。因此,最近有学者想要填补这方面的空白,开始研究现实生活中间接互惠对合作的影响。Van Apeldoorn & Schram (2016)做了一个线上的调查研究。他们调查了世界各地97个城市,共计五百五十万人。这些人在旅行的时候会花费一定的损失给彼此提供一些免费的服务。他们通过发送一些服务请求,一旦这些请求得到支持,就可以免费得到服务。所有的成员可以和不同的个体配对,或者作为旅行者,或者作为提供者。研究者建立了两种档案,一种档案里写着某个个体给他人提供服务的历史纪录(记作服务档案),另一种档案里只写了这个人怎么样,没有写他的服务经历(记作中性档案)。而在其他特征方面,两种档案都是一样的。根据间接互惠的下游互惠模型,他们假设服务档案比中性档案更有可能得到肯定的回复。因为下游市互惠模型认为C会给A提供帮助,是因为A曾经给B提供个帮助,而服务档案中有该个体过去给他人提供服务的经历,所以当他发出服务请求时,会比没有提供过服务经历的个体更可能得到别人的帮助。他们的结果也证实了该假设,发出服务档案的请求比发出中性档案请求获得回复的概率更高,并且获得肯定回复的概率也越高。即人们不光更愿意回复那些为他人提供过服务的个体的请求,也更愿意为那些个体提供帮助。但是他们的实验没有发现支持上游式互惠的证据。Van Apeldoorn. J.等人的实验证实了先前实验室发现和理论观点,认为间接互惠可以作为解释陌生人之间合作的一种机制。这表明间接互惠可能在涉及不完整信息合约上建立值得信赖的交易上是非常重要的。
综合全文,无论形象计分策略还是名声策略,以及对不同等级信息的需要和加工评价都与名誉机制相关。而名誉机制在间接互惠研究中起着核心作用。虽然形象计分策略和名声策略都是建立公共信息基础上,即个体的行为能被所有人都观察到,以往的研究也都基于信息可完全获取的假设上,由于人们往往不能追踪到交往者以往的历史,研究者们逐渐意识到现实社会并不能满足该假设,因此,近年来,人们越来越关注私人信息(Uchida, 2010; Olejarz, Ghang, & Nowak, 2015)和不完整观察(Nakamura & Masuda, 2011)对间接互惠的影响,并且也不断有研究开始从理论研究,实验室研究走向现实生活中,在真实的生活情境中探讨间接互惠机制对合作的解释作用。但是,正如刘国芳和辛自强(2011)的提到的,现在人们对于间接互惠的研究都是基于Alexander (1986)对间接互惠的定义,以及Nowak和Sigmund (2005)里提出的上游式间接互惠模型和下游式间接互惠模型,并且很多研究就直接将下游式间接互惠模型指代成了间接互惠,而上游式互惠解释合作上的稳定性还有待进一步深入的研究。同时,人们在利用间接互惠解释合作现象时不能孤立的采用一种互惠机制或者策略,需要相互结合,辩证的看待。
此外,利用间接互惠解释合作的主要研究领域是在生物学,经济学和社会学,所引用到的研究变量如名誉,代价/收益比,道德规范(Suzuki & Kimura, 2013)等也都是基于这些学科,而研究者们逐渐意识到的个体心理层面的因素,如知觉错误,信任,记忆容量,认知风格等却没有受到过多的关注,因此跨学科间的相互合作非常有必要。对于未来的研究,研究者可以关注以下几点:第一,随着全球化贸易和网络科技的发达,线上合作变得越来越频繁,我们进一步探讨间接互惠机制对合作的影响,需涉及到文化,网络,信息搜集和传播等影响因素。针对中国文化背景下,随着微博,微信等网络新媒体在生活中的普及,信息量变得巨大,信息背景变得复杂,信息的真实性也存在风险,人们在这种信息背景条件下如何去搜集和评估,从而指导自己对互惠策略的选择,是否选择合作还是背叛,都是值得关注的问题。随着获取信息的渠道越来越多,越来越便捷,人们是会消耗更多的认知资源进行信息的综合分析做出互惠决策或是根据舆论导向,谣言等选择更方便简单互惠策略,那么间接互惠的名誉机制对其的解释力还有多大?第二,除了线上的合作之外,线下的合作也不能忽视,可以将实验室研究和理论研究扩展到现实生活中,增加间接互惠机制解释合作现象的生态效度。第三,现在我们关注的间接互惠多为下游式互惠模型,而在现实生活中还没有发现上游式互惠模型的实证研究,未来的研究可以关注这方面的空缺,找到能在实际生活中支持上游式互惠解释合作现象的实证资料。第四,增强跨学科间的合作,了解个体心理机制和群体心理机制对间接互惠的影响,从而增强间接互惠对合作解释的稳定性,同时也应该增强本土化的研究。