1. 引言
蒙提霍尔问题(Monty Hall Problem)源于美国的一个电视节目,它是一个十分有趣但却反直觉的博弈游戏。在这个游戏中有着三扇门,在这三扇门中,只有一扇门后面有奖品(一辆车),另外两扇门后没有奖品。游戏流程是:1) 参与游戏的选手在3扇门中选择其中一扇门;2) 主持人在选手未选择的两扇门中打开一扇没有奖品的门(主持人知道奖品的位置);3) 在场上还剩下两扇门的情况下,主持人询问参与游戏的选手,保持自己最初的选择还是选择交换。
大量的实验结果表明,大多数参与游戏的选手都选择保持自己最初的选择。但是保持自己最初的选择只有1/3的概率获得奖品,而选择交换则有2/3的概率获得奖品。在换与不换之间有着明显的概率差距,但是多数游戏选手仍然坚持自己最初的选择且认为换与不换之间的概率是一样的,都是50%,其中不乏数学、统计方面的专家、高学历者。
蒙提霍尔问题是一个十分经典的反直觉问题,人们总是会在该问题的决策中做出系统性错误。了解人们为什么会在蒙提霍尔问题中做出非理性决策,及其后面的认知加工过程是怎么样的;人们在该类问题的处理中,认知加工存在什么缺陷;以及如何提升蒙提霍尔问题的解决。对蒙提霍尔问题的深入研究,可以探究人们在处理这类问题时思维的奥秘,对问题解决领域的深化具有理论和实践意义。
本文以发表的带有实验的蒙提霍尔问题的文章为基础,通过对这些文章的系统回顾以探研人们对蒙提霍尔问题做出非理性选择的原因,以及提升蒙提霍尔问题解决的方法,最后对蒙提霍尔问题的研究进行展望。
2. 蒙提霍尔的心理学实验
为了能比较详细的阐述人们在蒙提霍尔问题中做出非理性选择的原因。我们收集了国内外最近发表的几篇包含蒙提霍尔心理学实验的文章,以此为基础来分析人们做出非理性选择的可能原因。
2.1. 蒙提霍尔问题的逻辑分析
蒙提霍尔问题所有可能结果的分布见图1,由图可知选择换获奖的概率是2/3,而选择不换获奖的概率只有1/3。
Figure 1. The diagram of all results of Monty Hall Problem
图1. 蒙提霍尔问题所有结果的示意图
2.2. 蒙提霍尔实验范式
从已有的研究来看,蒙提霍尔范式基本保持着蒙提霍尔问题的基本结构。我们对蒙提霍尔问题的心理学实验进行了系统的回顾,根据蒙提霍尔问题重复的次数实验范式主要分为两大类,其中一类是蒙提霍尔问题的单次决策、另一类是蒙提霍尔问题的重复决策。单次决策指蒙提霍尔问题的规则以文本的形式告诉被试,让被试了解蒙提霍尔问题的逻辑规则,然后让被试根据自己的思考做出决策。该类范式能准确的测量被试在蒙提霍尔问题中的直觉决策,但是缺乏对学习效应的测量。重复决策就是在实验中,将蒙提霍尔问题呈现给被试并提供反馈。根据反馈的信息不同又分为两种类型,一种是频率反馈,一种是比率反馈。该范式能够揭示被试比较明显的学习效应,但是却难以探寻被试是习得转换的这一行为还是理解了蒙提霍尔问题的逻辑规则。
根据实验的对象分可以分为人类实验和动物实验,蒙提霍尔问题的实验中只有小部分的实验是动物实验。如Herbranson (Herbranson, 2012)和Schroeder (Herbranson & Schroeder, 2010)用六只鸽子进行了关于蒙提霍尔的实验,所有的鸟都被预先训练过,包括习惯化、杂志训练、自选直到得到一致的回应在三个响应键中的每一个上。自选图形中的刺激是白色,红色和绿色的钥匙灯。实验结果表明在经过一段时间的训练后,鸽子做出正确决策的比例近乎达到100%。Herbranson (2012)表明鸽子拥有一些先前被认为是灵长类动物独有的数字能力元素使其拥有迅速而有效地解决了解决蒙提霍尔困境的最佳策略,而人类却没有。人类和鸽子在蒙提霍尔难题上的显著差异表明了比较心理学的价值:当两个物种面临相同的问题时,它们会得出截然不同的解决方案。这些差异并不容易被学习的一般规则所解释,例如效果法则(即产生积极效果的行为更有可能再次被利用)。因此,人类和鸽子的生活方式或进化史上的某些差异,可能会在这两个物种所采用的策略上产生相应的差异。比较心理学的目标是理解这种差异的本质和根源。
根据实验的方式可分为脑电实验和行为实验蒙提霍尔问题的心理学实验主要是行为实验,只有少数几篇是脑电实验。研究蒙提霍尔问题脑电的研究这主要是Hirao等人(2016),他们研究发现在所有三种卡片任务中,人类似乎很保守,选择保留最初的决定,除非他们有令人信服的改变的理由。在这种情况下改变不是一个优势。即使在MHD任务中最初的决定会带来更成功的结果,个人可能会保留最初的决定。这个SPN振幅可能代表我们强烈的保守倾向于保留最初的决定。因此SPN可能是检验反事实的有用工具。
3. 蒙提霍尔问题非理性选择的原因
在这一部分中,我们将系统的研究在蒙提霍尔问题几个阶段中的概率状况,并推测被试的心理状况。第一阶段,被试在3个选项中,做出自己最初的选择。在这一阶段中,每个选项选中的概率是均等的,都是1/3,但是被试可能对自己选择具有一定的偏好,即认为自己的选择与众不同,有更高的可能性中奖。第二阶段,打开了一个空盒子之后,排除了一个错误的选项之后,只剩下两个选项。一些被试可能认为现在剩下的两个盒子的概率是一样的,因此换或不换对于他们来说没有意义。并且从结果的角度来看,最后呈现给被试的只有两种结果,有奖或者无奖,如果被试最初选中了但却交换了无奖的盒子,那他将更加沮丧(Saenen, Heyvaert, Van Dooren, Schaeken, & Onghena, 2018)。由此,对被试做出非理性选择的可能原因如下。
3.1. 等概率偏差
等概率偏差是指被试认为在蒙提霍尔问题中交换和不换的概率都是二分之一,Burns和Wieth (2004);Fox和Levav (2004);Franco-Watkins等人(2003);Hirao等人(2016);Stibel等人(2009)在实验中加入了概率判断,他们的结果表明,有很大一部分被试认为交换和不换获奖的概率都是二分之一。蒙提霍尔问题本质上可以看成是一个概率问题,等概率偏差可能是被试做出非理性决策的主要原因。并且通过概率判断可以揭示被试有没有完全地理解蒙提霍尔问题。此外,人们在等概率偏差的前提之下,即人们认为换与不换的概率是一样的情况下,人们会更容易受到现状偏差的影响,保持自己最初的选择而不是选择交换。
3.2. 后悔理论
后悔理论一直是蒙提霍尔问题十分经典的解释,Landman (1987);Stibel等人(2009),Kahneman和Miller (1986)在实验中发现,大多数被试的最终决策都是坚持自己最初的选择,如果最初的选择没有获奖,不会有太强的失落感。而被试未坚持自己最初的选择却没有获奖,则会有强烈的失落感。即在获得同样不好的结果下,如果被试做出了交换的选择会比没有做出交换的选择更后悔,Daniel Kahneman在他的理论中在同样一个结果中,个人不作为和作为将会产生不同程度的后悔,在短期内人会因为作为产生某种不好的结果而后悔;在长期情况下,则会对没作为感到后悔。蒙提霍尔问题作为一个短期决策,后悔理论对其的解释具有一定的意义。
3.3. 控制错觉
Langer和Roth (1975)年通过实验证明了控制错觉的存在,控制错觉是指对客观上由机会决定的事件的控制感,且机会情境与技能情境越相似,存在控制错觉的可能性就越大。Morone等人(2021)通过第一阶段让被试自己选择和分配两种操作,在分配情况下,没有控制错觉的存在。结果表明在传统的蒙提霍尔问题中,被试在分配的情况下做出了更多的交换决策,而在第一阶段要选择两个的情况下,被试也同样做出了更多的交换决策。Granberg和Dorr (1998);Herbranson (2012)认为被试做出不交换的决策可以用控制错觉来解释。
3.4. 概率匹配
概率匹配是一种非理智的决策行为,如一个箱子里有10个球,其中7个红球,3个绿球。让被试预测不放回的抽出10个球的序列(如:红红红红红红红绿绿绿),每预测对一次便会获得奖励。有概率匹配倾向被试的预测序列中会倾向于预测7个红球,3个绿球。而理性的决策则是10次全部预测红球。概率匹配只有在重复决策范式中才可能出现,Herbranson和Schroeder (2010)的实验发现了被试有明显的概率匹配倾向。Herbranson等人认为被试在经历多次的蒙提霍尔问题的决策之后,被试了解了保持自己最初的选择和交换之间的概率,因此做出来具有概率匹配倾向的决策。
3.5. 因果冲突
Pearl (2000)提出了冲突原则,如果某所研究生院的录取标准是高分或特殊音乐天赋,那么这两个属性在该校学生中会被发现呈负相关。即使这些属性在一般人群中是不相关的,这也是正确的。Burns和Wieth (2004)通过4个实验发现,被试在涉及竞争强调因果关系的MHD版本中表现更好。他们认为人们解决蒙提霍尔困境困难的原因是他们无法理解其因果结构的含义,这是一种对撞结构,其中两个独立的因果因素影响一个结果。
3.6. 禀赋效应
禀赋效应是指当个人一旦拥有某项物品,那么他对该物品价值的评价要比未拥有之前大大增加。它是由Thaler (1980)提出的。这一现象可以用行为金融学中的“损失厌恶”理论来解释,该理论认为一定量的损失给人们带来的效用降低要多过相同的收益给人们带来的效用增加。因此人们在决策过程中对利害的权衡是不均衡的,对“避害”的考虑远大于对“趋利”的考虑。出于对损失的畏惧,人们在出卖商品时往往索要过高的价格。
4. 提升蒙提霍尔问题解决的方法
4.1. 门的数量
Burns和Wieth (2004);Franco-Watkins等人(2003);Saenen等人(2015);Stibel等人(2009),通过操作门的数量,如100门蒙提霍尔问题中,被试第一次选中奖品的概率是百分之一,而在打开了98个门之后,剩下的未选的门获奖的概率是百分之九十九。在100门的蒙提霍尔变式中,被试选择交换的比例显著提升。这种方式从根本上改变了蒙提霍尔问题的内容,被试在100门问题中做出了较高地交换的选择,有助于促进被试在蒙提霍尔问题中的迁移。
4.2. 反馈
Hirao等人(2017)和Saenen等人(2015)研究了反馈对蒙提霍尔问题的影响,结果表明被试在频率反馈条件下做出了更多的交换决策。可惜的是,很少有被试做出了正确的概率判断。根据此我们可以推测,被试是通过反馈学会了选择交换这一行为,而并非理解了蒙提霍尔问题的内在逻辑。即被试在获得反馈的过程中明白了选择交换有更高的可能性获奖,而不明白为什么选择交换有更高的可能性获奖。
4.3. 交流和竞争
Slembeck和Tyran (2004)研究了交流和竞争对蒙提霍尔问题解决的影响,在他的2 × 2的组间设计中,交流(有交流,无交流),竞争(奖励独立,奖励与他人相关)结果表明当被试可以交流讨论且奖励与他人相关时,他们做出交换决策的比例显著增加。从中,我们可以认为交流是提升蒙提霍尔问题解决的一种可行的方法。如果进行群体决策,可能蒙提霍尔谬误就会消失。
5. 蒙提霍尔问题的展望
现有大量关于蒙提霍尔问题的研究表明人们解决蒙提霍尔问题困难可能是多种因素共同影响造成的,但是归根结底蒙提霍尔问题实质上还是一个概率问题,因此可以从概率方向研究蒙提霍尔问题。如很多被试认为交换和不换获奖的概率是一样的,如果被试能正确地认识到蒙提霍尔问题被试的概率差异,那么他们是否会做出更加理性的决策呢?此外,蒙提霍尔问题作为一个二阶段决策问题,在第一阶段,从三扇门中选择一扇门大多数人都能正确地认识到选择其中一扇门能获奖的概率是1/3。在第二阶段,主持人揭露了一扇门之后,大多数人认为交换与不换的概率都是1/2。研究人们的概率认知为什么会变化,以及人们的概率认知如何变化,对于提升人们决策的科学性具有积极意义。
此外,大量的研究表明在重复蒙提霍尔问题中,人类、动物都会随着反馈信息的增多,逐步地做出更多交换的决策。然而人们做出交换是通过反馈习得了交换这一行为,还是顿悟了蒙提霍尔问题的内在结构却不得而知,以后的研究可以通过改进蒙提霍尔问题实验的范式来研究顿悟和习得的差异。