1. 研究背景与目的
恐怖谷(Uncanny Valley)理论预测,人们将对越来越多的仿生机器人产生青睐,但高度逼真又非真实人类的仿生形象会引发人们的不安和恐惧(Mori, 1970)。类似于人类但不完全等同人类的人造角色唤起了观看者的负面认知和评价,这一观点随后在不同领域的研究中得到验证。人们对恐怖谷效应的关注已经从最初的仿生机器人技术延展到如计算机图形学、心理学、艺术学等更多学科,其中包括数字虚拟设计领域(Seymour et al., 2021)。
过于拟真的数字虚拟角色可能会引起令人毛骨悚然的感觉,因此尽管当代CG技术上已经可以制作出高度逼真的数字面孔,但是虚拟角色的设计者仍然倾向于在渲染、照明、表面材质和动作方面保留瑕疵,以避免落入恐怖谷,降低了人们对角色的认同感和喜爱度(Kätsyri et al., 2015)。
关于恐怖谷效应的产生机制,研究者们从不同角度进行探讨。类别不确定性观点认为,怪异感和恐惧感源于人们对所见的物体是什么类别表示怀疑,例如它是否具有生命,是否属于人类,以及更多类别感知的模糊和歧义等(Burleigh & Schoenherr, 2015)。感知不协调理论则认为,人们对人类复制品形象感到恐惧,是因为其特征与人类相似性不匹配引起(Chattopadhyay & MacDorman, 2016),此时关于恐怖谷效应的论述往往集中在人类相似性的变化如何引起不同的情感反应上。
除了人或类人形象以外,研究者观察到非人类形象同样具有恐怖谷效应(Diel & MacDorman, 2021)。因此我们不免思考,数字虚拟形象的现实相似性与原型物种差异到底在恐怖谷效应中起了何种作用,以及如何影响人们的情感感知?
本研究尝试运用恐怖谷理论观点,探讨数字虚拟角色形象设计中,拟真度高低与原型物种差异对虚拟角色认同感、亲和力与喜爱度感知的影响,以期为数字虚拟角色的设计开发提出有效建议。
2. 文献回顾
此前研究发现,虚拟角色的拟真程度会影响人们对它的主观感受和认可接受。Kätsyri等人(2019)对比了绘画人脸和CG人脸形象,发现不拟真的人脸触发了更大的镇定感,而逼真的CG人脸引起了微弱的恐怖谷效应。
这一类研究符合恐怖谷理论的最初预测,即高度拟真却并非真实的人造角色会引起负面评价。因此,推出本研究的第一个假设:
H1:高拟真度数字虚拟角色的认同感低于低拟真度数字虚拟角色。
此外,有研究者聚焦于物种类别角度研究恐怖谷效应,针对人类与非人类原型对象探讨恐怖谷效应的影响差异。Ferrey等人(2015)以两个实验测量了参与者对计算机生成的人类及动物形态的情感反应,发现经典恐怖谷效应的情感趋势在所有连续区域都发生了,包括非人类的物种类别。Ho和MacDorman (2010)发现人的特征通常比非人的特征更讨人喜欢,人类相似度与喜好度之间存在高度相关性。因此,我们可以推出本研究的第二个假设:
H2:以人类为原型的数字虚拟角色认同感高于非人类数字虚拟角色。
Mori在他的原始论文中将恐怖谷效应的因变量称为shinwakan,但在此后的研究中,shinwakan被翻译成不同的词,如熟悉度、亲和力、讨人喜欢和融洽的关系。被翻译出来的不同词语所代表的含义和测量题项并不相同,以至于恐怖谷效应的研究结果时而矛盾。
Cheetham等人(2014)的研究以熟悉度进行测量时发现并没有出现恐怖谷效应,因为熟悉度随着人类形象的相似度增加,而模棱两可的人造角色的熟悉度并不遵循这种规律。Kätsyri等人(2019)因此认为测试恐怖谷效应时,应将主观亲和力与主观的人体相似性测量进行对比。Chattopadhyay和MacDorman (2016)则建议根据直觉来评估亲和力,或者从喜爱度等相关测量变量探索恐怖谷效应(Yamada et al., 2013)。
研究者Kätsyri等人(2017)在电影片段中对比卡通、半现实和人类形象,发现卡通人物获得了最高的陌生等级和最低的喜好等级。Seymour等人(2021)分别使用2D卡通漫画虚拟形象和3D照片级虚拟现实角色形象进行亲和力、可信赖性和使用偏好研究测试,研究结果是参与者认为逼真的头像更加值得信赖和具有更高的亲和力,并且更喜欢将其作为虚拟代理。这些研究发现与经典的恐怖谷理论观点并不完全吻合。不吻合的原因值得进一步细分探究,因此,本文提出以下两个研究问题:
RQ1:不同拟真程度的人类形象角色组,亲和力、认同感和喜爱度是否有显著差异?
RQ2:不同拟真程度的非人类形象角色组,亲和力、认同感和喜爱度是否有显著差异?
3. 研究方法
3.1. 实验设计
本研究采用量化研究方法,以数字虚拟角色的拟真度高/低、原型物种是否为人类开展2 * 2在线实验。参与者被随机分组接触四种图片刺激物之一,根据所见图片填答问卷。
3.2. 研究对象
本研究的研究对象为中国在校大学生和中高职生,招募方式包括透过微信群组和课堂招募发放网络问卷。
3.3. 实验流程
3.3.1. 焦点小组
首先以六人焦点小组方式,讨论数字虚拟角色的图片刺激物选择和拟真程度差异。研究者根据焦点小组意见,从八种虚拟角色图片中,选定四种作为实验刺激物,并将此结果作为在线实验前测之根据。
3.3.2. 在线实验前测
在线实验前测主要进行拟真程度操弄,样本为四十人小量样本。受测者被随机分组阅读其中一种数字虚拟角色图片,填答拟真程度测量题项。受测者所感知的拟真程度平均分数达显著差异,完成正式实验之仿生拟真度操弄准备。
3.3.3. 正式实验
正式实验中,342位参与者被随机分组接触四种图片刺激物之一,根据所见图片填答问卷,共收到有效数据342份。其中,男性81人(26%),女性253人(74%)。教育程度为中专生79人(23.1%)、大学生255人(74.6%)及研究生8人(2.3%),平均年龄为19.4岁。55.8%的受测者表示此前曾使用或看过图片中的虚拟角色,另外44.2%的参与者表示未曾。受测者每天接触各类虚拟角色的平均时长为1.8小时。
3.4. 实验刺激物
实验刺激物选自《底特律:成为人类》和《Pokémon》两款游戏中虚拟数字角色卡拉和妙蛙,以静态图片方式呈现,分别代表1) 拟真度低 * 人类形象;2) 拟真度高 * 人类形象;3) 拟真度低 * 非人类形象;4) 拟真度高 * 非人类形象(见图1)。

Figure 1. Stimulus 1. 2. 3. 4 from left to right. The pictures are from the Internet and are organized by this study
图1. 从左至右分别为刺激物1. 2. 3. 4,图源网络,由本研究整理
3.5. 变项测量
3.5.1. 认同感
参照Looy等人(2012)的认同感量表,分为相似性认同感、期望性认同感和临场体验认同感三个维度,共计12题,包括“此虚拟角色与你个人有很多方面相似”、“它拥有你想要的特征”、“如果使用这个虚拟角色,你会觉得与它合二为一”、“你认可此虚拟角色”等。认同感量表信度系数为0.96。
3.5.2. 亲和力
在Kim等人(2012)量表的基础上修改,以“此虚拟角色具有亲和力”、“它让人有种舒服的感觉”、“你觉得可以靠近它”三题测量虚拟角色形象的亲和力。亲和力量表信度系数为0.93。
3.5.3. 喜爱度
参照van Vugt等人(2007)的喜爱度量表并适度修改,以四题项测量参与者对虚拟角色的喜爱度,题目包括“这个虚拟角色某些特质吸引你”、“你喜欢这个虚拟角色形象”、“如果有此虚拟角色的商品,你会多看几眼”等。喜爱度量表信度系数为0.94。
3.5.4. 基本人口数据
此部分主要了解参与者的性别、年龄、教育程度,是否接触过刺激物,以及虚拟角色的使用频率。
除了基本人口数据,其他变项测量采用李克特七点量表,1表示非常不同意,7表示非常同意。
4. 分析结果
4.1. 操弄检验
拟真度的操弄检验以独立样本T检定进行,首先,拟真度的Levene’s test未达显著(F = 2.4, p = 0.12),显示样本的离散程度没有显著差异。数据显示,低拟真度组(M = 4.2, SD = 1.44)与高拟真度组(M = 4.8, SD = 1.21)的平均分数达显著差异(t = −4.09, p < 0.001),高拟真度组的平均分数显著高于低拟真度组,显示操弄成功。
4.2. 数据分析
本研究使用SPSS软件分析数据,研究假设一的检验以独立样本T检定进行。首先将阅读1、3组刺激物的样本作为低拟真度组,阅读2、4组刺激物的样本作为高拟真度组。在数字虚拟角色的认同感上,高拟真度组(M = 4.09, SD = 1.64)与低拟真度组(M = 4.04, SD = 1.42)没有显著区别(t = −0.29, p > 0.05)。故H1不成立。
当阅读1、2组刺激物的样本作为人类形象角色组,阅读3、4组刺激物的样本作为非人类形象角色组,在数字虚拟角色的认同感上,人类形象组(M = 4.26, SD = 1.51)与非人类形象组(M = 3.86, SD = 1.52)两者的平均分数达显著差异(t = 2.43, p < 0.05),显示人类形象数字虚拟角色认同感显著高于非人类形象数字虚拟角色,故H2得到支持(见表1)。

Table 1. Comparison of digital virtual characters acceptance of bionic verisimilitude degree and bionic species
表1. 不同拟真度与原型物种的数字虚拟角色认同感对比
p < 0.05;**p < 0.01;***p < 0.001。
通过一般线性模型–重复测量对比亲和力、认同感和喜爱度三个因变量,数据显示球形检定违反,Mauchly’s W系数为0.837 (近似卡方检定 = 60.469, p < 0.001),因此采用修正数据。数据结果表明亲和力、认同感和喜爱度三者平均数差异达到显著水准(F = 12.418, p < 0.001)。通过事后成对比较发现,亲和力(M = 4.68, SD = 1.51)、认同感(M = 4.06, SD = 1.53)与喜爱度(M = 4.45, SD = 1.56)每两项之间都产生了显著差异。
通过独立样本T检定分析低拟真度与高拟真度的人类形象角色组的亲和力、认同感和喜爱度,结果显示:在亲和力上,低拟真人类组(M = 4.60, SD = 1.38)与高拟真人类组(M = 4.66, SD = 1.57)无显著差异(t = −0.29, p > 0.05)。在认同感上,低拟真人类组(M = 4.03, SD = 1.45)与高拟真人类组(M = 4.53, SD = 1.55)达到显著差异(t = −2.20, p < 0.05)。在喜爱度上,低拟真人类组(M = 4.23, SD = 1.48)与高拟真人类组(M = 4.80, SD = 1.49)显著差异(t = −2.49, p < 0.05)。也就是说,高拟真度的人类形象角色,其认同感、喜爱度均显著高于低拟真度的人类形象角色,而亲和力方面两者无显著差异。
低拟真度与高拟真度非人类形象角色组的亲和力、认同感和喜爱度对比通过独立样本T检定开展,结果显示:在亲和力上,低拟真非人类组(M = 4.97, SD = 1.43)与高拟真非人类组(M = 4.48, SD = 1.65)有显著差异(t = 2.08, p < 0.05)。在认同感上,低拟真非人类组(M = 4.05, SD = 1.39)与高拟真非人类组(M = 3.65, SD = 1.63)无显著差异(t = 1.74, p > 0.05)。在喜爱度上,低拟真非人类组(M = 4.66, SD = 1.51)与高拟真非人类组(M = 4.13, SD = 1.69)存在显著差异(t = 2.18, p < 0.05)。也就是说,低拟真度的非人类形象角色,其亲和力、喜爱度均显著高于高拟真度的人类仿生角色,而认同感方面两者无显著差异(见表2)。

Table 2. Affinity, acceptance and likeability of human/non-human image digital virtual characters
表2. 人类/非人类形象数字虚拟角色的亲和力、认同感和喜爱度对比
*p < 0.05;**p < 0.01;***p < 0.001。
5. 讨论
5.1. 拟真度对数字虚拟角色认同感的影响
本文首先检视拟真度高低对数字虚拟角色认同感之作用。研究结果表明,不同的拟真度整体上对角色认同感没有显著影响,但是原型物种的差异对角色认同感发挥作用:人类形象数字虚拟角色认同感显著高于非人类形象数字虚拟角色。
此发现与恐怖谷理论的经典论述不完全一致。恐怖谷效应基本假设指出,机器人或者其他人造人形角色在外表动作方面与人类相似时,人们对其产生正面情感,直至相似性上升到特定程度,人们会对其产生恐惧情绪,认同感降至谷底。然而,在我们本次实验中,单纯透过拟真度检验数字虚拟角色的认同感,并未发现不同拟真度的数字虚拟角色之间认同感有显著差异。可能的解释是,我们测量的数字虚拟角色除了人类形象角色,同时包括非人类角色形象,而恐怖谷效应最初的构想主要针对类人角色提出,它并不能涵盖所有的生物形象。当人类面对虚拟人形角色,由于对自身物种识别更加敏感,恐怖谷效应也随之更为强烈和明显。但是,在其他生物形象的虚拟角色设计中,恐怖谷效应规律有所改变。
此外,除了拟真度以外,人们对数字虚拟角色的主观感受存在复杂的机制。例如个人对某物种原有好恶情感等影响因素,在此前的恐怖谷理论研究中并未得到充分讨论,有待未来进一步探索。
5.2. 恐怖谷效应研究的混淆因变量
本研究同时测量了恐怖谷效应研究中经常混用的几个因变量,包括认同感、亲和力和喜爱度,结果发现受测者对这三个因素的认知结果并不相同。具体而言,认同感、亲和力和喜爱度三者平均数上达到了显著差异,事后比较发现,三个因变量中每两项之间的平均数差异都达到了显著水准。也就是说,无论在人类形象虚拟角色还是非人类形象虚拟角色的对比中,人们对于认同感、亲和力和喜爱度的理解都存在明显区别,以至于评分结果天壤之别。
这意味着,对于恐怖谷理论的应用与研究,由于词汇翻译以及文化背景的差异,此前研究者们所测量的因变量不完全一致。我们在这次实验中验证了一个猜想:以往恐怖谷效应研究的因变量一直被混淆使用和模糊表意,由于因变量没有达到统一而导致测量结果出现矛盾。本次实证研究呼应了恐怖谷理论研究缺陷的观点(Zhang et al., 2020),为前人研究结果的疑惑提供了合理性解释。
5.3. 人类与非人类数字虚拟角色之设计差异
本研究的另一个有趣发现是,面对人类与非人类形象的虚拟数字角色,人们在拟真度选择上的情感态度完全不同。具体而言,在人类形象数字虚拟角色中,低拟真度的设计在认同感、喜爱度方面都显著低于高拟真的设计,在亲和力方面虽然两者没有达到数据统计上的显著差异,但低拟真度组的平均值依然低于高拟真组。然而,在非人类形象数字虚拟角色中,情况完全相反,低拟真度的设计在亲和力、喜爱度上评分显著高于高拟真组,在认同感方面虽然没有达到数据上的显著差异,但低拟真度组的平均值依然高于高拟真组。也就是说,人们对高拟真度的人类形象数字虚拟角色有更强的认同感和喜爱度,而认为低拟真度的非人类形象数字虚拟角色的亲和力和喜爱度更高。
这表明,围绕以人类为设计原型的数字虚拟角色,相对于拟真度低的二维角色形象,人们会更喜欢材质肌理、结构比例上拟真度高的三维角色形象。然而,针对以非人类为设计原型的数字虚拟角色,人们则认为更卡通化的低拟真二维角色亲和力更佳,对其喜爱度也更高。这启示我们,在设计不同的数字虚拟角色过程中,设计师需要根据原型类别来适当选择拟真程度,以符合和满足用户的情感反应和需求。
6. 结论与建议
首先,本研究基于恐怖谷理论,探讨在数字虚拟角色的设计中拟真度与原型物种差异对认同感的影响。研究结果发现,数字虚拟角色的认同感并没有因为拟真度高低而出现显著差异,但是认同感会由于原型物种差异而产生显著区别。换言之,在数字虚拟角色拟真度高低程度实验中,恐怖谷效应经典论述所预测的判断标准未获证实。本次实证研究将恐怖谷理论应用于数字虚拟角色设计领域,一方面拓展了经典理论的应用领域和重新认识了理论的某些局限性,另一方面,通过对于数字虚拟角色原型进行划分,希望填补过去研究在这方面之不足,探索恐怖谷理论基本假设中新的影响因素,这也为未来的数字虚拟设计领域提供了更多设计思路与判断标准。
其次,本研究检验了在恐怖谷理论研究中经常混用的三个因变量,发现认同感、亲和力和喜爱度这三个在理论表述中的近似词汇,在测量数据中存在显著差异。因变量的厘清和对比,有助于研究者们重新审视恐怖谷理论意涵,并对前人研究的矛盾结果提出了更具合理性的新的解释。
最后,本研究细分了以人类和非人类形象为设计原型的数字虚拟角色,发现一个有趣的现象:对于人类数字虚拟形象,人们认为高拟真度设计比低拟真度设计更容易让人认同和喜爱;而对于非人类数字虚拟形象,人们则认为低拟真度设计具有更好的亲和力和喜爱度更高。这提醒我们,未来数字虚拟角色中的人类形象设计,建议采用高拟真度风格和形式。相反,如果是非人类形象的角色设计,建议采取更卡通化的低拟真方式,才能有效避免恐怖谷效应,获得人们更多的青睐。这一研究发现为数字虚拟角色设计与相关数字产品开发提供理论支持,并提出了细化的设计实践建议。
本研究限制包含以下两项。第一,作为刺激物的数字虚拟角色以静态图片方式展示,并且数量非常有限。未来研究可考虑增加动态型或者互动型数字虚拟角色,以符合丰富复杂的实际设计与使用情境。第二,此研究所收集有效样本大多数是大学生样本,平均年龄约20岁,这是相对年轻的便利样本。针对不同年龄阶段的观看者与使用者,拟真度与原型物种差异对角色认同感、亲和力和喜爱度的影响或许不同,值得未来进一步研究。
基金项目
珠海市2021~2022年度哲学社科规划课题“珠海非物质文化遗产的数字典藏、数字创意设计与传播研究”(2021YBA048);北京理工大学珠海学院2020年度教育教学改革项目“基于全国大学生学科竞赛的数字媒体艺术课程建设”(2020008JXGG)。