1. 引言
随着人工智能和自然语言处理技术的快速发展,智能客服系统已在电商平台的售前咨询、订单处理与售后服务等核心环节实现规模化应用[1]。智能客服在提升电商交易流程自动化水平、优化服务资源配置以及改善消费者体验方面表现出显著优势[2]。然而,受当前人工智能技术发展水平限制,智能客服在使用过程中仍然存在回答生硬机械、不能准确理解问题、解决效率低下等固有缺陷,无法满足客户的个性化需求[3],用户对智能客服的满意度普遍较低,其负面态度已成为阻碍该技术被广泛采纳的重要因素。在此背景下,深入探究用户负面态度的影响因素,对优化人机交互体验、推动电商平台智能客服的可持续发展具有重要的现实意义。
尽管智能客服在电商平台得到广泛应用,但关于消费者对使用智能客服行为的研究仍处于起步阶段,且在拟人化设计对用户态度的影响机制上存在明显分歧。部分研究揭示了智能客服拟人化设计可能引发的负面效应,认为高度拟人化可能直接引发消费者更强烈的负面态度[4]。另一方面,亦有研究从积极视角论证了电商平台智能客服对用户行为的促进作用,人工智能客服能够通过互动性、信任感与情绪性等维度有效增强消费者的在线购买意愿[5]。进一步研究发现,形式拟人化在激发消费者积极情绪方面更为有效,而行为拟人化在影响消费者感知和行为倾向方面具有更显著的作用[6]。
现有研究多聚焦于拟人化的表象特征,未能深入整合行为现实主义视角下的功能属性与用户态度之间的作用路径。在智能客服研究语境下,形式现实主义侧重于外观特征的人类相似性[7],涉及拟人化外观、空间维度及动作表现等;行为现实主义侧重于交互过程中人类行为的复现程度[8],包括沟通方式、响应类型及社交内容的呈现形式等。多项研究表明,形式现实主义与行为现实主义在不同场景中对智能客服形象效果的阐释和提升都起着关键作用[9],但现有研究多聚焦于智能客服的形式现实主义特征[10] [11],而对其行为真实性的研究则相对匮乏。若仅评估智能客服形式现实主义而忽视其行为现实主义,可能导致对消费者认知影响的误判或偏见[12]。
综上,行为现实主义即智能客服在交互过程中所表现出的“类人”行为逻辑与功能拟真性。区别于形式现实主义关注外观、语音等静态特征,行为现实主义聚焦于系统在响应速度、问题解决能力、人机协同流畅性、社交互动适宜性等方面的动态表现。在智能客服语境下,行为现实主义体现为客服机器人能否像真人客服一样理解复杂意图、提供连贯应答、灵活转接、情感响应并高效解决问题。行为现实主义能够增强用户对机器技术的理解,提高其对技术功能和操作的感知。
鉴于此,本文基于行为现实主义,构建智能客服用户态度影响因素模型。研究从微博、抖音等社交媒体平台获取海量用户评论文本,运用BERTopic主题建模识别行为现实主义特征。通过回归分析,探讨各属性对用户负面态度的影响,从而揭示负面态度形成原因及其作用方向。本研究旨在为电商平台智能客服系统的行为设计提供理论指引,为电商平台优化服务流程、提升人机交互质量提供实证依据,助力构建更具人性温度的智能服务。
2. 研究设计
2.1. 研究思路
Figure 1. Research approach
图1. 研究思路
本文首先利用网络爬虫技术从微博、抖音社交媒体平台获取电商场景下智能客服相关的用户评论文本数据,然后采用BERTopic主题建模识别用户关注的核心属性,通过主题相似度分析与人工程序复核,最终识别出6个行为现实主义功能属性。在此基础上,运用回归分析验证各属性对负面态度的独立影响及其显著性,借助RoBERTa预训练模型计算每条评论的情感极性得分,将其量化结果负面情感强度作为被解释变量,同时,基于主题建模结果构建各属性重要性得分作为解释变量,最终确定关键影响因素及其作用方向,研究思路如图1所示。
2.2. 研究方法
2.2.1. BERTopic主题建模
BERTopic是一种新颖的语义分析工具,它将预训练模型BERT与主题建模相结合,是Grootendorst在2022年提出的一个主题建模方法,在各个领域的主题建模中取得了良好的主题识别[13]。与LDA相比,BERTopic的核心优势在于它能够更有效地处理文本,在保留上下文语义信息的同时,在主题词的深度、专业性和词关系的清晰度方面表现出卓越的性能。该模型首先使用BERT构建文档嵌入,UMAP进行降维,HDBSCAN算法进行分层和密度聚类,最后使用c-TF-IDF提取主题词[14]。BERTopic进行主题建模具体流程及方法如图2所示。
Figure 2. Process and methodology of BERTopic topic modeling
图2. BERTopic主题建模过程和方法
1) 文本预处理。使用jieba分词对评论文本进行分割,基于哈工大停用词以及特定词(如“AI、机器人”等)构建停用词表,去除停用词及特殊字符,得到切词文本。
2) 文本嵌入。由于BERTopic模型默认的MiniLM-L12-v2多语言嵌入模型的最大训练序列长度仅为128,而微博文本的长度通常超过此限制,因此本研究选择models-BAAI-bge-large-zh-v1.5模型进行训练。该模型最大训练序列长度可达512,且词向量表示维度为1024,可以更充分地捕获中文长文本间的语义信息。
3) 降维和聚类处理。由于聚类模型通常难以处理高维数据,因此需要UMAP算法进行降维处理。UMAP的参数是灵活的,可以根据数据集和任务进行调整,捕获局部和全局高维空间信息,以提供更好的降维结果。采用基于密度的聚类技术HDBSCAN进行聚类,该算法能够自动确定聚类的数量,同时对噪声数据与异常值具有鲁棒性。经过多次建模对比与参数优化,最终确定BERTopic模型的参数设置,见表1。
Table 1. BERTopic model parameters
表1. BERTopic模型参数
模型 |
参数 |
UMAP模型 (Uniform Manifold Approximation and Projection) |
n_neighbors = 20; n_components = 2; min_dist = 0.0; metric = ‘cosine’; random_state = 42 |
HDBSCAN模型 (Hierarchical Density-Based Spatial Clustering of
Applications with Noise) |
min_cluster_size = 100; min_samples = 2; metric =
‘euclidean’; prediction_data = True |
4) 主题序列化。采用sklearn机器学习工具库中的CountVectorizer实现文本特征的向量化转换,将原始评论文本转化为数值特征表示。
5) 主题评估。BERTopic模型采用c-TF-IDF来评估HDBSCAN算法中序列化单词的主题表示的重要性。c-TF-IDF算法可以处理不同长度文本之间的差异,自动识别文本中的关键概念,提高文本分类和聚类的准确性。
2.2.2. RoBERTa情感分析
BERT和RoBERTa都是基于Transformer架构的预训练语言模型。RoBERTa是FacebookAI于2019年提出的对BERT模型的改进版本,采用了更大的批量大小、更长的训练时间和更多的数据,并对动态掩码策略进行了改进[15]。相较于BERT,RoBERTa在多个自然语言处理任务上取得了更好的性能表现。
在本研究中,评论数据为中文格式,因此采用了Erlangshen-Roberta-330M-Sentiment模型。该模型是对RoBERTa模型的一种改进,在预训练阶段采用了更为有效的“Span-based Dynamic Masking”动态掩码策略,相比原始RoBERTa的静态掩码,能够更好地捕捉中文短语的语义特征,提升对中文短语的建模能力,可用于新闻、社交媒体、电商评论等中文多领域文本[16]。
3. 电商平台智能客服行为现实主义负面态度的影响因素识别
3.1. 数据采集
本研究以智能客服为研究对象,选取微博和抖音两大社交平台2024年11月至2025年5月发布的智能客服相关话题(包括智能客服、智能客服机器人、AI客服、服务型人工智能、在线客服机器人等)作为数据来源。研究采用评论量、点赞量和转发量作为筛选标准,确保数据的代表性和活跃度。通过Python爬虫采集了共计45,640条数据(微博18,669条,抖音26,971条),包括用户id、评论文本、评论发布时间、评论点赞量及评论中是否含有图片共五个字段。
3.2. 数据预处理
在进行数据分析之前,首先去除缺失值、重复项及评论文本中的表情符号、数字、空格等异常字符和词数低于5或高于512的评论内容。其次,去除无关或相关性较低的内容。与产品评价或旅游平台景点评论这类高度聚焦具体使用场景的内容不同,社交媒体上关于电商智能客服的讨论呈现出显著差异。其一,相当比例的评论并非基于实际电商平台智能客服使用体验,而是用户对智能客服技术前景的推测和未来发展的畅想;其二,评论数据中包含大量与智能客服功能无关的内容;其三,企业发布的营销推广信息也占据一定比重。这种内容构成特点导致智能客服评论数据的有效信息密度明显低于其他主题,因此在数据预处理阶段需要重点过滤电商消费过程中的实际服务体验关联度低的文本内容。经过多轮筛选及人工复核,最终剩余4922条电商智能客服相关的有效评论数据。
3.3. 基于BERTopic主题模型的影响因素识别
在预设参数条件下,BERTopic模型识别出10个潜在主题(Topic 0~Topic 9)。为消除冗余主题并贴合主题结构,通过余弦相似度计算主题间的关联矩阵,并借助热力图(如图3所示)直观呈现各主题间的关联程度,将相似度高于0.9的主题标记为潜在合并对象,由两位研究人员独立审查这些主题的关键词与代表性评论,依据“是否归属于同一行为现实主义维度”进行判断。在此基础上,将Topic 0、Topic 5与Topic 7合并,Topic 6、Topic 8与Topic 9合并,最终凝练出6个行为现实主义相关的核心主题。为了更直观地展现聚类效果,本研究采用了降至二维的向量来表征每条评论文本。在主题聚类过程中观察到的高密度簇,可视为电商平台智能客服的关注热点。主题和评论文本之间的关系如图4所示。
Figure 3. Topic cosine similarity heatmap
图3. 主题余弦相似度热力图
图4中每个点代表一条评论,点的颜色表示特定文档所属的主题,大多数主题簇彼此之间显著分离,模型具备良好的主题区分能力。通过分析各主题的关键词及其对应文本内容,确定各主题代表的电商平台智能客服属性。主题0为人机协同,主题1为职业替代,主题2为响应速度,主题3为服务可及性,主题4为问题解决成本,主题5为智能水平。
Figure 4. Intelligent customer service attribute topic distribution
图4. 智能客服属性主题分布
4. 电商平台智能客服行为现实主义负面态度的成因分析
4.1. 研究假设
4.1.1. 人机协同与用户负面态度
智能客服在标准化流程操作、基础信息查询上具有显著的替代优势,并能提供全天候的服务,但是涉及情绪、情感方面的复杂情景时智能客服仅能发挥辅助作用,不能完全替代人工客服。因此,塑造一个“协助者”而非“替代者”的人工智能形象,更能获得消费者的认可与好评[17]。尽管理论上人机协同被寄予厚望,但实践中普遍存在的“轻以人为中心”的协同模式,不仅导致了消费者客服体验的降级,还加重了人工客服情绪劳动的负担[18]。人机协作,特别是在人工智能驱动的反馈管理中,可以加强技术与可持续发展之间的联系[19]。行为现实主义强调交互的连贯性与社会角色协调性。转接障碍实质上是系统在“角色转换”行为上的失能,破坏交互流畅性,引发用户对服务流程“非人性化”的负面感知。由此提出以下假设:
H1:人机协同过程中的转接障碍对智能客服用户负面态度有显著正向影响。
4.1.2. 职业替代与用户负面态度
人工智能作为关键驱动力,正在加速劳动力市场的结构性转型进程。程序化、重复性岗位逐渐被自动化系统和智能机器取代,加剧了技术性失业的问题。图书馆文书助理、技术馆员等具有高度可程序化特征的职业面临短期被替代风险[20],引发了从业者的失业焦虑;智能自动化工作替代风险对酒店业劳动力的工作年限和职业转换概率存在破坏性影响[21]。不同国家自动化技术对人类劳动力均产生替代效应。多项研究表明,美国高达47%的就业岗位面临高替代风险[22],在日本这一比例约为55% [23],而中国的情况更为严峻,面临高替代风险的就业岗位比例高达59.5% [24]。行为现实主义不仅关注交互行为本身,也涵盖用户对智能体社会角色认知的心理机制。职业替代焦虑反映了用户对智能客服在社会功能替代性上的消极预期,进而引发对人际服务角色被侵蚀的担忧。由此提出以下假设:
H2:职业替代焦虑对智能客服用户负面态度有显著正向影响。
4.1.3. 响应速度与用户负面态度
响应速度是行为现实主义中“即时反馈机制”的核心体现,符合人类对话的实时性预期,直接影响用户对系统交互真实感的判断,被广泛认为是影响用户态度的重要因素[25]。根据印象形成理论,响应速度反映了智能客服的服务态度与效率,影响用户整体评价与后续使用意愿。基于信息丰富度理论,快速响应能够提高信息理解能力。响应速度能够对用户产生积极影响,进而对满意度、感知易用性和信任度产生积极影响。以ChatGPT为例,其快速响应可以提高用户满意度和访问的可能性,并提高感知有用性[26]。在电商领域,电商平台AI客服的响应速度能够正向影响消费者忠诚度[27];医疗咨询场景中响应速度显著正向影响医疗咨询产品销量[28]。由此提出以下假设:
H3:响应速度对智能客服用户负面态度有显著负向影响。
4.1.4. 服务可及性与用户负面态度
可及性是指个体基于客观能力与系统条件,有效获取并利用所需资源的可能性。服务可及性体现行为现实主义中的服务可达性与适应性。高可及性意味着智能客服能在用户需要时及时出现,并能适应不同用户与场景的需求,这种行为层面的“可接近性”与“情境适配性”符合人类服务提供者的自然行为逻辑,从而提升用户体验与接受度。现有研究在不同服务语境下均验证了服务可及性的关键作用。图书馆虚拟现实服务的可及性对用户体验意愿具有显著正向影响,并能有效拉近用户与虚拟技术的心理距离[29]。医疗服务可及性对老年人自评健康有显著正向影响[30],对提升公共健康具有现实意义。从认知心理机制来看,个体对目标刺激的加工中,感知到的服务可及性程度,将直接影响其对认知对象的态度倾向。感知可及性越高,用户对服务的态度越积极,从而带来更高的购买意愿[31]。由此提出以下假设:
H4:服务可及性对智能客服用户负面态度有显著负向影响。
4.1.5. 问题解决成本与用户负面态度
问题解决成本是用户使用智能客服时,承担的代价与成本,涵盖时间投入、经济支出、认知负荷、情感消耗及操作复杂度等多维因素。根据“最小努力原则”,用户在信息获取的过程中普遍倾向于寻求最省力、便捷的途径,以期实现单位成本所获有用信息的最大化[32]。这一认知机制在多个服务场景中得到验证。行为现实主义强调交互的自然流畅与低认知负荷,高解决成本则意味着系统在问题理解、路径引导、解决方案提供等行为环节上的低效与笨拙,违背“类人服务”应具备的便捷性与智能性。古籍数字资源的用户成本对用户满意度具有显著的负向影响,成本越高,用户满意度越低。用户对人工智能设备使用成本的感知会显著削弱其使用情绪,并进一步影响后续的行为倾向[33]。以年轻群体为例,在使用智能设备时,感知的使用成本越低,其使用意愿就越强烈,对采纳行为产生推动作用[34]。由此提出以下假设:
H5:问题解决成本对智能客服用户负面态度有显著正向影响。
4.1.6. 智能水平与用户负面态度
数字化与智能化已成为智能客服用户的核心诉求与价值判断关键。智能水平直接对应行为现实主义的问题解决能力。高智能水平意味着更贴近人类的问题处理逻辑,提升行为拟真度。AI服务机器人的交互流畅性、准确性等智能表现均会对消费者幸福感、接受意愿等产生积极作用关系[35]。同时,服务机器人的智能化水平越强,越能从不同角度帮助消费者解决多样复杂的问题,为消费者提供便宜的同时,提升其在消费者中的口碑,进而提升消费者满意度、主观幸福感等积极情绪[36]。当智能客服频繁陷入服务失败时,提升智能客服的服务水平,有助于从根本上降低服务失败的发生概率,增强顾客的满意度和持续使用意愿[37]。由此提出以下假设:
H6:智能水平对智能客服用户负面态度有显著负向影响。
4.2. 变量测量
4.2.1. 被解释变量
基于ABC态度理论,社会心理学将“态度”界定为“个体对某一对象所持有的、相对稳定的积极或消极评价倾向”[38],该倾向通常由认知、情感与行为意向三个核心成分构成。用户针对智能客服所产生的在线评论,是态度的外显行为表达。其中,评论内容所蕴含的负向情感,直接反映了态度中的情感成分。鉴于情感效价与整体态度评价具有高度内在一致性,本研究将“用户负面态度强度”定义为通过评论文本计算得出的连续型情感分数,并以此作为研究的被解释变量。
情感分数由RoBERTa模型计算,具体而言,选取所有情感分数小于等于0的评论作为分析样本,从而得到一个取值范围为(−1, 0)的连续变量(其中,0代表无明显负面态度,−1代表极度强烈的负面态度)。
本研究通过Hugging Face的Transformers库加载和使用RoBERTa预训练模型。在具体实现过程中,模型加载时设置了3个输出类别(负面、中性和正面),并采用快速分词模式以提升处理效率,同时将最大序列长度设置为512以适配中文长文本的处理需求。
使用RoBERTa模型对评论文本进行词级情感分析,获得每个词汇的情感极性得分。由于研究聚焦于情感强度分析,故将情感分数取绝对值,得出不含正负方向的情感强度得分。
4.2.2. 解释变量
解释变量包括人机协同、职业替代、响应速度、服务可及性、问题解决成本和智能水平的智能客服属性。具体通过BERTopic获取智能客服评论属性分类,确定智能客服用户关注属性;为提升属性标注的准确性,采用两位编码员对500条随机评论进行人工复核与校正,双方对属性归类的一致性达到93.2%;再使用RoBERTa模型得到评论中提及属性的情感强度;最后获取每条评论中提及的属性权重,两者的乘积即为属性在评论中的重要性。用户对某一属性的提及(主题归类)代表了该属性进入其认知评估范畴,而提及时所伴随的情感强度则表征了该属性对其态度影响的程度,两者结合共同构成了属性影响力的量化指标。
属性权重计算公式为:
(1)
式中,
是评论d属性i被提及的频次
,将其除以六个属性被提及的频次总和获得评论对该属性的权重
。
通过属性权重
和情感强度
的线性组合得到每条评论中各个属性的重要性得分
,其中β是各个属性情感倾向的绝对值,表示组成每条评论i中各属性的情感强度,具体计算公式为:
(2)
属性的重要性挖掘部分结果见表2。
Table 2. Examples of comment texts and their attribute importance
表2. 评论文本及其属性重要性示例
评论文本 |
情感分数 |
正面得分 |
负面得分 |
主题0 |
主题1 |
主题2 |
主题3 |
主题4 |
主题5 |
太同意了,我前两天打客服电话,一层层各种问题,闯了七八关,接通的第一刻我就和客服说找你们人工客服可真难 |
0.9992 |
0.9996 |
0.0003 |
0.7300 |
0.7442 |
0.3949 |
0.6065 |
0.7288 |
0.5612 |
众所周知,自始至终只有VIP才配拥有人工客服 |
0.7731 |
0.8865 |
0.1134 |
0.5499 |
0.4172 |
0.5348 |
0.3876 |
0.3714 |
0.2092 |
不管怎么样,总感觉AI客服不如人工客服 |
0.6294 |
0.8147 |
0.1852 |
0.1480 |
0.1522 |
0.1059 |
0.0548 |
0.2502 |
0.2689 |
4.2.3. 控制变量
根据相关研究,将评论特征作为控制变量,包括评论长度(Length)、评论可读性(Readability)、评论类别(Topic)、评论是否含图片(Photo)、评论影响力(Voice)以及评论的时间间隔(Elapse_day)。同时将平台类型纳入控制变量,以消除社交媒体形式对结果的潜在干扰。
通过计算每条评论的字符数,作为衡量评论长度的标准。
评论的可读性参考张新等[39]的方法,得分越高代表可读性越高,其计算公式为:
(3)
式中,a、b、c分别为每个分句中的平均字数、每个句子中副词和连词个数。
本研究中的主要变量指标测量和数据来源见表3。
Table 3. Variable definition
表3. 变量定义
变量类型 |
变量名称 |
变量符号 |
变量描述 |
被解释变量 |
用户负面态度 |
Attitude |
每条评论情感分数绝对值 |
解释变量 |
人机协同 |
HMC |
人机协同属性重要性得分 |
职业替代 |
CSA |
职业替代焦虑属性重要性得分 |
响应速度 |
PSE |
问题解决效率属性重要性得分 |
服务可及性 |
SA |
服务可达性属性重要性得分 |
问题解决成本 |
PSC |
问题解决成本属性重要性得分 |
智能水平 |
IL |
智能水平属性重要性得分 |
控制变量 |
评论长度 |
Length |
评论的字数 |
评论可读性 |
Readability |
根据句中字数、副词、连词计算 |
评论类别 |
Topics |
评论所属主题,共7个主题 |
评论是否含图片 |
Photos |
评论包含图片为1,否则为0 |
评论影响力 |
Voice |
评论点赞数 |
评论时间间隔 |
Elapse_day |
评论采集日期与发布日期之间相差的天数 |
平台类型 |
Platforms |
数据来源为微博为1,抖音为0 |
4.3. 模型构建
本文采用普通最小二乘法(OLS)考察解释变量与被解释变量(用户负面态度)之间的关系。尽管用户态度在理论上存在取值边界,但本研究的样本数据显示,其观测值在有效范围内呈连续分布,未出现临界堆积现象,满足OLS模型的核心应用条件,如方程(4)所示。
(4)
式中,
为截距项,
和
为影响系数,
为误差项。Controls为控制变量,包括评论长度、评论可读性、评论类别、评论是否含图片、评论影响力、评论时间间隔以及平台类型。
4.4. 结果和讨论
本研究采用STATA 15.1数据分析软件进行回归分析,探讨智能客服属性对用户负面态度的影响关系。在回归前,对自变量的共线性问题进行了检验,所有自变量的方差膨胀因子(VIF)值均小于10,说明各个自变量之间不存在多重共线性。回归分析的结果见表4。
Table 4. Regression analysis results
表4. 回归分析结果
变量名称 |
β |
t |
p |
智能客服属性 |
|
|
|
人机协同 |
0.0304*** |
5.19 |
0.000 |
职业替代 |
0.0240 |
1.72 |
0.085 |
响应速度 |
−0.1081*** |
−4.31 |
0.000 |
服务可及性 |
−0.0282*** |
−5.56 |
0.000 |
问题解决成本 |
−0.0078 |
−1.49 |
0.136 |
智能水平 |
−0.1738*** |
−7.47 |
0.000 |
控制变量 |
|
|
|
评论长度 |
0.0005** |
2.90 |
0.003 |
评论可读性 |
0.1322* |
2.36 |
0.018 |
评论类别 |
0.0026* |
−2.41 |
0.016 |
评论是否含图片 |
0.0089 |
1.06 |
0.289 |
评论影响力 |
−5.91e−07 |
−0.91 |
0.363 |
评论时间间隔 |
−0.00003 |
−0.91 |
0.363 |
平台类型 |
−0.0033 |
−0.74 |
0.459 |
Contant |
−0.8892*** |
|
0.0991 |
调整后
|
0.0976 |
注:***、**、*表示在1%、5%和10%的水平下显著。
表4的结果显示,人机协同过程中的转接障碍与用户负面态度呈显著正相关(
= 0.0304, p < 0.01),H1得到验证。响应速度(
= −0.1081, p < 0.01)、服务可及性(
= −0.0282, p < 0.01)及智能水平(
= −0.1738, p < 0.01)与用户负面态度呈显著负相关,H3、H4与H6得到验证。此外,职业替代焦虑与问题解决成本对用户负面态度的影响并不显著。因此,关于智能客服属性的部分假设得到验证。
5. 结论与建议
5.1. 研究结论
本文通过对智能客服相关评论的深入分析,从行为现实主义视角系统地探讨了电商平台智能客服的主要属性及其对用户负面态度的作用机制。研究结果表明,不同属性对用户负面态度形成非对称性影响,具体研究结论如下:
1) 通过分析微博、抖音平台的智能客服用户评论,采用BERTopic主题建模与RoBERTa情感分析技术,基于行为现实主义,识别出6个影响电商平台智能客服用户负面态度的关键因素,包括人机协同转接障碍、职业替代、响应速度、服务可及性、问题解决成本与智能水平。
2) 智能客服的属性对用户负面态度产生显著的差异化影响,且其方向与行为现实主义的理论预期一致。人机协同过程中的转接障碍会显著加重用户的负面态度,而响应速度、服务可及性与智能水平则对缓解用户负面情绪具有明显的积极作用。这一发现印证了行为现实主义的核心观点,及系统在“交互连贯性”上的障碍会损害体验,而在“响应即时性”、“服务可达性”与“问题解决智能性”上的行为拟真则会有效提升用户体验。这表明,在电商平台智能客服交互过程中,技术能力与流程设计共同塑造用户的体验感受,智能客服的理解与执行能力越强,越能从根源上消解用户不满;而转接路径不清晰则会显著降低服务效率,迫使用户重复操作或寻找其他路径,增加用户的交互成本与时间消耗,加剧负面情绪。
3) 职业替代焦虑与问题解决成本对用户负面态度的影响未达显著性水平。从行为现实主义视角看,在具体的、任务导向的电商即时交互情境中,用户的评价焦点高度集中于当下的、可见的“行为表现”(如响应、解决能力),而非远期的社会效应或隐含的成本维度。在具体的电商交互情境中,用户的认知资源集中于即时问题的解决效果,而非对未来职业前景的担忧。同时,用户对解决问题所需成本存在一定的心理预期,只要核心诉求得到有效满足,成本的适度增加并不直接触发显著的负面评价。这一发现揭示了智能客服用户体验评估的即时性与功能导向特征。
5.2. 理论意义
1) 拓展了行为现实主义理论的应用边界。将行为现实主义理论创新性地应用于电商智能客服这一大规模、任务导向的服务场景,验证了其解释力。研究通过主题建模与情感分析实现了对行为现实主义多维属性(如响应性、智能性、连贯性)的细粒度、可操作化测量,为该理论在实证研究中的应用提供了新的方法论路径。
2) 对服务质量模型与技术接受模型提供了微观层面的理论延伸。响应速度、智能水平等服务属性对用户态度具有显著影响,这与服务质量模型所强调的“响应性”、“可靠性”,以及技术接受模型中的“感知有用性”等核心维度具有内在一致性。本研究通过引入行为现实主义,为理解上述理论在智能服务语境下的作用机制,提供了一个更具体、更侧重于交互过程本身的微观解释。
3) 与期望确认理论结合,揭示了人机交互中的期望形成与确认机制。用户对智能客服的期望,部分源于其外观或初步交互暗示的形式现实主义,但最终的负面态度则由行为现实主义的实际表现所确认。例如,高智能水平带来正向确认,而转接障碍则导致负向确认。这揭示了在人机交互中,期望的基准与确认的对象可能分别锚定于形式与行为两种不同的现实主义层面,深化了对人机交互满意度形成机制的理解。
5.3. 建议
基于上述研究结论,为电商平台智能客服系统设计和运营企业提出如下建议:
1) 优先提升智能客服的核心行为拟真能力。智能水平与响应速度是抑制用户负面态度效应最强的两个属性。企业应将技术资源优先投入到提升自然语言理解的准确性、问题解决的知识库覆盖率及系统响应架构优化上。同时,建立响应速度的动态监测与保障机制,特别是在大促、支付等高并发场景下确保即时响应。此外,需优化人机协同转接流程,简化关键环节的转接路径,设置清晰的进度提示与合理的等待阈值,以减轻因流程中断带来的负面体验。
2) 构建多维度用户体验监测与干预体系。将转接效率、响应速度、问题解决率等关键指标纳入智能客服质量评估体系,重点监测智能水平、响应速度等核心指标,重视用户在与智能客服交互过程中的体验,建立用户情绪实时监测机制。通过定期收集用户反馈,包括用户满意度调查、在线评价、投诉建议等,深入了解用户对智能客服的整体感受和需求,及时发现服务中存在的问题和不足,并针对性地进行改进和优化。建立有效的协同管理机制,明确智能客服和人工客服的职责分工和协作流程,确保在智能客服无法解决问题时能够及时、顺畅地转接至人工客服,提高问题解决的效率和质量。
3) 构建人机协同的培训与能力提升体系。建立标准化的培训机制,开展人工客服的平台规则、商品知识与促销逻辑专项培训。通过模拟场景演练,提升人工客服在复杂服务场景下的应对能力,特别是在接收转接用户时的信息整合与问题解决效率。建立完善的人工客服情绪管理与沟通技巧培训体系,增强其在处理用户负面情绪时的专业素养。建立双向反馈机制,鼓励人工客服记录并反馈智能客服的服务缺陷,形成人工经验与系统优化的良性互动循环。
5.4. 研究局限
在深入分析电商平台智能客服行为现实主义因素对用户负面态度影响的同时,本研究也存在一些局限性和未来研究的拓展方向。在数据来源方面,数据主要来自微博、抖音等社交平台,其用户以年轻活跃群体为主,不能代表高龄、低学历等用户群体对智能客服的感知与态度。未来可结合电商平台内部客服对话数据、用户调研等多源数据,以增强样本的覆盖性与结论的泛化能力。此外,回归模型解释方差(R2 = 0.0991)较低,表明用户态度形成机制具有复杂性,除本文聚焦的行为属性外,可能还受到用户个体特征(如技术焦虑、以往体验)、具体服务场景(如售前、售后)及品牌信任等因素的调节作用。未来研究可在此基础上,构建更整合的理论模型,进一步揭示不同用户在不同情境下的态度形成机制。
基金项目
本文为陕西省自然科学基金一般项目–面上项目(用户对客服机器人算法厌恶的形成机理与治理路径研究) (项目号:2025JC-YBMS-831)研究成果之一。
NOTES
*通讯作者。