1. 引言
随着互联网和社交媒体的普及,越来越多的用户通过在线评论来表达个人观点和意见[1] [2]。消费者获取产品信息的途径已从以往的口碑相传转变为产品的热门在线评论,用户在线评论已成为消费者作出购买决策的重要依据[3]-[5]。有研究表明,75%以上的人在购买某产品时会搜索与之相关的评论信息进行参考,90%以上的企业则认为良好的产品评论信息会对消费者的消费行为产生促进作用[6],同时带有负面情绪的评论会对潜在消费者的判断和购买决策产生较大影响[7]。与传统市场调研相比,在线评论具有匿名性,不受时间、地域、职业差异和情感约束等因素影响[8],易收集、成本低[9]且数量非常庞大,这些由数十万顾客贡献的评论可以被视为“群体智慧”[10],能提供更真实的消费者期望和需求[10]。因此,如何从评论中获取有价值的信息[11],成为用户需求识别领域的重要研究方向。
从新能源汽车产销情况来看,汽车是当前国内经济表现最具潜力的行业之一。据中国汽车工业协会发布数据显示,2023年国内汽车总销量为2518.4万辆,同比增长6%,新能源汽车市场占有率超过40%。新能源汽车行业在快速发展的同时,市场也在加速变革,淘汰没有创新的企业[12]。消费者已不满足于新能源汽车能耗低、保养简单,更加注重于售价、续航里程、智能化水平等因素。
因此,了解新能源汽车的消费趋势及客户对功能的需求和偏好对行业和企业制定未来发展规划具有重大意义。本文就如何从海量用户在线评论中准确地挖掘出新能源汽车用户作出购买决策时的主要关注因素以及用户需求、偏好展开相关研究。
2. 相关研究现状述评
用户需求识别是自然语言处理和文本挖掘领域的热门研究课题。一些学者结合领域知识和统计模型,通过提取特征并训练分类器,实现对用户评论的需求识别。贾宇婷[13]等运用mESM移动经验取样法、归纳式的内容分析法,获取了3种移动服务平台的隐性需求和显性需求识别结果。沙勇忠[14]等依据DIKW模型对社会诉求大数据进行分析,实现公共服务需求精准管理。于志刚[15]等介绍了一种融合可拓学和在线评论挖掘的产品改进需求识别方法。王松[16]等构建了用户画像,通过聚类方法对画像标签数据分析实现了用户需求识别。石海林[17]等构建了以客户需求为导向的产业竞争情报客户需求及关键情报任务的识别模型。然而,用户在线评论存在特征高维稀疏的问题,会带来运算的复杂性,这类方法难以保证需求识别的准确性和有效性。
随着文本数据量的激增和内容的日益复杂化,定量分析方法因其较高的客观性与性能优势,正逐渐受到众多学者的青睐并被广泛应用于不同的研究领域。在用户需求识别的研究中,LDA主题模型及其各种衍化版本拥有“文档–主题–词”三层结构,可以更好地获取文本中潜在的语义信息[18]而被广泛用于旅游[19]、酒店[20] [21]等若干领域的研究中。例如,王克勤[22]等利用SnowNLP、Kano和LDA模型,在静态分析的基础上考虑了时间因素,探究了用户情感值变化和需求主题演化过程。刘鹏[23]等通过LDA主题模型挖掘重点用户需求,再以重点用户需求为导航创建三级技术功效矩阵,生成具象化产品创新机会。Wang,FF [24]等提出了一种基于BJ-LDA的多品牌竞争分析模型,将不同品牌产品独特的用户需求从一般主题中分离出来,完成对不同品牌特定需求主题的提取。此外,由于在线评论具有口语化、篇幅短小、语义特征稀疏等特征,传统的LDA主题模型在分析短文本时效果并不理想[25],因此一些学者开始使用自然语言模型来保留在线评论中的语义信息。赵敬华[26]等将精选评论转化为向量来提取产品的属性特征并计算属性的情感值和关注度,再利用RF-BERT模型实现需求识别。李贺[27]等将word2vec融入产品需求识别过程,提出了一种基于语义相似性的产品需求识别模型。Han,Yi [28]等在BERT模型中加入新的卷积网络和命名实体识别(NER)层从在线评论中提取产品属性并用BLEU算法从中识别用户需求。但上述方法并未对涉及多重产品属性的评论文本进行语义切分,往往会导致用户潜在需求被忽略。
通过文献梳理可知,利用在线评论进行数据挖掘以获得用户需求的研究已比较成熟,但仍存在一些不足。一是在研究内容上,少有学者利用新能源汽车用户圈的在线评论数据信息从逆向牵引角度分析用户对新能源汽车的需求、偏好以及消费者在购车时所关注的因素。二是在研究方法上,现有研究聚焦于利用主题模型或词袋模型表现文本特征,该类方法只考虑了词语间的频次关系,忽略了上下文词语之间的语义联系;多数用户评论对产品的多种属性进行了不同的评价,未经处理会降低需求识别的准确性,但现有研究较少对涉及产品多重属性的评论进行语义切分。
综上所述,本文提出了一种基于上下文语义相似性和切分策略的需求识别模型,以汽车门户网上的在线评论为基础,先对其进行语义切分并人工标注,利用预训练RoBERTa模型将所有评论转化为评论内容的向量表示,结合CNN-LSTM实现文本分类,获取在线评论文本的主题个数,再利用PLSA构建概率矩阵实现需求主题识别。利用网络分析方法构建需求主题共现图谱来分析需求主题之间的联系。最后分析用户的需求、偏好及消费者在购买新能源汽车时核心关注点,并针对特定问题为企业提供相应的建议,帮助他们更好地了解用户需求、改进产品设计、提升产品和服务质量。
3. 理论基础
3.1. 语义切分策略
在线评论中包含了用户对产品各个方面的体验,涉及产品的多重属性,未经语义切分会导致分类结果准确率低。传统的文本切分策略主要基于字符、字符列表、文件类型进行切分,未考虑数据内容的语义意义。因此本文将评论文本拆分为单句并转化为高维空间中的向量来保留文本数据深层次的语义信息,再根据他们在高维空间中的余弦距离来判断两段评论是否在讨论汽车的同一属性,将语义相似的文本划为同类。语义切分策略的过程如下:
① 以句号、感叹号、问号为标准将每条评论拆分成多个单句。
② 输入OpenAI ApiKey来调用OpenAI大语言模型中的embedding模块将所有单句转化为句向量表示。
③ 构建滑动窗口模块。滑动窗口原理如图1所示,以三个拆分的单句组成语义块进行窗口滑动并计算每个语义块之间的余弦距离,例如开头句子1与句子2组成语义块emed1,句子1、2、3组成语义块emed2,计算语义块之间的余弦距离,计算方法如公式(1)所示。
Figure 1. Schematic diagram of sliding window
图1. 滑动窗口原理图
(1)
其中A和B是句子向量;A⋅B是向量A和B的点积(内积);
是向量A和B的欧几里得范数(即向量的长度或大小)。
④ 根据语义块之间的余弦距离选择合适的余弦距离阈值百分比位数来确定在哪个位置将文本进行截断。
3.2. PLSA主题模型
Hofmann在1999年提出了PLSA (Probabilistic Latent Semantic Analysis)模型,是对文本隐含主题的一种建模方法,其核心思想是使用概率统计模型来模拟文本中词的生成过程。相较与其他主题模型,PLSA算法能更清晰地推断文档与词语间的关系模型,通过建立文档、主题与词语之间的映射关系,基于双模态和共现关系提取关键词,提升了关键词抽取的效率和准确度,适用于大样本[29]。针对于本文所用文本数据集专业词汇多、口语化严重的特点,PLSA方法降低评论文本维度的同时也保证了原本语义空间结构的效果,能更准确地提取文本关键词。
4. 用户需求模型的实证分析
4.1. 数据准备
4.1.1. 数据收集与预处理
本文使用Python爬虫软件收集汽车之家的新能源汽车用户评价数据,以“新能源汽车”为关键词进行检索,按照评论量从高到低排序,选择热度较高的车型,分别是比亚迪秦DM-i、比亚迪汉DM-i、长安深蓝SL03、特斯拉model 3、极氪001等车型,共采集5168条评论数据。
4.1.2. 语义切分
每条评论中包含了多个主题,如空间表现、续航等主题,未经切分会影响分类模型的效果。图2为采用Semantic切分策略处理后的样例语义切分效果图,纵轴为语义块之间的余弦距离,横轴为拆分的语义块个数,拐点表示相邻语义块的余弦距离。由图可以看出相邻语义块的余弦距离集中在0.04至0.14之间,相似度较高,无法确定合理的余弦相似度阈值。
为了获取最优的余弦距离阈值来提高文本切分效果,本文设计了一套最优阈值获取流程。首先参照赵敬华的研究结果,设定7个一级需求属性,分别是空间、外观、驾驶体验、续航、内饰、智能化配置、性价比服务。作者随机抽取20%原文本并依据一级需求属性讨论的话题进行人工切分,获取验证最优阈值的真实标签。
Figure 2. Semantic segmentation effect
图2. 语义切分效果图
Figure 3. Pk values under different similarity thresholds
图3. 不同相似度阈值下的Pk值
以标注的文本为语料库,根据余弦距离值集中区域,将最优阈值的范围设定为0.85至0.95,间隔0.01设定阈值进行实验,共进行11次实验。参照Jing Li等的Pk值切分效果评价体系进行效果评估。Pk值用于评估文本切分模型的性能,通过构建滑动窗口并比较窗口内预测分割点与真实分割点之间的差异来衡量模型的准确性,Pk值越低,说明模型的预测值与真实值越接近,切分效果越好。
不同阈值下的Pk值如图3所示,由图看出,阈值设定为0.87时Pk值最低,故设定0.87为余弦相似度最优阈值对所有文本进行切分处理。
4.1.3. 人工标注
将已切分的文本随机抽取20%进行人工标注,共抽取了5678条评论。例如某条评论在谈论新能源汽车的空间表现,则给他打上“空间表现”的标签,标注示例及数量如表1所示。
Table 1. Manual annotation examples
表1. 人工标注示例
评论文本 |
类别 |
标签 |
数量 |
这个车的空间还是比较合理的、就正常家用是没问题,如果过年过节多挤着坐的话,就还是比较小了。 |
空间表现 |
1 |
817 |
这款车的动力还是超出了我的预期,起步反应很快,提速表现也挺出色,超车是没有压力的。 |
驾驶感受 |
2 |
981 |
虽然官方标的续航有420公里,但电池容量还是有点小,速度稍微提高一点,电量掉得就比较厉害,实际续航和官方的有出入。 |
续航表现 |
3 |
862 |
外观的话设计的也是比较帅气的,车型设计的比较协调,平时的话也比较耐看。 |
外观表现 |
4 |
852 |
内饰风格比较简约没有太多花里胡哨的设计,中控大屏也能感觉到一些科技感,但是整体的话还是觉得塑料感挺强的,确实会拉低它的档次。 |
内饰表现 |
5 |
885 |
萝卜青菜各有所爱,跟同级比优势还是很大的,性价比挺高的。 |
性价比 |
6 |
690 |
配置的智能化功能丰富,车上有卫星导航系统,前后驻车雷达,360度全景影像,还有语音识别控制系统 |
智能化配置 |
7 |
681 |
4.2. 产品需求识别与分析
4.2.1. 文本分类模型训练及评估
Figure 4. Confusion matrix diagram
图4. 混淆矩阵图
实验方面,训练集与测试集的比例设置为8:2。经多次测试CNN-LSTM模型最终采用的主要参数词表大小6000个,词向量维度为768,句向量长度为100,隐藏层节点为90个,训练轮次10轮,学习率为0.001,BatchSize为128,Dropout值为0.2。
图4为归一化后混淆矩阵,纵坐标为评论文本实际所属类别,横坐标为分类模型预测评论文本所属类别,对角线的值为每类评论预测正确的概率值。从图可知,每类评论预测正确的概率值均大于0.9,第一类和第二类评论的预测结果较好,达到了百分之百,而第五类相较于其他几类预测值明显偏低,原因可能是第五类评论主要是在谈论内饰表现,而在谈论内饰的过程中无法避免讨论到仪表台上的智能车机系统以及汽车内部空间,分类模型将其误判为在讨论智能化配置或空间,导致分类效果不佳。但从整体上看,CNN-LSTM模型对7类评论文本的识别与分类准确性较高。
4.2.2. 分类结果展示
输出分类结果,如图5所示,横坐标为评论类别,纵坐标为评论数量。由图可见第二类关于驾驶感受的评论远超其他六类,数量接近8000条。
Figure 5. Classification results
图5. 分类结果
4.3. 主题特征词获取及用户需求分析
为了更直观地展示用户在购买新能源汽车产品时的关注因素,本研究采用潜在语义分析模型PLSA抽取每个类别的主题特征词,每个类别抽取八个以上潜在语义关联最强的词来描述该主题,并构建每类评论的词云图。新能源汽车评论文本的需求主题特征词及样本分布如表2所示,每个需求类别的词云图如图6所示。
第一类:空间表现。良好的空间配置会增加驾乘人员的舒适感。该类主题的主要特征为后备箱、后排、腿部、头部、轴距、坐姿等,消费者在社交平台上围绕后排空间、后备箱空间、后排坐姿等内容进行讨论,例如座椅舒服、宽敞,车内空间大、后备箱小,车内空间日常够用等评论。这些客户声音表达了对新能源汽车车内空间设计的认同。同时也有少部分用户表示后备箱偏小,在长距离出行时无法提供足够的空间来装载物品。
Table 2. Dimensions and demand distribution
表2. 各维度及需求分布
主题标签 |
主题词 |
评论占比 |
性价比 |
性价比、优惠、价格、配置、品牌、保险、贷款、服务费 |
13.37% |
外观表现 |
外观、设计、颜值、喜欢、线条、漂亮、风格、大气 |
15.03% |
内饰表现 |
座椅、设计、做工、配色、风格、氛围、质量、异味 |
14.44% |
空间表现 |
后备箱、后排、腿部、头部、轴距、坐姿、够用、行李箱 |
14.52% |
驾驶感受 |
动力、加速、提速、操控、平顺、底盘、噪音、震动 |
21.40% |
智能化配置 |
智能化、辅助、自动、影像、语音、雷达、安全、实用 |
8.41% |
续航表现 |
油耗、上下班、通勤、充电时间、空调、市区、高速、电耗 |
12.83% |
Figure 6. Word cloud map of keyword categories by demand
图6. 各需求类别关键词词云图
第二类:驾驶感受。该类主题的主要特征为动力、加速、提速、操控、平顺、底盘、噪音、震动等。用户在该类主题下表示新能源汽车相较于燃油汽车有加速快、能耗低、动力线性、发动机平顺等优点,并且结合评论内容发现多种动力模式的设计更受年轻用户群体的青睐,在满足日常通勤需要的同时偶尔也能打开运动模式体验驾驶乐趣。多数用户表达的态度是积极的,对新能源汽车的动力和操控表示肯定。也有少数用户发布如起步顿挫、底盘滤震性差,减震偏软、车速快了噪音大、刹车不好用等消极评论,该类评论揭示了用户因车辆机械结构问题导致的不良驾驶体验,且从字里行间发现消费者表达的情绪较为消极。
第三类:续航表现。低能耗、长续航是新能源汽车的卖点之一,也是影响消费者作出购买决策的因素之一[30]。结合评论内容来看,多数消费者购买新能源汽车的用途是城市代步和短距离高速行驶,每天行驶的里程较少,所以低能耗、长续航意味着用户可以减少充电或加油的次数,节省更多时间。该类主题的主要特征为油耗、上下班、通勤、充电时间、空调、市区等,从表达积极的评论来看,用户表示续航满足日常需求,市区表现好,通勤足够、油耗不错。从消极层面来看,用户的槽点集中在冬天的续航表现、开空调时的续航表现及高速行驶时的能耗表现,该类评论揭示新能源汽车在低温环境中续航里程会大幅下降、在行驶过程中开启空调也会使续航里程下降、在高速行驶过程中能耗会增加的问题。
第四类:外观表现。每个人的审美不同,评价一个外观设计的好坏也因人而异。该类主题的主要特征为外观、设计、颜值、喜欢、线条、漂亮等。用户在平台上发表例如造型科幻、外观大气、车身线条动感等内容,并且用户表达的态度大多是积极的,对所购车辆的外观设计表示认同。
第五类:内饰表现。内饰是用户在车辆使用过程中接触最多的地方,受到高度重视。该类主题的主要特征为座椅、设计、做工、配色、风格、氛围等,用户在社交平台围绕内饰设计等内容进行讨论,例如内饰前卫、大气、科技感强等评论。这些客户声音表达了对新能源汽车内饰设计的赞赏,已成为消费者购买产品时的加分项。一些用户表示某些车型内饰过于简洁、塑料感太强,无法给予舒适的感觉,也有用户认为内饰设计运动感不强,不符合车型定位。
第六类:性价比。产品的优惠和补贴、产品力是消费者购买新能源汽车时的关注点之一,其优惠力度、补贴程度和品牌效应影响着消费者的决策。性价比、优惠、价格、配置、品牌等是从该类主题中提取的主要特征,消费者在社交平台上谈论的是贷款流程和利率、各品牌车价优惠、落地价和赠品的对比、国产合资品牌的对比等,其中关于车价优惠的评论呈现积极态势,不少人认为现在新能源汽车优惠力度大,性价比高;而关于商家提供的赠品、贷款服务费等评论则呈现消极态势,例如不少用户认为商家赠送的保养、车膜、脚垫等质量不好,贷款服务费高。品牌方面围绕着国货、国产等内容进行叙述,例如国产性价比高、同价位比合资配置高等评论,表明了对新崛起的国产新能源汽车品牌的支持。
第七类:智能化配置。智能化配置指的是车机系统能为用户提供什么样的智能化功效,从而优化用户的驾驶体验,提升驾驶乐趣,这一点备受重视。该类主题的主要特征为智能化、影像、辅助、语音等。用户从多方面对智能化配置进行了阐述,如驾驶辅助、自动泊车、语音控制、主动刹车、全景影像、安全预警等。用户的评论大多为积极的,例如大量用户表示智能辅助驾驶系统对新手驾驶员十分友好、操作简单,这些评论揭示了用户对新能源汽车提供的各种智能化功能表示认可和支持。同时少部分用户表示在使用过程中发现车机系统反应慢、语音识别不准等槽点。
4.4. 需求共现分析
图7为新能源汽车的需求主题共现网络图,如图所示,聚类代表所识别的主题,主题类别以颜色进行区分,节点所对应的主题特征词大小由该词的PMI值决定。相较于其他主题,续航和外观这两个主题中的主题特征词数量多且PMI值高,说明新能源汽车的续航和外观是用户的基本需求,厂商应该重点关注自身产品在这个方面的表现,在拓展产品其他功能和特点之前要保证这个基本需求得到用户的认可。
另外,续航、外观、智能化配置、内饰和驾驶感受这5个主题所含主题特征词出现的位置较为集中,与自身主题内的特征词共同出现的频率较大,而空间和性价比这两个主题的主题特征词较为分散,如原因、品牌、优势、性能和压力等主题特征词在属于空间、性价比、续航这三种主题的评论语句中均有出现,说明用户在讨论汽车续航能力的同时也涉及了汽车的品牌,性价比和空间配置。这是一个重要的发现,说明这三个方面是多数用户在意的基本特征。厂商在线上线下宣传时要以这三个特征为基础进行重点宣传和制定营销策略,提高产品的知名度和价值属性。
同时,相较于其他主题,“优点”这一主题特征词与主题续航、空间、驾驶感受、性价比存在较强的相关性,说明了多数用户认为国产新能源汽车的优势在于它的续航、空间配置、性价比和驾驶感受上。“缺点”这一主题特征词与主题内饰和驾驶感受存在较强的相关性,且集中于轮胎、隔音、底盘、质量、塑料、异味等词上,说明多数用户的槽点聚焦于汽车的内饰材质和机械结构上。“科技”这一主题特征词与内饰、外观、智能化配置存在较强相关性,再结合评论内容来看,相较于传统燃油汽车,外观、内饰的科技感,车机功能的智能化程度能提高新能源汽车的价值属性,不少用户表示愿意为其买单。
Figure 7. Requirement topic co-occurrence network diagram
图7. 需求主题共现网络图
5. 结论与建议
本文通过对用户在线评论进行主题特征抽取并进行需求分析,获取了消费者在购买新能源汽车时的关注点以及用户在使用过程中的槽点,对新能源汽车生产厂商制定营销计划、了解用户需求、改进产品、提高服务水平具有指导作用。对策建议思维导图如图8所示。
本文通过对用户在线评论进行细粒度用户需求识别,获取了用户潜在需求和偏好以及使用过程中的缺陷反映,对车企制定营销计划、了解用户需求、改进产品、提高服务水平具有指导作用。
(1) 用户潜在需求及缺陷反映。车辆的外观、空间和内饰的设计是新能源汽车相较于传统燃油汽车的一大优势,对用户有强大的吸引力。新产品规划时要注重外观与车内空间设计相适应,保证外观造型设计的美感、科技感,更要兼顾车内空间设计的实用性,特别是腿部和头部的舒适度和自由度,车辆后排和后备箱空间要考虑到人员满载时的乘坐体验和装载大量物品的需要。
车机功能是一个车企的技术体现,其智能化程度是影响消费者购买决策的重要因素。厂商应根据用户车载数据和反映的缺陷不断进行系统优化和技术更新,解决车机系统反应慢、卡顿,语音识别不准等槽点,提升车机系统性能和稳定性。同时,内饰的材质也值得深入研究,避免出现内饰有异味、塑料感强等问题。
Figure 8. Mind map of countermeasures and suggestions
图8. 对策建议思维导图
在续航表现方面,多数用户表示日常通勤能耗低、续航里程够用,但在极端环境条件下如冬季、高速行驶、开启空调等,这时实际续航远小于理论续航,同时电耗加快、油耗变高,用户认为这是新能源汽车的一大痛点,需要尽快进行技术革新。
性价比与服务方面,用户认为现在新能源汽车的性价比高、优惠力度大很值得购买,但在实际购买的过程中会出现不同地区优惠有差异、金融服务费隐形增长、赠送的美容件或保养等以次充好、个别4s店销售员态度不佳、订车流程繁琐或等车时间长的现象。厂商在进行产品宣传的同时也应加强品牌建设以及对下属销售店的监管力度,建立优质的客户服务体验,完善客户关系管理;完善销售流程,将优惠落到实处。
(2) 用户偏好。在国内道路限制最高速度为120 km/h的政策下,新能源汽车相较于传统燃油汽车有提速快、动力线性、驾驶平顺的优点,受到用户的一致好评。同时驾驶风格不同的人群对底盘和操控的需求也不同,驾驶风格激进的人群表示需要更好的弯道支撑性、更强的制动力和更敏感的油门响应,而驾驶风格沉稳的人群则需要更好的滤震性和更线性的油门响应,这也是同一车型参数调校却有两种不同客户声音的原因。厂家应根据不同人群的使用偏好推出不同参数调校的车型,吸引更多潜在客户。
内饰的设计风格应根据不同人群的偏好推出多个版本供其在定车阶段进行选配,满足他们对内饰“豪华感”“运动感”和“科技感”的个性化需求。同时也要考虑到少部分人的偏好,在不影响安全的情况下设计更有“运动感”“科技感”的改装套件,例如前后保险杠、刹车卡钳、轮毂等,满足他们的改装需求。
(3) 企业层面。数据作为新型生产要素与核心资源要素,展现了强大的赋能作用,厂商应构建自己的在线评论数据库,及时收集用户在社交平台上发布的意见以获得实时的用户需求、槽点、偏好,有助于管理者解决车辆现存问题以及进行新产品规划时针对不同偏好制定差异化策略。制定营销和宣传策略时重点将续航表现、性价比、空间表现结合起来宣传,这三个特征是用户的首要关注点。
同时,本文也存在一些不足之处,一方面仅选择了汽车之家上的在线评论数据,未选择不同平台的数据进行研究分析不同平台用户需求的差异性。另一方面只选择了几个具有代表性的新能源汽车品牌的数据进行分析,未将更多新兴的品牌考虑其中。