1. 引言
中国互联网络信息中心发布的第52次《中国互联网络发展状况统计报告》中显示,截至2023年6月,我国网民规模达10.79亿人,互联网普及率达76.4%。随着网民的增加,越来越多的人选择利用电商平台购买农产品。2022年我国净菜产量从2014年的725.7万吨增长至2670.9万吨,需求量从2014年的647.3万吨增长至2447.4万吨。2022年1月,国家发改委在《关于做好近期促进消费工作的通知》中明确鼓励制售半成品和净菜上市。2023年1月2日,《中共中央国务院关于做好2023年全面推进乡村振兴重点工作的意见》明确指出要提升净菜和中央厨房等产业的标准化和规范化水平,培育发展预制菜产业。随着人们生活节奏的加快,人们对快捷、方便的饮食选择越来越依赖。半成品净菜正好满足了这一需求,让消费者能够更高效地进行烹饪,节省时间和精力。
在线评论是消费者购物体验的真实反馈,从中挖掘消费者满意度,对促进净菜电商的发展具有重要意义。在此背景下,挖掘净菜消费者在线评论数据,运用LDA主题模型识别出影响消费者在线购买净菜商品满意度的关键因素。
2. 文献综述
净菜又称鲜切蔬菜,是经洗涤、切割、混合和包装等步骤后,供消费者方便食用的生鲜农产品加工品 [1] 。净菜于50年代起源于美国,雏形为马铃薯由“去皮”到“切片的精加工” [2] ,60年代开始商业化发展,在80年代,日本、加拿大和一些欧洲国家兴起了净菜产业 [3] ,意大利与英国家庭购买净菜的比例分别达到了50%、70% [3] 。2009~2014年西欧国家净菜人均消费量相较于往年共增长19% [4] 。净菜与预制菜不同,预制菜由净菜发展而来,分为即食、即热、即烹、即配四种 [5] ,净菜属于即配预制菜的一种 [6] 。
较多学者对在线评论影响消费者满意度进行了研究。马凤才与李春月通过挖掘京东商城在线评论数据,探究消费者对水果、蔬菜、海鲜、肉类四类生鲜产品的满意度 [7] 。雷兵等通过挖掘淘宝和天猫平台水果品类在线评论探究消费者满意度 [8] 。刘宏宇等利用京东商城车厘子的在线评论数据研究消费者满意度 [9] 。李道和等通过京东商城茶叶的在线评论探究消费者满意度 [10] 。
LDA (Latent Dirichlet Allocation)模型由Blei等人于2003年提出,是一种基于Dirichlet分布的非监督机器学习算法 [11] ,该模型是从文本数据中推断隐藏的主题结构,揭示消费者对产品或服务的关注点。王二朋和包乾辉等人对电商平台农产品在线评论数据进行LDA主题分析,得到了影响消费者满意度的因素有产品的品质、包装等 [12] [13] 。费威等人通过爬取拼多多平台生鲜农产品在线评论数据,利用LDA主题模型对农产品销售数据分类分析的结果表明消费者对品牌溢价高商品的满意度较高 [14] 。王胜源等人利用LDA主题分析等方法,对京东顾客物流相关在线评论数据进行情感分析,研究结果表明生鲜电商物流在线评论正向影响顾客满意度 [15] 。
综上所述,虽然利用在线评论研究消费者满意度是当下研究的热点,但是针对净菜商品满意度的研究较少。因此,本文将从消费者满意度视角,通过数据挖掘技术和LDA主题模型对京东商城的净菜商品评论数据进行分析,探究消费者对净菜商品的满意度情况,并为净菜电商企业提供改进建议。
3. 理论基础
3.1. 在线评论反映消费者满意度
1965年Cardozo最早提出消费者满意度理论,该理论指出消费者在购买产品前会形成一定的期望水平。购买后会通过他们的实际经验来评价产品或服务的质量和性能。消费者的满意度是通过比较他们的期望与实际经验来形成的。如果实际经验与期望相符或超过期望,消费者就会感到满意,并且可能产生回购行为成为忠实顾客。反之,如果实际经验低于期望,消费者可能会感到失望和不满意,甚至发表负面评价,对品牌造成损害。
随着互联网技术的发展,线上购物已经成为了许多消费者的首选。然而,与传统实体店相比线上购物存在着一个明显的弊端,即消费者无法亲身接触或亲眼看到想要购买的实际产品,只能依赖于电商页面提供的文字描述和图片来进行判断。然而,一些线上商家为了吸引消费者,可能会提供夸大其词的产品描述,欺骗误导消费者,使消费者对于线上商家产生了一定程度的不信任感。在这种情况下,已购消费者的评论信息变得至关重要。它们代表了真实消费者的经历和观点,为潜在消费者提供了一个客观的参考标准。通过阅读已购消费者的评论,潜在消费者可以更全面地了解产品的优缺点,服务的质量,以及与商家的交易体验。积极的在线评论可以增强品牌声誉,提高潜在消费者的购买意愿。负面的在线评论可以为企业提供需要改进的问题以提高商品的质量和消费者满意度。
3.2. 生鲜电商消费者满意度影响因素
研究以往的文献发现,影响消费者满意度的因素众多,主要集中在商品质量、商品价格、物流和客服服务等。除此之外网购平台的体验同样至关重要,包括网站的功能和设计、快速的网页加载速度以及交易的安全性,这些都会对消费者满意度产生影响。但是对于不同的商品类别,其影响消费者满意度的因素也大不相同。针对生鲜农产品这一品类,其消费者满意度受多个因素影响。
首先,生鲜农产品具有易腐败的特点,但消费者普遍追求口感鲜美且质地良好的生鲜农产品,所以供应链和物流的高效性是提高消费者满意度的关键。其次,生鲜农产品的价格也是影响消费者满意度的关键因素,虽然生鲜农产品的价格通常受季节、地区和供需影响,但消费者仍会关注价格与产品价值的平衡。随着社会的发展,消费者越来越关心食品的安全性和来源,提供生鲜产品的可追溯性信息,如产地、种植、养殖方法等都可以增加消费者满意度。此外,良好的售后服务、退换货政策、品牌声誉等因素都对消费者满意度有影响。本文将基于京东商城净菜商品的在线评论,结合LDA主题模型,探究影响生鲜农产品中净菜商品消费者满意度的因素。
4. 研究设计
随着生鲜电商和冷链物流行业的迅速发展,中国的净菜产业开始进入快速发展阶段。生鲜电商平台为消费者提供了方便的购买途径,同时也推动了半成品净菜的供应链和物流体系的优化。这些平台通过确保产品的新鲜度和质量,满足了消费者对便捷、健康食品的需求。京东商城作为中国最大的综合电商平台之一,拥有数量可观的商品评论数据。且京东商城为一些商品提供了开放的页面,允许一定程度的数据爬取。本文选取了京东商城上的净菜商品作为研究对象,并通过挖掘消费者的评价数据来探究京东商城平台上净菜的用户体验和评价情况。
4.1. 数据的处理
4.1.1. 数据的收集和清洗
本文选择京东商城浦之灵、悦味纪、安维等销量靠前的净菜店铺作为研究对象,并对店铺中菠菜、荠菜、西兰花、口蘑等净菜商品使用Python编写网络爬虫获取商品评论数据,共爬取12536条评论。并对爬取的数据进行自动清洗,实现去重、去除数字、去除字母以及去除特殊值,如去除蔬菜、玉米、玉米粒、西兰花这种高频词,同时去除系统自动评论和重复评论。经过筛选后共获得了10235条有效评论数据,这些数据将用于后续的分析研究。(表1)
4.1.2. 中文分词处理
中文分词在中文文本处理中扮演着至关重要的角色,其质量直接关系到文本挖掘的效果。研究选择在Python环境下进行分词操作,借助import命令调用jieba模块。为了更直观的得出结论,将评论文本中意思相近的词汇进行合并。比如“快递小哥”“京东小哥”等合并成“快递员”。同时,采用哈工大停用词库对词语进行过滤,得到最终的分词结果。
4.2. 研究方法
LDA模型是一种文档主题生成模型,也称为三层贝叶斯概率模型,包含词、主题和文档三层结构。其原理如图1所示。LDA把每篇文档都看作是由多个主题组成,每个主题又由多个词组成。其目标是通过观察文档集合,推断出每个文档中的主题分布以及每个主题中词的分布,从而了解文档集合中主题的分布情况以及每个主题所代表的意义。本文利用LDA模型对消费者的在线评论进行主题分析,通过评论内容,揭示消费者对农产品线上购买的态度、需求和意见,从而探究消费者满意度。
图1中,M代表文档数目,N代表主题数目,φk表示主题k中所有单词的概率分布,θd表示第d篇文档的所有主题概率分布。θd和φk分别服从超参数α和β的Dirichlet先验分布 [16] 。α为产生文档主题概率的模型参数,θ为文档主题的概率分布,z为文档主题词汇的多项分布,ω为主题词汇的多项分布。
LDA生成主题词的步骤如下 [17] 。
1) 根据Dirichlet分布参数α得到文档d的主题分布参数θ;
2) 根据文档中主题的多项式分布随机获取文中某个词的主题Zm,n,即文档m内的第n个词汇的主题;
3) 根据步骤二和Dirichlet分布参数β得到主题Zm,n中的对应词分布参数φ;
4) 根据多项式分布参数φ对文档进行随机抽取,生成词ω;
5) 重复多次上述步骤,生成最后的文本主题。
5. 实证分析
5.1. 文本分析
5.1.1. 词频分析
对已经进行分词处理的数据进行词频统计,然后按照词语出现的频率从高到低进行排序。选取出现频率最高的前20个高频词进行分析(表2)。其中“方便”“不错”“好吃”“喜欢”等代表消费者主观感受的词汇出现频率较高。“新鲜”“味道”“质量”“口感”等象征净菜质量的词汇也频频出现。物流相关的高频词包括“包装”“物流”“很快”“冷冻”等。

Table 2. Top 20 high-frequency words
表2. 前20高频词
5.1.2. 情感分析
用ROST CM6对已经进行分词处理的数据进行情感分类分析,共得到积极情绪文本6380条,消极情绪文本3147条,其余为中性情绪文本和未识别文本。积极情绪文本中高度积极文本、中度积极文本和一般积极文本分别为2393条、1985条和2002条。消极情绪文本中积极、中度和一般消极文本分别为122条、372条和1073条。总的来说,消费者虽然对净菜商品表现出的积极情绪占比比消极情绪更高,但同时也存在消极情绪。
选取消极情绪文本中出现频率排名前50的词汇生成词云图进行展示(图2)。通过分析词云图发现,“一般”“不好吃”“难吃”“不新鲜”等词汇出现频率较高,说明部分消费者对净菜质量表示不满。关于物流服务的词语也频频出现,如“融化”“破损”等,说明物流的冷链设施和包装不够完善。

Figure 2. Negative emotional word cloud map
图2. 消极情绪词云图
5.2. LDA模型分析
5.2.1. 选择主题数量
本文通过人工测试的方式选择最佳主题数量,主题分布结果如图3所示 [18] [19] ,该图中的每个圆圈代表不同主题,圆圈大小表示主题出现的频率。从图中可以看出一些圆圈相距较远,这表明这些主题是相互独立的。最后,通过对主题模型的分析,确定了LDA模型中主题个数为4个。

Figure 3. LDA model visualization results (K = 4)
图3. LDA模型可视化结果(K = 4)
5.2.2. LDA模型结果与讨论
LDA模型在抽取文档中的主题及其对应的关键词方面具有高效的能力。但由于LDA是一种基于机器学习的方法,在建模后,会出现一些主题中提取的关键词没有实际含义的情况,这些词语对后续的文章研究价值较小,会对研究结果造成干扰。此外,针对电商消费者评论文本的相似度高和部分主题关键词划分不明确的问题,需要进行进一步的数据处理。为了解决以上问题,对每个主题的主题词进行分析,过滤掉那些没有准确含义的词语,最终生成4个主题。提取每个主题中10个具有具体内容分类的关键词,如表3所示。这样的处理有助于提高主题识别的准确性和可解释性。模型结果显示,商品质量、物流服务、商品价格、购物体验是消费者线上购买净菜时关注的主题。

Table 3. LDA model topic analysis results
表3. LDA模型主题分析结果
通过分析发现:商品质量主题下“好吃”“喜欢”“味道”等主观感受的词汇出现率较高,说明净菜给消费者的主观感受对消费者满意度有显著影响。“质量”“包装”“营养”等词汇说明消费者对净菜的质量有着更高的需求,比如包装完好、口感好、营养丰富等。
在物流服务方面,常出现的词汇为“速度”“冷冻”“时间”,说明消费者对于净菜商品的物流的速度和运输方式比较重视。净菜具有易腐、易变质的特点,高效的物流服务可以在缩短产品的流通时间的同时保持其新鲜度和品质。同时,冷链运输也是保持产品新鲜度和品质的重要环节。冷链物流可以控制产品的温度、湿度和环境条件,有效延长产品的保鲜期。快速、安全、可靠的物流服务可以满足消费者对于净菜品质的追求,进而提升消费者的满意度。
在商品价格方面,“实惠”“性价比”等词汇经常出现,可见消费者更偏爱购买性价比较高的商品。消费者在购买净菜时,通常会比较不同品牌、渠道和产品价格并且倾向于选择质量优良且价格合理、性价比高的商品。“活动”这一词汇的出现表明折扣、促销和优惠券等策略能够吸引消费者的注意,并提供一定的经济激励,从而提高消费者满意度。
在购物体验方面,“赞”“满意”“好评”等词汇出现频繁,表明消费者对整个购物过程的综合服务比较满意。消费者在购买净菜商品时,客户服务有着高度期望。友好、及时的专业服务可以提供准确的产品信息、解答疑问,从而辅助消费者做出明智的购买决策。此外,及时的售后服务,如退换货政策、问题解决和投诉处理,能够增加消费者对净菜的满意度。
现有学者利用LDA主题模型方法探究影响生鲜农产品消费者满意度因素所得到的结果各不相同。王二朋对京东商城苹果在线评论数据进行研究,得到价格、产品质量、购买体验、物流服务是影响消费者满意度的关键因素 [12] 。包乾辉等人对京东商城鸡蛋的在线评论进行研究,研究表明鸡蛋的品质和包装是影响消费者满意度的重要因素 [13] 。杨铮对京东商城特产馆的地标农产品消费者进行研究,结果表明产品品质、发货及运输速度对消费者满意度有显著影响 [20] 。王珠美等人对天猫商城西湖龙井在线评论进行研究,结果表明性价比、品牌等因素是影响消费者满意度的关键 [21] 。综上所述,前人研究影响消费者满意度因素的结果主要集中在价格、质量、物流等方面。本文对京东商城净菜商品在线评论进行主题分析,得到的结果与前人具有一致性。
6. 结论与建议
本文从消费者的角度出发,对电商平台净菜的在线评价进行主题分析,揭示了影响消费者对净菜满意度的因素。从结果可以看出,影响消费者满意度的因素主要集中在商品质量、物流服务、商品价格和购物体验这四个方面。
基于以上结论,提出如下建议。
1) 提升净菜质量,完善质量控制体系。首先,应该加强净菜产品溯源监管,从原料种植开始就要严格控制质量标准,确保原料的安全和质量。其次,在净菜加工过程中,要严格遵守相关规范,确保加工环节的卫生和质量。最后,可以采用气调、冷藏等保鲜技术,降低净菜产品受污染的风险,保持产品的新鲜度和质量。通过以上措施,可以提高净菜产品的质量,保证产品信息的完整性,从而为消费者提供更加安全、健康的净菜产品。
2) 强化物流服务,完善冷链物流质量。为了提升净菜的市场竞争力,净菜电商企业需着重建设一套全程监控的冷链物流系统,并提升物流配送的时间效率。首先,全程监控的冷链物流系统可以通过物联网技术和传感器设备对物流环节进行实时监测。其次,为了提高物流配送的时间效率,净菜电商企业可以合理规划物流网络和配送路线,通过数据分析和优化算法确定最优的配送方案,减少运输时间和成本。
3) 降低生产成本,加大促销力度。净菜加工企业可以通过优化生产流程、引入自动化设备、提高劳动生产率,从而减少劳动力成本。采用节能设备、合理利用资源,减少能源和水的消耗,从而降低生产成本。电商企业一方面可以通过市场营销手段,如促销活动、推广优惠等,增加消费者对净菜产品的认可和满意度。另一方面,可以通过宣传净菜产品的优势和附加值,从而降低消费者对于净菜价格偏高的认知,使其更加愿意接受净菜产品的价格。
4) 加强有效互动,增进沟通效率。电商企业应通过高质量的商品图片和详细的文字描述,使消费者能够更好地了解产品的外观、特点和品质。这些展示和介绍旨在让消费者感到仿佛亲临实体商店一样,以便提升消费者的满意度。此外,净菜电商企业应提供即时在线沟通客服,对于消费者可能有关于产品质量、配送时间、退换货等方面的疑问或需求,客服需要及时回答和解决这些问题,从而增强消费者的满意度。