基于Aspect-Based LSTM的贵州刺梨电商评论细粒度情感分析
Fine-Grained Sentiment Analysis of Guizhou Rosa roxburghii E-Commerce Reviews Based on Aspect-Based LSTM
摘要: 为精准挖掘用户对特色农产品的需求偏好,助力电商经济高质量发展,本文基于Aspect-Based LSTM模型,对京东6045条贵州刺梨相关评论展开细粒度情感分析。经数据清洗与标注,构建6505条“评论、方面及情感”三元样本,实验表明模型准确率达97%,宏平均F1值为0.92,加权平均F1值为0.97,核心维度识别准确率超95%,数据可靠性高。本研究通过对模型数据的深度挖掘,提炼出用户对产品品质、使用体验与健康价值的核心需求。研究发现,物流防护不足、产品标准化缺失与价值传递效率低下是制约其发展的三个关键因素。据此本文从产品、渠道、营销端三方面系统性地提出电商运营优化建议,为贵州刺梨及同类特色农产品的电商推广提供数据支撑,以赋能产业发展,助推乡村振兴。
Abstract: To accurately identify user preferences for specialty agricultural products and promote high-quality development of the e-commerce economy, this paper, using an Aspect-Based LSTM model, conducted a fine-grained sentiment analysis of 6045 reviews related to Guizhou Rosa roxburghii on JD.com. After data cleaning and labeling, 6505 triplet samples of “review, aspect, and sentiment” were constructed. Experiments show that the accuracy of the model is 97%, the macro average F1 value is 0.92, the weighted average F1 value is 0.97, the core dimension recognition accuracy is more than 95%, demonstrating high data reliability. Through in-depth mining of the model data, this paper identified core user needs for product quality, user experience, and health benefits. The paper found that inadequate logistics protection, lack of product standardization, and inefficient value delivery were three key factors hindering its development. Therefore, this paper systematically proposes e-commerce operational optimization recommendations from the product, channel, and marketing perspectives. This provides data support for the e-commerce promotion of Guizhou Rosa roxburghii and similar specialty agricultural products, empowering industrial development and promoting rural revitalization.
文章引用:许祖娟, 夏雨欣, 王兴隆, 张汉林. 基于Aspect-Based LSTM的贵州刺梨电商评论细粒度情感分析[J]. 电子商务评论, 2025, 14(11): 2341-2353. https://doi.org/10.12677/ecl.2025.14113696

1. 引言

在乡村振兴战略与数字经济深度融合的背景下,农产品电商已成为打通“产地到餐桌”链路的核心渠道。据《2025年中国农产品电商发展报告》显示,2024年我国农产品电商网络零售额突破预期目标,达6797.8亿元。但这类产品在电商推广中普遍面临“用户需求挖掘不深、运营策略针对性弱”的困境——多数商家仅依赖销量数据制定策略,忽视用户评论中隐藏的细粒度诉求,导致产品迭代、服务优化与用户实际体验脱节。

贵州刺梨作为国家地理标志产品,凭借远超普通水果的维生素C含量,成为“健康消费”趋势下的潜力品类,兼具经济价值与健康属性[1]。这一硬核营养数值已转化为市场核心竞争力,推动刺梨原汁等产品实现溢价销售,支撑起年超百亿元的产业链规模,更带动刺力王企业年销售额突破2亿元、东方甄选相关产品销量同比增长159.65%。然而目前电商推广中对用户反馈的细粒度、针对性分析仍显不足——现有研究虽涉及电商评论情感分析[2] [3],但针对贵州刺梨这类区域特色农产品,既缺乏对“口感”“物流”等具体产品维度的细粒度情感挖掘,也鲜有将评论情感与电商运营策略系统结合的实践探索,导致商家难以精准捕捉用户核心诉求。

电商评论作为用户消费体验的直接载体,其价值不仅在于“情感倾向”,更在于“情感与具体产品维度的关联”。传统情感分析因“粒度粗、针对性弱”,无法满足电商“精准改进”需求[4];而Aspect-Based情感分析(Aspect-Based Sentiment Analysis, ABSA) [5]可弥补这一缺陷——它能从评论中提取“特定方面与情感”之间的对应关系,将模糊反馈转化为可落地的运营依据。从技术演进看,ABSA的精准性源于“从基于词典到深度学习”的路线升级:早期Hu等提出通过数据挖掘自动提取产品特征,为基于方面的意见挖掘奠定了坚实基础,但其基于词典和规则的方法在应对复杂语言现象时泛化能力仍显不足[6];随着深度学习发展,Tang等提出基于深度记忆网络和注意力机制的ABSA模型,在SemEval标准数据集上准确率达80.95%,提升细粒度分析能力[7]。现有ABSA研究多集中于餐厅[8]、旅游服务[9]等领域,针对农产品的研究较少,且缺乏对“健康属性”“地域特色”等农产品特有维度的关注。因此,开展贵州刺梨电商评论的ABSA研究,既是对特色农产品电商分析方法的补充,也能为实际运营提供精准数据支撑。

基于此,本文以京东平台贵州刺梨相关产品的电商评论为研究对象,重点围绕以下三个层面展开研究:其一,结合刺梨产品特性,构建涵盖“口感”“质量”“效果”等维度的ABSA分析框架,以填补贵州刺梨农产品在细粒度情感分析领域的空白;其二,验证LSTM模型在小样本、短文本农产品评论数据中的适用性与有效性,为同类农产品情感分析提供技术借鉴;其三,将ABSA分析结果与电商运营实践相结合,构建“用户反馈、数据解析到策略优化”的闭环机制,赋能电商决策与产品优化。

2. Aspect-Based LSTM模型

Aspect-Based LSTM是一种结合细粒度情感分析与长短期记忆网络的深度学习模型。该模型通过双输入架构,能够同时处理文本内容与特定方面信息,从而精准实现方面与情感之间的对齐,有效克服了传统情感分析方法在处理复杂多方面评论时存在的局限性。如图1所示,该模型的整体架构主要由以下几个部分组成。

Figure 1. Aspect-Based LSTM overall framework

1. Aspect-Based LSTM整体框架

(1) 输入层:采用双输入结构,分别接收文本序列和方面类别信息,其中文本输入为预处理后的分词序列转换而成的固定长度数字编码序列(参数设定为100),方面输入则为方面类别(涵盖口感、包装、效果等7个预定义类别及“其他”类)转换而成的One-Hot编码向量(维度为8,对应8个方面类别)。

(2) 词嵌入层:词嵌入层将文本输入的数字编码映射为低维稠密的词向量表,具体表示为:

e t =Embedding( x t ) (1)

其中, e t 是第 t 个词的嵌入向量,Embedding表示嵌入矩阵。

(3) BiLSTM层:双向LSTM层以词嵌入层输出的词向量矩阵为输入,通过正向LSTM和反向LSTM同时处理序列信息,提取文本的上下文语义特征:

h t =BiLSTM( e t , h t1 ) (2)

其中, h t 是双向LSTM在时刻 t 的隐藏状态。

(4) 特征融合层:特征融合层将双向LSTM层输出的文本语义特征与方面输入的8维One-Hot向量进行拼接,实现文本语义与方面信息的显式关联:

f=Concat( h n ,a ) (3)

其中, h n 是双向LSTM的最终隐藏状态, a 是方面的One-Hot向量, f 是融合后的特征向量。

(5) 全连接层:全连接层以融合后的特征为输入,首先通过ReLU激活函数进行非线性特征转换,随后通过dropout进一步降低过拟合风险,最终为情感分类提供经过提炼的特征表示。

(6) 输出层:输出层以全连接层处理后的特征为输入,通过3个神经元的Softmax激活函数输出情感类别概率分布,对应负面(0)、中性(1)、正面(2)三类情感的预测概率,完成特定方面的情感分类任务。

为使模型在训练过程中不断优化预测精度,采用交叉熵损失函数计算预测值与真实标签的差异:

L= i k y i,k true log( y i,k pred ) (4)

其中, y i,k true 是第 i 个样本第 k 类的真实标签, y i,k pred 是模型预测的概率。

通过这种架构设计,模型能够同时考虑文本的上下文语义和特定的方面信息,从而实现对贵州刺梨电商评论的细粒度情感分析,为后续的运营策略优化提供精准的数据支持。

2.1. Aspect-Based情感分析原理

在电商评论场景中,用户评价往往包含对产品多维度的混合反馈,例如一条贵州刺梨产品评论可能同时提到“口感酸甜清爽”却“物流配送延迟”。传统整体情感分析仅能将此类评论归为模糊的“中性”,无法区分不同评价维度的情感差异,而ABSA作为细粒度情感分析的关键技术,能够有效解决这一问题——其核心任务是针对文本中特定方面(Aspect)精准识别对应的情感倾向,实现“评价对象与情感态度的绑定分析”。

ABSA的技术体系根据情感要素的提取复杂度可分为两类。第一类为基本任务,侧重于单一要素的识别,主要包括方面词提取(例如从评论中识别“口感”“物流”等评价对象)、观点词提取(例如提取“酸甜”“延迟”等情感表达词)以及方面情感分类(判断针对特定方面的情感极性)。第二类为组合任务,通过多要素间的关联建模提升分析深度,主要包括方面与观点对抽取、情感三元组抽取(即方面词、观点词及情感极性的联合抽取)以及四元组抽取(在情感三元组的基础上引入预定义类别),由此构建从要素提取到关联映射的完整分析链路。

具体来说,设句子由 n 个词组成 S={ w 1 , w 2 ,, w n } ,方面集合 A={ a 1 , a 2 ,, a k } 包含 k 个预定义类别(如“口感”“包装”等),ABSA的目标是构建函数使得对于任意 aA f( S,a ) 能输出句子 S 中针对方面 a 的情感极性。如公式所示:

f:S×A{ positive,negative,neutral } (5)

这种方面词、观点词及情感极性的联合的三元映射关系,正是ABSA实现细粒度分析的核心逻辑——它要求模型不仅理解文本语义,更要能定位语义与特定方面的关联(如“慢”在“物流”方面为负面,在“服务”方面可能无关)。

对贵州刺梨这类特色农产品而言,ABSA的应用价值尤为突出,如企业可通过细粒度分析定位“口感好评集中”“物流差评突出”等具体问题,为产品优化和服务升级提供明确方向。相较于传统情感分析模糊化的结论,ABSA通过拆解评论中的多维度情感,为刺梨产业从“流量爆款”到“口碑沉淀”的转型提供了数据支撑,因此,ABSA在电商评论分析领域具有有效的应用价值。

2.2. LSTM模型原理

长短期记忆网络(Long Short-Term Memory, LSTM)是一种改进的循环神经网络[10],通过设计特殊的门控机制解决了传统RNN在处理长序列时的梯度消失或爆炸问题,能够有效捕捉序列数据中的长期依赖关系。其核心是“细胞状态”(cell state),允许信息在序列中线性传递并通过门控单元选择性地保留或丢弃信息。LSTM的门控机制主要包括遗忘门、输入门和输出门,三者协同控制信息的流动与更新,具体如下:

(1) 遗忘门(Forget Gate):用于筛选细胞状态中应舍弃的历史信息,它依据当前时刻输入 x t 和上一时刻隐藏状态 h t1 生成遗忘权重 f t ,其计算公式如公式(6)所示:

f t =σ( W f [ h t1 , x t ]+ b f ) (6)

其中, f t 为遗忘门的输出(维度与细胞状态一致); σ 表示sigmoid激活函数,用于将输出压缩至0到1之间(1表示完全保留信息,0表示完全丢弃); W f 为遗忘门的权重矩阵; [ h t1 , x t ] 表示将前一时刻的隐藏状态 h t1 与当前时刻的输入 x t 进行拼接; b f 为遗忘门的偏置项。

遗忘门的核心作用是“筛选历史信息”:例如在刺梨评论分析中,当处理到“物流慢但口感好”时,模型需要在分析“口感”时适当遗忘“物流”相关的历史信息,避免干扰当前方面的情感判断。

(2) 输入门(Input Gate):决定哪些新信息被存储到细胞状态中,该过程包含两个子步骤,计算公式如(7) (8)所示:

i t =σ( W i [ h t1 , x t ]+ b i ) (7)

C ˜ t =tanh( W C [ h t1 , x t ]+ b C ) (8)

其中,公式(7)中 i t 为输入门的激活值,用于控制新信息的更新强度; W i 为输入门的权重矩阵, b i 为输入门的偏置项。公式(8)中 C ˜ t 为候选细胞状态,由tanh激活函数生成,代表当前输入的新信息; W C 为候选细胞状态的权重矩阵, b C 为其偏置项。

基于遗忘门和输入门的输出,细胞状态通过如下方式完成更新,公式如(9):

C t = f t C t1 + i t C ˜ t (9)

其中, C t t 时刻的细胞状态, C t1 t1 时刻的细胞状态, 表示向量的元素级乘法。该过程通过舍弃旧细胞状态中无关的部分 f t C t1 与融入新候选状态中有效的部分 i t C ˜ t ,实现细胞状态的动态迭代,例如在刺梨评论中,细胞状态会保留“口感”相关的关键信息,同时丢弃无关的其他信息。

(3) 输出门(Output Gate):决定当前时刻的隐藏状态 h t 输出哪些信息,计算公式如下:

o t =σ( W o [ h t1 , x t ]+ b o ) (10)

h t = o t tanh( C t ) (11)

其中,公式(10)中 o t 为输出门的激活值,用于控制细胞状态的输出比例; W o 为输出门的权重矩阵, b o 为输出门的偏置项。公式(11)中 h t 为当前时刻的隐藏状态,由输出门激活值 o t 与经过tanh归一化的细胞状态进行元素级乘法得到。

输出门的核心作用是“筛选输出信息”:例如在分析“口感”方面时,输出门会重点输出细胞状态中与“味道、酸甜”等相关的信息,形成当前时刻的隐藏状态 h t ,为后续的情感分类提供特征支持。

通过上述三门控机制的协同作用,LSTM能够有选择地保留长序列中的关键信息(如评论中与特定方面相关的情感表达),同时过滤噪声信息,为Aspect-Based情感分析提供了捕捉上下文语义与方面关联的能力。在本文模型中,采用双向LSTM (BiLSTM)进一步增强特征提取能力,通过正向和反向两个方向的LSTM层拼接,更全面地捕捉文本前后文的语义依赖,提升特征提取的完整性。

3. 实验结果与分析

3.1. 数据爬虫与预处理

实验数据来源于京东平台,通过Python爬虫技术(基于requests库发送HTTP请求、BeautifulSoup库解析HTML页面)定向爬取贵州刺梨相关商品的用户评论,共获取6045条原始数据,字段涵盖“用户昵称”“评论时间”“评论内容”“购买次数”“商品规格”等,其中“评论内容”为模型分析的核心字段。爬取过程中严格遵循平台robots协议,仅获取公开可访问的用户生成内容,确保数据合法性与真实性。

为保障数据质量及模型适用性,本次实验数据预处理分为三步,具体如下:

(1) 数据清洗:去除重复评论(如“好评”“不错”等无实质语义内容)、广告引流类评论(如“店铺其他商品推荐,点击查看”)及长度不足5字的无效评论(如“还行”“一般”),筛选出具备分析价值的有效评论。

(2) 分词与停用词过滤:使用Jieba分词对评论进行分词(如“物流太慢了”分为“物流”“太慢”“了”),加载中文停用词表(如“的”“了”“在”)过滤无意义词汇,保留能反映评论核心语义的词汇,为后续标注环节减少干扰。

(3) “方面”标注与“情感”标注:

方面标注基于提取的20个高频话题词(如图2所示)展开,共定义8个核心分析方面(具体维度定义及评论示例见表1)。由图2可知,“口感”(1142次)、“味道”(1208次)等词高频聚焦刺梨的味觉体验,因此定义“口感”方面;“包装”以1157次的高频出现,反映用户对产品包装完整性、实用性的关注,故定义“包装”方面;“物流”(876次)及“发货”“速度”等关联词汇的高频讨论,体现用户对运输时效的重视,因此定义“物流”方面;类似地,“质量”(821次)“品质”等词集中围绕产品安全与品质展开,“价格”(574次)“性价比”高频关联消费决策中的价格考量,“效果”(315次)聚焦产品功效讨论,依据这些分别定义“质量”“价格”“效果”方面。此外,补充电商场景必备的“服务”方面(覆盖客服响应、售后体验等);以“其他”涵盖“刺梨”“原浆”等泛化指代或难以归为前7类的话题词,同时允许单条评论对应多个方面(如“包装精美且口感酸甜”会同时关联“包装”与“口感”两个方面)。

情感标注采用规则驱动的自动化流程,依据评论语义将情感极性划分为正面(2)、中性(1)、负面(0)三类,标注规则以“情感词匹配结合语境判断”为核心(具体规则、评论示例见表2),通过“规则明确化到多维度量化验证”确保标注质量。具体而言,情感词库基础为代码中预设的两类核心词库:正面情感词库包含“好”“很好”“不错”“推荐”等18个核心词,覆盖8个方面的正面表达;负面情感词库包含“差”“很差”“不行”“失望”等18个核心词,聚焦电商评论中的负面场景。极性判定规则为统计每条评论中正面情感词与负面情感词的出现次数:若正面词数量 > 负面词数量,标注为“正面”(对应标签2);负面词数量 > 正面词数量,标注为“负面”(对应标签0);两者数量相等或无情感词,标注为“中性”(对应标签1)。为进一步保障标注质量,后续通过人工随机抽取部分样本进行检查,对标注错误的内容(如方面错配、情感误判等)进行补充修正,有效减少了自动化标注可能存在的偏差,进一步提高了数据集的可靠性。最终,通过“按方面展开”预处理生成6505条“评论,方面及情感”三元样本,样本的方面分布与各方面情感分布详情见图3,其中多数方面下正面情感样本占比显著,负面评价较少,符合电商平台用户评论“正面居多”的实际特征。

Figure 2. Occurrence frequency of high-frequency topic words for Guizhou Rosa roxburghii

2. 贵州刺梨高频话题词出现次数

Figure 3. Aspect-based sentiment distribution

3.各方面情感分布

Table 1. Aspect dimensions definitions and sample reviews

1. 方面维度定义与评论示例

方面

维度定义

评论示例

价格

对产品定价、性价比、优惠力度的评价

“有点贵,但值得”

口感

对刺梨产品味道、酸度、饮用体验的评价

“酸甜适中,很好喝”

效果

对产品健康功效(如补充维C)的评价

“补充维C,效果明显”

包装

对产品包装设计、便携性、密封性的评价

“独立包装,方便携带”

物流

对快递配送速度、包裹完整性的评价

“物流太慢,等了一周”

质量

对产品新鲜度、纯度、无杂质的评价

“没有杂质,质量很好”

服务

对客服响应、售后服务的评价

“客服很耐心,问题解决及时”

其他

无法归为上述类别的评价(如尝试体验)

“第一次买,尝试一下”

Table 2. Sentiment labeling rules and illustrative reviews

2. 情感标注规则与评论示例

情感极性

标注规则

评论示例

正面(2)

对刺梨产品健康功效或整体体验的积极评价

“补充维C,效果明显”

负面(0)

对产品味道、酸度、饮用体验的消极评价

“太酸了,真喝不下去”

中性(1)

对产品定价、性价比的中性陈述

“价格中等,比较常规”

3.2. 实验参数与评价指标

为确保模型性能的稳定,实验参数设置如下:

(1) 数据集划分:从6505条三元样本中按9:1比例随机拆分,最终训练集5855条、测试集650条,拆分过程通过random_state固定随机种子,避免数据分布偏差;

(2) 训练参数:epoch = 10,优化器为Adam (学习率0.001),损失函数为稀疏分类交叉熵(适配整数型情感标签);

(3) 硬件环境:CPU为IntelCorei7-10700K,内存32GB,无GPU加速(LSTM模型在该环境下可正常训练)。

本文采用三类指标评估模型性能,兼顾整体与类别性能,全面衡量模型在Aspect-Based情感分析任务中的表现:

(1) 准确率(Accuracy):反映模型整体分类正确性,计算公式为正确预测样本数与总样本数的比值,即:

Accuracy= TP+TN+T P +T N +T P +T N N (12)

其中, TP TN 分别为正面类别的真阳性、真阴性样本数, T P T N 为中性类别的真阳性、真阴性样本数, T P T N 为负面类别的真阳性、真阴性样本数, N 为测试集总样本数。

(2) 精确率(Precision):用于衡量“预测为某类别”的样本中,实际属于该类别的比例,反映模型对该类别的预测精准度。对于第 k 类(如“负面情感类”),其计算公式如(13)所示:

Precision k = T P k T P k +F P k (13)

其中, T P k 为第 k 类被正确预测为第 k 类的样本数(真阳性); F P k 为其他类被错误预测为第 k 类的样本数(假阳性)。

(3) 召回率(Recall):用于衡量“实际属于某类别”的样本中,被模型正确预测为该类别的比例,反映模型对该类别的覆盖完整性。对于第 k 类,其计算公式如(14)所示:

Recall k = T P k T P k +F N k (14)

其中, F N k 为第 k 类被错误预测为其他类的样本数(假阴性)。

(4) F1值(F1-Score):是精确率与召回率的调和平均数,能综合两者表现,避免单一指标偏差对性能判断的影响。对于第 k 类,其计算公式如(15)所示:

F 1 k =2× Precision k × Recall k Precision k + Recall k (15)

当精确率与召回率存在冲突时,F1值可更全面反映该类别的分类效果。

3.3. 实验结果与分析

本文所构建的Aspect-Based LSTM模型在贵州刺梨电商评论细粒度情感分析任务中表现稳定,以下从整体性能、情感类别精度、方面维度适配性三个核心维度,结合实验数据展开分析。

模型整体性能指标如表3所示,核心指标均处于较高水平,证明模型对刺梨评论ABSA任务的适配性。

Table 3. Overall model performance

3. 模型的整体性能

评价指标

数值

说明

准确率

0.97

整体预测正确的样本占比

宏平均F1值

0.92

三类情感F1值的算术平均,平衡类别不平衡影响

加权平均F1值

0.97

按样本量加权的F1平均值,反映模型对多数类的识别能力

从指标可知,模型不仅整体预测精度高,且在正面样本占比近80%的类别不平衡场景下,既通过宏平均F1值(0.92)保证对少数类(负面、中性)的基本识别能力,又通过加权平均F1值(0.97)贴合实际业务中“多数类优先”的分析需求,为刺梨评论的细粒度情感挖掘提供可靠基础。为进一步验证模型对不同情感极性的识别能力,表4展示了测试集中正面、中性、负面三类情感的分类性能指标,结合样本分布特点展开分析。

Table 4. Performance metrics for each sentiment class

4. 各情感类别的分类性能指标

情感类别

精确率(Precision)

召回率(Recall)

F1值(F1-Score)

正面

0.98

0.98

0.98

中性

0.90

0.90

0.90

负面

0.94

0.80

0.86

分析得到对于正面情感,精确率、召回率、F1值均为0.98,表明模型对“满意”“推荐”等正面情感表达的识别精准度极高,几乎无偏差;中性情感的精确率、召回率、F1值都为0.90,说明模型能较好地区分“无明显情感倾向”的评论,例如“价格一般”这类表述可准确识别;负面情感的精确率为0.94,意味着模型预测为负面的样本中,实际为负面的比例较高,虽然召回率0.80相对略低,但从整体任务与现有数据情况(电商评论中负面情感样本通常占比较小)来看,模型在负面情感识别上仍有较好表现,能有效捕捉“差评”等负面表达。

刺梨电商评论涵盖“口感、包装、物流”等8个核心分析方面,表5基于模型对各方面的预测结果,统计准确率并结合典型案例说明适配性,验证模型在不同维度的情感识别能力。

Table 5. Aspect-Level sentiment prediction accuracy

5. 各方面的情感预测准确率

方面

准确率

核心结论

价格

0.9750

“有点贵”→中性(正确)

口感

0.9691

“酸甜适中”→正面(正确)

效果

0.9500

“效果明显”→正面(正确)

包装

0.9740

“包装简陋”→负面(正确)

物流

0.9000

“发货快”→正面(正确)

质量

0.9877

“无杂质”→正面(正确)

服务

0.9778

“客服差”→负面(正确)

其他

0.9804

“第一次购买”→中性(正确)

表5展示了各方面的情感预测准确率及典型案例,能清晰看出模型在不同方面的情感识别表现:价格、口感、效果、包装、质量、服务、其他这些方面的准确率均在0.95及以上,例如价格方面“有点贵”对应“中性(正确)”、口感方面“酸甜适中”对应“正面(正确)”等典型案例,都表明模型在这些核心产品维度的情感识别稳定性很强,能够精准捕捉到与各方面相关的情感表达。

4. 电商经济视角下贵州刺梨产品发展的讨论

本文基于Aspect-Based LSTM模型对贵州刺梨电商评论展开细粒度情感分析,模型整体性能优异:准确率达97%,宏平均F1值为0.92,加权平均F1值为0.97,且对“口感、质量、包装”等核心产品维度的情感识别准确率均超95%,这意味着模型输出的“方面与情感”关联数据具备极高可靠性,为后续用户需求挖掘、痛点识别及运营策略制定提供了精准的数据支撑。从电商经济“需求挖掘,供给优化,运营增效”的核心逻辑出发,结合模型验证的可靠数据,可清晰识别用户核心诉求与现存痛点,为刺梨这一特色农产品的电商化发展提供精准方向。

4.1. 从评论情感分布挖掘用户核心需求

基于模型验证的6505条“评论,方面及情感”三元样本,结合模型对各维度的高识别精度,可提炼出电商场景下用户的三大核心需求,所有结论均依托模型验证的可靠数据。

(1) 产品品质需求:模型对质量维度的情感识别准确率高达98.77%,在该数据支撑下,“无杂质”“纯度高”等正面评论占比超88%的结论具备强说服力,表明用户对刺梨产品的“新鲜度、纯度”等基础品质要求极高,这是决定用户复购的核心前提;同时,模型对口感维度的识别准确率达96.91%,依托该精度数据统计的“酸甜适中”等正面评价占83.55%,可明确“口感”是刺梨产品区别于其他农产品的关键竞争力。

(2) 使用体验需求:模型对包装维度的识别准确率97.40%,在此基础上统计的“独立包装”“便携性”相关正面评论占88.67%的结论,真实反映出电商用户(尤其是年轻群体、办公场景用户)对“即开即饮、方便携带”的包装设计需求;即使是模型识别准确率相对较低的物流维度(90%),其“发货快”“包裹完整”正面评价占86.92%的结论仍具备高可靠性,可明确“时效保障”是用户对农产品电商的基础期待。

(3) 健康价值需求:模型对效果维度的识别准确率达95%,依托该数据,“补充维C”“免疫力提升”等正面评论占88.12%的结论可精准反映用户需求,表明“健康功效”是用户选择刺梨产品的核心驱动力;同时,模型对负面情感的精确率达94%,表明如“效果不明显”等负面样本均为真实反馈,进一步验证用户对“健康功效未达预期”的高敏感度。

此外,模型对价格维度的识别准确率97.50%,在此基础上统计的“中性评论占比40.54%”,真实反映用户对刺梨“性价比认知”的模糊性——模型较高的准确率排除了“中性评论被误标为正面/负面”的可能,为定价策略优化提供了可靠依据。

4.2. 基于负面反馈的电商运营痛点分析

实验中负面情感虽占比较少,但依托模型对负面情感的F1值(0.86)及各维度的精准识别能力,这些痛点数据均经过模型验证,排除了误标干扰,集中暴露了刺梨产品电商化发展的关键瓶颈。

(1) 物流时效与包装防护痛点:模型对物流维度识别准确率90%,结合模型对质量维度98.77%的高识别准确率,可确认“物流慢、包装破损”是真实隐性痛点,尤其液态刺梨汁“漏液”问题会引发安全性质疑。模型对物流和质量维度的高识别准确率,让这一结论而更具说服力。

(2) 产品标准化痛点:模型对效果维度95%、口感维度96.91%的高识别准确率,确保了效果负面样本(“效果不稳定”)与口感负面样本(“酸度过高”)均为真实反馈,有效排除了“情感误标”可能导致的结论偏差,由此真实反映出刺梨产品存在“采摘成熟度不一、加工工艺标准不统一”的问题。电商经济的核心特征之一是“标准化供给”,而统计显示存在“用户体验差异大”的现象——部分用户认为“酸甜适中”,另一部分则觉得“过酸”。鉴于模型对口感情感的误判率仅为3.09%,可明确这类体验差异并非源于情感识别偏差,而是产品非标准化所致。

(3) 价值传递痛点:模型对价格维度97.50%的识别准确率,确保“价格高但无对应价值感”等负面样本、“性价比模糊”等中性样本均为真实反馈,排除了“情感误标干扰”,明确品牌方对刺梨“维C含量高”“产地直供”等价值点的传递不足——模型对价格的高识别准确率,让用户无法关联“高价”与“健康价值”的结论具备强可靠性。

4.3. 贵州刺梨电商运营优化策略

结合电商经济“流量获取,转化提升,复购留存”的运营逻辑,针对模型验证的用户需求与痛点(所有策略均依托模型可靠数据,确保施策方向无偏差),从产品、渠道、营销三方面制定优化策略。

(1) 产品端:以品质标准化与体验升级双轨并行,夯实核心竞争力

建立品质管控体系:数据显示,质量维度准确率达98.77%,该数据清晰反映出用户对“无杂质”“高纯度”的核心需求。基于此,建议联合贵州刺梨主产区(如黔南、黔东南)建立“产地直采结合分级加工”标准,对采摘的刺梨鲜果按“成熟度、甜度”分级,确保加工后的刺梨汁、刺梨干等产品口感稳定;同时在电商详情页公示“纯度检测报告”“溯源信息”,将用户认可的质量优势转化为可视化信任背书,精准呼应质量维度高准确率所指向的质量需求。

优化包装与物流方案:包装维度数据显示,模型识别准确率为97.40%,且“便携性”等相关正面评论占比88.67%,这两项数据明确指向用户对包装场景适配性的高需求。据此推出“独立小袋与盒装”组合包装,适配办公、差旅等多元场景,确保包装升级精准契合用户体验诉求。物流方面,模型在物流维度的识别准确率为90%,其中“发货快”等相关正面评价占比达86.92%,同时数据也反映出时效滞后与包装破损的潜在痛点。基于此,与京东物流、顺丰达成合作,采用防压泡沫结合密封袋的专业防护措施,并承诺48小时内完成发货,针对性解决物流环节的核心问题。

(2) 渠道端:聚焦精准流量引入与场景化展示相结合,提升转化效率

细分人群精准触达:效果方面数据显示,正面评价占比88.12%,且评论中“健康功效”相关需求高频出现,明确了用户对刺梨健康价值的核心关注。基于此,在抖音、小红书等电商渠道定向投放“维C补充”“免疫力提升”场景化内容:针对宝妈群体推出“儿童维C补充方案”,针对健身人群设计“低脂健康饮品”场景,将用户的健康需求与具体使用场景深度绑定,提升流量精准度。

优化详情页价值传递:价格方面数据显示,中性评论占比40.54%,其中“性价比模糊”是主要成因,反映出用户对价格价值匹配的决策顾虑。为解决这一痛点,可在详情页核心位置设置“价值对比模块”,用具象化表述替代抽象价格感知,比如以“每100 ml刺梨汁维C含量 ≈ 5个橙子”量化健康价值,“产地直供省去3层中间商”解释价格构成,让用户清晰看到“高价”背后的品质与成本优势。这种设计能有效降低用户决策成本,帮助其建立“价格到价值”的明确认知,进而推动对价格存疑的中性评价向正面转化。

(3) 营销端:依托用户口碑沉淀与复购激励机制,实现可持续增长

挖掘正面评论打造口碑:模型对正面情感的识别准确率达98%,确保了正面评论的真实性与可信度。从这些高置信度正面评论(如“酸甜适中,每天一袋补充维C”“独立包装方便携带”)中筛选优质内容,制作“用户证言视频”“图文评价合集”,在商品详情页、直播间置顶展示。该策略以真实用户反馈为核心,替代品牌单方面宣传的片面性,能让新用户直观感知产品优势,有效降低信任成本,进一步提升消费决策中的信任感。

设计复购激励机制:数据显示,质量、口感等核心维度正面评价占比超80%,说明产品具备高复购潜力;同时评论中“第一次购买”的中性样本占比较高,反映出新用户向复购用户转化的缺口。基于此,推出“会员积分制”“满3赠1”等复购活动,对新用户发放“第二次购买立减10元”优惠券,推动从“尝试性购买”到“复购”的转化,精准解决农产品电商“复购率低”的普遍难题。

5. 结论

本文基于Aspect-Based LSTM模型,对贵州刺梨相关产品的电商评论展开细粒度情感分析,旨在为特色农产品在电商经济中的高质量发展提供洞察与策略支持。模型整体表现优异,准确率达97%,对口感、质量、包装等核心维度的识别准确率均超过95%,为后续结论提供了可靠的数据基础。通过模型验证的用户反馈显示,电商用户对刺梨产品的核心需求主要体现在三个方面:在产品品质方面,用户高度关注纯净度与口感;在使用体验方面,包装便携性与物流时效性成为关键评价因素;在健康价值方面,用户普遍认可其营养功效,但也体现出对产品价格认知模糊这一潜在需求。除此之外,本文分析出当前制约刺梨产品电商化发展的三个核心因素:物流防护不足与配送时效不稳定、产品品质标准化程度较低、健康及产地价值传递不充分。针对这些问题,提出从产品端加强品质管控与优化包装物流、渠道端推进精准流量触达与场景化展示、营销端深化用户口碑运营与复购激励的三维策略,以系统化响应消费需求、破解现有瓶颈。本研究旨在推动贵州刺梨在电商经济中实现规模化、高质量发展,不仅为其电商化转型提供了具体且可行的实施路径,验证了Aspect-Based LSTM在农产品电商评论情感分析中的有效性与实用性,同时也为更多特色农产品依托电商经济助推乡村振兴,提供了可参考、可推广的方法论与实践范式。尽管本研究为特色农产品电商化发展提供了多维度支撑,但仍存在一定局限:当前样本主要来源于京东单一平台,且电商评论中负面情感样本作为少数类,导致模型对负面情感(如“包装破损”“物流延迟”)的识别精度略低于正面情感,对负面需求的捕捉存在轻微偏差。未来可通过定向采集负面评论样本、优化模型对负面特征的提取逻辑,进一步提升对用户痛点的判断准确性。

参考文献

[1] 安华明, 刘明, 杨曼, 等. 刺梨有机酸组分及抗坏血酸含量分析[J]. 中国农业科学, 2011, 44(10): 2094-2100.
[2] 龚映梅, 李紫荆, 王余洲. 基于在线评论的生鲜电商平台物流服务质量评价比较[J/OL]. 昆明理工大学学报(自然科学版): 1-10. 2025-09-18. [Google Scholar] [CrossRef
[3] 王俊. 基于BERT与注意力机制在陶瓷电商产品评论中的情感分析应用[D]: [硕士学位论文]. 景德镇: 景德镇陶瓷大学, 2025.
[4] Mahalakshmi, S. and Sivasankar, E. (2015) Cross Domain Sentiment Analysis Using Different Machine Learning Techniques. In: Ravi, V., Panigrahi, B., Das, S. and Suganthan, P., Eds., Proceedings of the Fifth International Conference on Fuzzy and Neuro Computing (FANCCO—2015), Springer, 77-87. [Google Scholar] [CrossRef
[5] Pontiki, M., Galanis, D., Papageorgiou, H., Androutsopoulos, I., Manandhar, S., AL-Smadi, M., et al. (2016) Semeval-2016 Task 5: Aspect Based Sentiment Analysis. Proceedings of the 10th International Workshop on Semantic Evaluation (SemEval-2016), San Diego, 16-17 June 2016, 19-30. [Google Scholar] [CrossRef
[6] Hu, M. and Liu, B. (2004) Mining and Summarizing Customer Reviews. Proceedings of the Tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Seattle, 22-25 August 2004, 168-177. [Google Scholar] [CrossRef
[7] Tang, D., Qin, B. and Liu, T. (2016) Aspect Level Sentiment Classification with Deep Memory Network. Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing, Austin, 1-4 November 2016, 214-224. [Google Scholar] [CrossRef
[8] Li, H., Yu, B.X.B., Li, G. and Gao, H. (2023) Restaurant Survival Prediction Using Customer-Generated Content: An Aspect-Based Sentiment Analysis of Online Reviews. Tourism Management, 96, Article ID: 104707. [Google Scholar] [CrossRef
[9] Mehra, P. (2023) Unexpected Surprise: Emotion Analysis and Aspect Based Sentiment Analysis (ABSA) of User Generated Comments to Study Behavioral Intentions of Tourists. Tourism Management Perspectives, 45, Article ID: 101063. [Google Scholar] [CrossRef
[10] Graves, A. (2012) Long Short-Term Memory. In: Graves, A., Ed., Supervised Sequence Labelling with Recurrent Neural Networks, Springer, 37-45. [Google Scholar] [CrossRef