1. 引言
网上购物已成为大众生活的重要组成部分。用户在电商平台浏览商品和购物过程中产生了海量的行为数据,其中,商品评论数据对商家具有重要价值。有效利用好这些碎片化、非结构化的数据,不仅有助于企业在电商平台上的持续发展,也是大数据在企业经营中的实际应用。
在电子商务生态系统中,用户评论发挥着不可替代的重要作用。与传统的线下购物不同,电子商务交易过程中存在明显的信息不对称问题——消费者无法直接接触和检验商品,主要依赖商品描述、图片展示以及其他用户的真实评价来做出购买决策。这种特性使得商品评论成为影响消费者购买意愿和商品转化率的关键因素。研究表明,超过90%的在线消费者会参考商品评论[1],且正面评论能够显著提升商品的销售转化率[2]。
当前,主流电商平台上的用户评论呈现出典型的“4V”特征[3]:数据量巨大(Volume)、产生速度快(Velocity)、形式多样(Variety)但价值密度低(Value)。面对这些海量、碎片化、非结构化的评论文本数据,传统的人工阅读和分析方法已无法满足实际需求。电商企业亟需一种高效、准确的情感分析技术来从这些数据中提取有价值的商业洞察,从而优化产品设计、改进服务质量、提升用户体验。
在电商评论分析研究方面,早期工作主要集中于整体情感倾向判断[4]或评论有用性投票[5]。随着方面级情感分析(Aspect-Based Sentiment Analysis, ABSA)技术的发展,研究者开始对评论进行更细粒度的挖掘。例如,李剑等[6] (2019)构建了价格、质量等多维度评价体系;Mao (2021)等[7]利用深度学习模型自动提取方面情感。然而,现有应用于电商场景的模型或存在维度划分与真实业务需求脱节、或缺乏直观的可视化展示以支撑商业决策等问题。因此,本文的研究定位是:构建一个紧密贴合电商运营实际需求、涵盖价格、质量、服务、物流、款式、舒适度六个核心维度,并集成了自动化分析与雷达图可视化功能的商品评价模型,旨在为企业和消费者提供一个端到端的决策支持工具。
本文基于电子商务平台的实际运营需求,构建了一个面向电商场景的多维度商品评论情感分析模型。该模型通过爬虫技术获取主流电商平台的真实用户评论,建立专业情感词典库,从价格、质量、服务、物流、款式、舒适度六个核心维度对评论进行精细化情感打分,并利用雷达图等可视化技术直观展示分析结果。研究成果在电子商务领域具有重要的应用价值:既能够帮助电商企业精准把握消费者需求,实现数据驱动的精细化运营;又能为消费者提供更加客观、全面的购物决策参考,促进电子商务生态系统的健康可持续发展。
2. 相关工作:方面级情感分析在电商评论中的应用
方面级情感分析(ABSA)是情感分析的重要分支[8],旨在识别评论文本中针对特定方面的情感倾向。与整体情感分析不同,ABSA能够提供更细粒度的情感洞察,特别适用于包含多个评价维度的电商评论场景。
近年来,ABSA研究方法主要分为三类:基于词典的方法[9]通过构建情感词典和规则进行匹配,如Zhang等人[8] (2018)通过扩展HowNet词典提升中文评论分析准确率;基于机器学习的方法采用SVM、CRF等传统模型,如李剑等[6] (2019)结合语义特征进行方面提取和情感分类;基于深度学习的方法利用BERT、图神经网络等先进技术,如Chen等[3] (2022)提出的Aspect-specific BERT模型在SemEval任务中表现优异。
然而,现有研究仍存在以下局限性:1) 中文电商评论的方言表达、网络新词等给词典构建带来挑战;2) 多数模型缺乏直观的可视化展示;3) 维度划分不够全面,难以满足实际电商运营需求。
本研究在现有ABSA研究基础上,构建了专门针对中文电商场景的六维度情感词典,开发了高效的词典匹配算法,并通过雷达图实现分析结果的可视化对比,为电商企业提供了实用的决策支持工具。
3. 数据的获取和存储
使用第三方爬虫软件进行电商平台商品的评论抓取,并将数据存储在数据库中。针对评论中的无效和冗余评价进行数据清洗,以历史数据的形式抽取出来建造数据仓库。
3.1. 数据获取
通过爬虫获取电商产品的原始评论,包括原始内容、评论时间、评论用户等级以及该商品ID和店铺id。如图1所示,数据获取过程包括请求发送、页面解析、数据抽取和存储四个主要步骤。
Figure 1. Flowchart of data acquisition
图1. 数据获取流程图
字典构造需要参考评论数据,如图2所示,通过平台已有的标签进行抓取评论,与标签相对应的评论会有高亮显示,该部分可判断后选为字典。
Figure 2. Dictionary construction process
图2. 字典构造流程
3.2. 数据存储
为支持电商评论的长期追踪与分析,本研究设计了以下核心数据表,构建了适用于电商场景的数据仓库。主要数据表包括如下内容。
3.2.1. 原始评论表(c_comment)
CREATE TABLE `c_comment` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`content` text COMMENT '评论原始内容',
`createtime` datetime DEFAULT NULL COMMENT '评论创建时间',
`item_id` varchar(50) DEFAULT NULL COMMENT '商品ID',
`shop_id` varchar(50) DEFAULT NULL COMMENT '店铺id',
`vip_level` varchar(50) DEFAULT NULL COMMENT '评论者等级',
`temp` varchar(45) DEFAULT NULL COMMENT '临时字段',
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='原始评论';
3.2.2. 评论字典表(c_dictionary)
CREATE TABLE `c_dictionary` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`content` varchar(200) NOT NULL COMMENT '字典单词',
`type` varchar(100) DEFAULT NULL COMMENT '单词维度',
`score` tinyint(4) DEFAULT NULL COMMENT '单词分数',
`createtime` datetime DEFAULT NULL COMMENT '创建时间',
`people` varchar(64) DEFAULT NULL COMMENT '打分群众',
`length` tinyint(4) DEFAULT NULL COMMENT '单词长度',
PRIMARY KEY (`id`),
UNIQUE KEY `title_UNIQUE` (`content`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='评论字典';
3.2.3. 商品详情表(c_item)
CREATE TABLE `c_item` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`title` varchar(200) DEFAULT NULL COMMENT '商品标题',
`shop` varchar(200) DEFAULT NULL COMMENT '店铺名称',
`shop_id` varchar(50) DEFAULT NULL COMMENT '店铺id',
`cprice` double DEFAULT NULL COMMENT '促销价格',
`price` double DEFAULT NULL COMMENT '原始价格',
`item_id` varchar(50) DEFAULT NULL COMMENT '商品ID',
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='商品表';
通过该系统可实现电商评论数据的结构化存储与动态更新,为后续情感分析提供更加稳定的数据支持。
3.3. 字典构造
针对商品特征划分维度(价格、服务、物流、质量、款式、舒适度),并为每一维度构建相应的情感字典[10],例如,价格维度字典可以包括“价格很好”,“价格略贵”,“太贵了”等表达。在对此些字典进行情感打分,分数段为1~5分,情感由负到正,如“价格很好”打4分,“太贵了”打1分。情感字典同样存入数据仓库中,并且可动态添加补充。
如图3所示,通过对电商平台签抓取的评论进行抽取,业务人员分析维度后进行人工判断选择词典。以下为测试中构造的部分字典:
Figure 3. Partial dictionary constructed during testing
图3. 测试中构造的部分字典
3.4. 情感打分
情感打分标准见表1~6。评分采用5分制,从1分(强烈负面)到5分(强烈正面)。
Table 1. Price emotion scoring
表1. 价格情感打分
分数 |
评判标准 |
示例 |
1 |
很等强烈程度副词表达不满 |
比实体店贵很多 |
2 |
挺贵、略贵等轻微不满 |
这个价格还是挺贵的 |
3 |
不贵,还行,尚可等词 |
这个价格也不算贵 |
4 |
挺等程度副词表达正面情感 |
挺划算的一双鞋子 |
5 |
超、超级、最狠、非常等强烈程度副词表达正面情感 |
赶上活动超级划算 |
价格是电商消费者最敏感的维度之一。准确识别用户对价值的情绪,有助于商家制定精准的促销策略、优化定价模型,从而提升转化率。表1详细定义了“价格”维度的细粒度情感评分标准,为准确量化用户对价格的态度提供了明确依据。
Table 2. Style emotion scoring
表2. 款式情感打分
分数 |
评判标准 |
示例 |
1 |
很等强烈程度副词表达不满 |
鞋子很丑,穿起来像个大妈 |
2 |
挺、略等轻微不满 |
穿起来略显臃肿 |
3 |
还行,尚可等词 |
这鞋子看起来还行吧 |
4 |
挺等程度副词表达正面情感 |
挺漂亮的,百搭 |
5 |
超、超级、最狠、非常等强烈程度副词表达正面情感 |
超级无敌巨好看 |
表2详细定义了“款式”维度的情感评分标准。评分综合考虑了用户对商品外观、设计、风格的描述,旨在精准捕捉消费者对商品时尚度和美观度的主观感受。
Table 3. Logistics emotion scoring
表3. 物流情感打分
分数 |
评判标准 |
示例 |
1 |
很等强烈程度副词表达不满 |
物流速度慢的实在可以 |
2 |
挺、略等轻微不满 |
就是物流速度有点慢了 |
3 |
还行,尚可等词 |
双十一这个速度还行了 |
4 |
挺等程度副词表达正面情感 |
物流还是挺给力的 |
5 |
超、超级、最狠、非常等强烈程度副词表达正面情感 |
快递速度快得没话说 |
表3详细定义了“物流”维度的情感评分标准。该标准主要依据用户对配送速度和服务体验的描述进行打分,反映了用户对购物后续环节的满意度。
表4详细定义了“舒适度”维度的情感评分标准。该维度尤其适用于服装、鞋帽、家具等商品,评分基于用户对产品穿戴或使用体验的描述。
表5详细定义了“质量”维度的情感评分标准。评分依据用户对商品材质、工艺、耐用性的评价,用于衡量商品的实际品质是否符合消费者预期。
表6详细定义了“服务”维度的情感评分标准。该标准用于评估用户对客服态度、响应速度及售后服务的满意度,帮助商家优化客户服务体系。
Table 4. Comfort emotion scoring
表4. 舒适度情感打分
分数 |
评判标准 |
示例 |
1 |
很等强烈程度副词表达不满 |
穿着很累脚都磨破皮了 |
2 |
挺、略等轻微不满 |
不穿袜子的话有点磨脚 |
3 |
还行,尚可等词 |
还行吧,走路不累 |
4 |
挺等程度副词表达正面情感 |
不过是布的,穿着挺舒服 |
5 |
超、超级、最狠、非常等强烈程度副词表达正面情感 |
鞋子穿上很舒服很暖和 |
Table 5. Quality emotion scoring
表5. 质量情感打分
分数 |
评判标准 |
示例 |
1 |
很等强烈程度副词表达不满 |
才穿几次就烂了,垃圾 |
2 |
挺、略等轻微不满 |
鞋子是次品 |
3 |
还行,尚可等词 |
这个价格来看鞋子还行吧 |
4 |
挺等程度副词表达正面情感 |
鞋子质量挺好的 |
5 |
超、超级、最狠、非常等强烈程度副词表达正面情感 |
质量杠杠的 |
Table 6. Service emotion scoring
表6. 服务情感打分
分数 |
评判标准 |
示例 |
1 |
很等强烈程度副词表达不满 |
还没碰到过这么差的服务 |
2 |
挺、略等轻微不满 |
客服很久才回答 |
3 |
还行,尚可等词 |
客服还算周到吧 |
4 |
挺等程度副词表达正面情感 |
客服还是比较给力 |
5 |
超、超级、最狠、非常等强烈程度副词表达正面情感 |
服务非常好,给客服点赞 |
除了对每一个词典里面的评价打分以外,还要对词典里面的词语进行清洗,尽量做到:用最短的词表达出明确的意思。
1、删除掉不含明确意思的词语,比如“真的很”、“真的是”等;
2、删除不含意义的语气词,比如“很划算哟”,“很划算哦”均改为“很划算”,“质量一如既往的好呀”改为“质量一如既往的好”等等;
3、修改含有特定名词的词语,比如“客服花花态度很好哟”改为“客服*态度很好”,“达芙妮的鞋子质量没得说的”改为“*鞋子质量没的说”的;
4、修改某些错分的词语,比如在物流维度里面,可能存在一些描述质量的词语,那么将该词分到质量那列;
5、某些一个词包含几个维度的信息,只需保留该维度的信息即可,比如“鞋子性价比很高而且物流很快”,如果是在价格维度里面,那么只保留“性价比很高”即可,若在物流维度那么保留“物流很快”即可。
3.5. 评论分析
评论分析算法[11]步骤如下(算法流程图见图6):
1、从电商平台数据库抽取商品原始评论;
2、依次对每一个商品评论进行字典匹配。匹配具体过程如下:
各维度总情感分初始为0。
按商品维度抽取字典,单词短语长度排序。
原始评论能与字典单词进行部分匹配。
匹配成功,则累加对应情感分。
3、计算各维度平均情感分。
4、根据商品id从数据库中抽出商品详情表,可获得商品名称及商品属性。
该算法帮助电商企业快速定位产品优劣势,为产品迭代和营销策略调整提供直接依据。
4. 案例分析
基于Java语言实现情感分析模型[12],通过算法运算将原始评论进行分词、字典匹配和分数处理,得到商品各维度的平均情感分。在智能系统平台,只需选择商品,商品即可通过雷达图的形式显示出各维度分数。支持商品对比或同一商品不同时期的比较。
4.1. 字典数据
如图4所示,系统构建了六个维度的情感字典库。
Figure 4. Example of sentiment dictionary
图4. 情感字典示例
4.2. 原始评论
如图5所示,系统爬取了大量用户原始评论数据。
Figure 5. Example of original review
图5. 原始评论示例
4.3. 算法流程
如图6所示,情感分析算法包括数据获取、字典匹配、情感计算和可视化四个核心模块。
Figure 6. Sentiment analysis algorithm flowchart
图6. 情感分析算法流程图
图6清晰地描绘了情感分析模型的完整工作流程。从获取原始评论开始,依次经过词典匹配、各维度情感分数累加、计算平均分、直至最终生成可视化图表(如雷达图)的全过程,揭示了模型的核心逻辑。
4.4. 分析结果
Figure 7. Time-varying sentiment scores for shoes on a certain e-commerce platform (Jun.-Dec. 2024)
图7. 某电商平台鞋类商品情感得分时间变化趋势(2024年6月~12月)
图7的时间序列变化图直观展示了某电商平台鞋类商品在2024年6月至12月期间价格、质量、服务、物流、款式、舒适度六个维度上的情感得分变化趋势。数据来源于该平台15,832条真实用户评论,采样间隔为月度聚合。可以看出在商家进行产品改进后鞋子的质量和舒适度方面有显著提升,反映出了商家这一产品的改进取得了良好的效果。图7能帮助运营人员追踪产品口碑地长期趋势,验证产品迭代的效果。
Figure 8. Radar chart for sentiment analysis of reviews of a certain brand of sports shoes
图8. 某品牌运动鞋评论情感分析雷达图
图8的雷达图直观展示了商品在不同时间段各维度的情感得分变化。数据来源于某电商平台2024年6月至12月用户评论,可以看出在服务和物流维度有显著提升。这种可视化对比能直观揭示商家在特定时间段内运营优化的成效。
5. 人工示例
商品名称:某品牌真皮男士斜挎包,选取7条真实评论进行人工验证。
5.1. 原始评论
1、第一次到货很高兴,但一看发现表面有点刮痕于是联系卖家换货,换货速度挺快的,今天已收到包包了,本是购物时不小心多买的,但是颜色款式还可以,反正第一次看到实物觉得还行,做工还行,客服和售后服务还行,特发图肯定。某快递公司A的服务明显优于其他快递公司。
2、公文包挺好的,挺大方,可以装电脑,及其他物品,样式做工都不错,挺满意的一次购物。钱包,手包也挺好的。
3、包包很好看,大气的款式,很洋气,卖家服务态度很好,送了皮带老公也可以用,满意。
4、包包质量很好。是送给爸爸的礼物,爸爸很喜欢。爸爸对包包很挑剔,找了好久这种包包,大小、质量都是我们想要的,终于在这里找到了。客服也很好,物流很快就到了。包装得很好。下次还会再来你家买东西的噢。
5、包包很不错哦,摸起来很舒服。送给老爸的,这个大小是他想要的。客服很不错~~。
6、包包收到了,物流很快,包包的质量真是杠杠的,老公喜欢,会继续支持你们的。
7、包质量很好,很高档。快递非常快。下次还来光顾。
5.2. 情感评分
从第一条评论开始扫描匹配各维度字典,进行加分。结果如下(某些评论某些维度没有查到,则不参与算术平均)。具体打分过程与结果汇总见表7。
Table 7. Emotion scoring
表7. 情感打分
维度款式 |
维度服务 |
维度物流 |
维度质量 |
但是颜色款式还可以 3分 |
客服很不错~~ 4分 |
物流很快 4分 |
质量真是杠杠 4分 |
样式做工都不错 4分 |
客服也很好 4分 |
快递非常快 4分 |
包质量很好 4分 |
包包很好看 4分 |
卖家服务态度很好 4分 |
|
质量很好 4分 |
款式:(3 + 4 + 4)/3 = 3.66服务:(4 + 4 + 4)/3 = 4物流:(4 + 4)/2 = 4质量:(4 + 4 + 4)/3 = 4
5.3. 情感分析雷达图
如图9所示,雷达图清晰展示了该商品的综合评价结果。
Figure 9. Product review sentiment analysis radar chart
图9. 商品评论情感分析雷达图
6. 结论与展望
本研究所构建的情感分析模型在电子商务领域具有广阔的应用前景与积极的实践意义。其对电子商务的推动作用主要体现在以下三个方面:
对商家而言,该模型将海量、非结构化的用户评论转化为可量化的决策依据,实现从“主观经验”到“数据驱动”的运营转变,帮助精准定位产品在价格、质量、服务、物流、款式、舒适度六个维度的优劣势,从而有针对性地进行产品迭代、价格调整、服务优化与营销策略制定,有效提升客户满意度与品牌忠诚度。
对消费者而言,模型提供的可视化雷达图将复杂的文本评论凝练为直观的多维度评分,极大地降低了信息获取与决策成本。消费者能够一目了然地了解商品的综合口碑,做出更符合自身需求的购物选择,从而提升在线购物体验。
对电商平台而言,该模型的应用有助于净化评论环境、提升平台服务质量。平台可以基于情感分析结果,识别优质商家与问题商品,优化搜索排名与推荐机制,构建一个更加透明、诚信的交易环境,最终增强平台生态的健康度与用户粘性。
未来,本研究模型可进一步与销量预测[13]、用户画像等技术结合[14],为电子商务的智能化发展提供更强大的数据支撑。