1. 引言
随着共享经济理念的深入普及与移动互联网技术的飞速发展,二手交易电商平台作为循环经济的重要组成部分,已迅速融入大众日常生活[1]。这些平台不仅有效促进了社会闲置资源的优化配置与价值再生,更引领了一种绿色、可持续的消费新风尚[2]。然而,行业蓬勃发展的背后,平台方也面临着日益激烈的同质化竞争与部分用户的质疑。在此背景下,如何精准洞察并满足用户多元化、深层次的需求,已成为提升平台核心竞争力、改善用户体验、建立用户口碑的关键所在[3]。
传统的用户需求分析方法,如问卷调查和用户访谈,虽具直接性,但往往受限于样本规模、主观偏见及问题设置的局限性,难以从浩如烟海的非结构化文本数据中系统地提炼出潜在、真实的用户诉求[4]。在此背景下,文本挖掘技术,特别是主题建模方法,为大规模、自动化地洞察用户需求提供了强有力的技术支撑[5]。其中,潜在狄利克雷分布(Latent Dirichlet Allocation, LDA)模型作为一种经典的无监督机器学习算法,能够从文档集合中高效识别出潜在的主题结构,因此适用于从用户评论、搜索查询、咨询内容等文本中,自动发现并归纳出代表不同用户需求群体的主题集群,从而揭示出用户关注的焦点议题与需求倾向[6]。
尽管LDA模型在新闻分类、文献主题梳理等领域已得到成熟应用[7],但将其聚焦于电商二手交易平台这一特定垂直领域进行用户需求挖掘研究仍具有广阔的探索空间。二手交易场景具有其独特性,不仅关乎商品本身的价格与质量,更涉及信任机制、交易安全、物流体验、平台规则以及社区互动等多个复杂维度。这些需求广泛散落于用户生成的各类评论文本中,对于二手交易平台意义重大。
鉴于此,本研究旨在将LDA主题模型应用于二手交易电商平台APP的用户评论挖掘,以期实现用户需求的深度洞察。研究首先收集主流二手交易平台的海量用户评论数据,经过数据清洗与预处理流程后,构建文本语料库。随后,运用LDA模型进行主题挖掘,识别并解读用户讨论的核心主题,进而将这些主题归类并提炼为用户的不同需求。最后,通过对各主题的情感倾向分析,量化评估不同需求的显著性与用户情感差异。
本研究在理论上丰富了文本挖掘与主题分类在电子商务领域的应用实践,并能够为二手交易平台的运营者与产品设计师提供决策依据与建议,从而优化产品功能设计、提升服务质量,最终推动平台的健康与可持续发展。
2. 研究方法
本研究综合运用无监督机器学习与自然语言处理技术,旨在深入地挖掘二手交易电商平台APP用户评论中潜藏的需求信息。整体研究流程主要包括数据挖掘与预处理、潜在需求主题分类(基于LDA模型)以及用户情感维度分析(基于SnowNLP库)三个核心阶段。
2.1. 数据挖掘与预处理
本研究以国内主流应用商店(安卓应用市场、苹果商店)为数据源,选取下载量位居前列的代表性二手交易电商平台APP (如闲鱼、转转等)作为研究对象。利用Python和七麦数据进行数据收集,构建原始语料库。为确保分析质量,对原始数据执行严格的清洗与预处理流程:(1) 剔除与需求分析无关的无效数据,如纯符号、外语、广告文本及过短评论;(2) 进行中文分词处理,采用Jieba分词工具,并融入体育健康领域的自定义词典以提升专业性词汇切分准确度;(3) 去除停用词(包括通用停用词及“软件”、“更新”等本领域高频但信息量低的词汇);(4) 进行词性标注并保留名词、动词、形容词等承载核心语义的词汇。最终收集有效文本数据11,299条,为后续数据分析做支撑。
2.2. LDA模型主题挖掘
主题建模采用潜在狄利克雷分布(LDA)模型,作为一种典型的贝叶斯概率生成模型,它能够将文档集合中每个文档表示为多个潜在主题的概率分布,而每个主题又可表示为一系列特征词的概率分布,从而有效从大量非结构化文本中提炼出抽象主题[8]。本研究应用Python实现LDA建模。经过多次迭代测试,依据困惑度(Perplexity)和可视化进行综合评估,确定最优的主题数量K。每个主题由一组概率最高的关键词表征,从而揭示蕴含其中的用户需求。
2.3. SnowNLP情感分析
为深入理解用户对已识别各项需求主题的情感态度,本研究进一步采用SnowNLP对评论文本进行情感倾向分析。SnowNLP是基于贝叶斯算法的中文自然语言处理工具,其情感分析模块通过训练中文评论语料库,能够有效计算一段文本所表达的情感极性值,输出范围为0 (负面情感)到1 (正面情感)之间的连续数值[9]。本研究将对全体评论以及归属于不同主题的评论子集分别进行情感得分计算。通过分析各需求主题对应的平均情感得分与情感分布,可以甄别用户满意度较高的优势功能与亟待改进的需求痛点,从而为后续提出更具针对性的优化策略提供量化依据。
3. 用户需求分析
3.1. 词频分析
本研究抓取二手交易电商平台APP用户评论,经过预处理后借助词频统计方法对评论内容进行量化分析,旨在从宏观层面识别用户关注的核心议题与高频需求[10]。词频统计结果如表1和图1所示,用户不仅重视平台的安全程度和交易性价比,也对用户体验、商业策略及商品质量多有涉及。首先,平台信任与安全构成了用户最为突出的关注点。词汇“客服”(1299次)、“官方”(524次)的高频出现,与“骗子”(352次)一词形成鲜明对比,深刻揭示了用户对于平台建立权威、可靠沟通渠道以及有效打击欺诈行为的强烈渴望。用户期望通过官方渠道获得及时的支持,从而规避交易风险。此外,“验机”(361次)、“报告”(319次)、“检测”(316次)等词汇的密集出现,精准地指向了二手电子产品交易中的核心痛点——质量不确定性。这充分表明用户极度依赖并重视平台提供的专业质检服务,将其视为构建交易信任基石的关键环节。其次,交易成本与价值需求是用户决策的核心考量。“价格”(587次)作为仅次于“客服”的第二大高频词,辅以“手续费”(212次)等词汇,直接反映了用户在二手交易中对性价比和经济成本的高度敏感。用户不仅关注商品本身的定价,也对平台收取的费用结构抱有明确的审视态度。最后,商品质量与服务体验贯穿于交易的整个过程。诸如“商品”(552次)、“屏幕”(309次)、“电池”(270次)、“质量”(188次)等词汇体现了用户对产品本身硬件状况的细致关注。而在服务流程方面,“体验”(423次)、“售后”(278次)、“发货”(192次)、“时间”(216次)等词汇则密集涌现,清晰勾勒出用户对从下单、物流到售后支持全流程服务体验的高标准要求。
Table 1. Statistics of frequency words
表1. 词频统计
高频词 |
频数 |
高频词 |
频数 |
客服 |
1299 |
屏幕 |
309 |
价格 |
587 |
售后 |
278 |
商品 |
552 |
账号 |
275 |
官方 |
524 |
电池 |
270 |
体验 |
423 |
专业 |
220 |
验机 |
361 |
服务 |
217 |
骗子 |
352 |
时间 |
216 |
广告 |
348 |
手续费 |
212 |
报告 |
319 |
发货 |
192 |
检测 |
316 |
质量 |
188 |
Figure 1. Word cloud distribution of frequency words
图1. 高频词云图
综上所述,高频词分析初步表明,二手交易平台用户的需求是一个多层次的复杂体系,其中建立信任是首要前提,衡量成本是决策基础,而获得高质量的商品与无缝的服务体验则是终极期望。这一初步发现为后续应用LDA模型进行更深层次的主题挖掘奠定了基础。
3.2. LDA主题分类
在利用Python实施LDA主题建模过程中,通过对文本数据进行特征提取(选取1000个特征词)并设置迭代次数为1000次,对主题划分进行调试。由于LDA属于无监督学习方法,其主题数K需借助可视化工具辅助判定[11]。本研究使用pyLDAvis对不同主题数量进行多次可视化仿真,结果显示:聚类生成的主题以气泡形式呈现,气泡大小反映主题显著程度,气泡间距则表示主题间区分度。图2的可视化显示,当主题数K = 3时,各类别之间重叠区域最小、区分度较高,能够对整体语料进行有效概括。结合困惑度走势,在K = 3时困惑度处于低谷,因此基于综合分析,最终将二手交易电商平台APP的用户需求归纳为3个核心主题类型。
Figure 2. Visualisation results based on LDA model
图2. 基于LDA模型的可视化结果
主题1收集的词语主要包括“验机”、“检测”、“报告”、“屏幕”、“电池”、“专业”、“原装”、“划痕”、“曝光”、“摄像头”等。该主题集中体现了用户对二手商品(尤其是高价值数码产品)质量评估可信度与信息透明度的强烈期待。在信息不对称的线上交易环境中,用户无法直接接触“闲置”物品实体,因此迫切依赖平台构建一套标准化、专业化的质量鉴定体系。该体系不仅需对“屏幕”、“电池”、“摄像头”等关键部件进行技术性“检测”,更需将检测过程与结果以可视化的形式呈现,并确保任何瑕疵或维修历史均被明确披露。这反映了用户期望平台超越传统中介角色,履行其“第三方专业人员”的职责,通过科学、客观的检验流程,将商品的内在质量这一隐性属性转化为显性的、可验证的信任凭证,从而有效降低交易风险,奠定平台信任基石。由此,将主题1概括为“质检服务的专业化与透明化需求”。
主题2由“价格”、“手续费”、“估价”、“压价”、“报价”、“低价”、“高价”等关键词构成,这些词汇共同指向交易价值评估环节中,卖家与买家、用户与平台之间存在的内在博弈机制及对定价公正性的复杂诉求。用户对价格体系表现出高度敏感性,其需求呈现二元性:一方面,作为买方追求“低价”实惠,作为卖方期望获得“高价”回报;另一方面,其对异常“低价”保持警惕,因其常与“假货”风险相关联。而“压价”与“估价”揭示了买家内心忧虑的价值评估风险,他们担心自身在价值评估过程中处于弱势地位,权益受到侵蚀。此外,“手续费”作为平台对于卖家征收的费用,其合理性直接影响用户最终收益,手续费也成为卖家关注的焦点之一。本质上,该主题凸显了用户对一个由“官方”背书的、算法透明、规则明确的定价机制的需求。该机制应能精准锚定产品的内在价值,平衡买卖双方利益,维护市场秩序的公平性,从而构建一个健康的交易生态。由此,将主题2概括为“价格评估机制的公平性与合理性需求”。
主题3突显用户对售后服务和保障的高度关注,关键词如“客服”、“售后”、“发货”、“时间”、“人工”、“态度”、“封号”、“证据”、“收货”、“订单”、“体验”等表明,用户非常看重APP在交易履约及售后阶段对权益和服务的保障。首先,带有处罚意向的词汇如“封号”直指买家用户对交易安全性与账号合规性的深层焦虑,也体现了卖家对于违规的忌惮;而流程性词汇如“发货”、“收货”、“订单”则反映其对交易流程顺畅性与时效性的基本要求。与此同时,用户与“客服”系统的交互体验至关重要,其态度、响应速度及问题解决能力直接决定了用户的最终体验的满意度。因此,该主题表明用户迫切需要平台建立一个高效、主动、人性化的全周期售后保障体系。此体系不仅要能快速响应并化解纠纷,提供坚实的维权“证据”支持,更需从规则上有效明确和警示买卖双方的违规行为,从而为用户提供贯穿交易始终的安全感与信任感。由此,将主题3概括为“售后支持的可靠性与响应性需求”。
综上,本研究通过LDA模型进行主题类别挖掘,最终确定3个主题类别,其命名与相应的关键词如表2所示。
Table 2. Topic categories and feature words
表2. 主题类别及关键词
序号 |
主题 |
关键词 |
1 |
质检服务的专业化与透明化需求 |
验机 广告 报告 检测 屏幕 电池 专业 闲置 划痕 曝光 物品 朋友 原装 平板 摄像头 微信 人员 耳机 |
2 |
价格评估机制的公平性与合理性需求 |
价格 官方 账号 服务 手续费 产品 建议 压价 估价 机器 假货 低价 流量 游戏 高价 图片 评估 报价 评价 |
3 |
售后支持的可靠性与响应性需求 |
客服 骗子 商品 售后 时间 发货 信息 人工 体验 视频 封号 收货 质量 系统 态度 自动 运费 证据 订单 |
3.3. 情感分析
为深入探究用户对平台各核心需求维度的总体情感倾向水平,本研究采用SnowNLP对已划分的三大主题评论语料进行情感极性测度。SnowNLP是基于自然语言处理技术开发的中文情感分析库,能够有效识别文本中蕴含的主观情感倾向,其输出值为介于0到1之间的连续数值,数值越高代表情感越积极正向,通常以0.5作为中性情感[12]。为提升准确率,本研究先随机抽取500条数据进行人工情感标注,预训练后的SnowNLP工具准确率达到86.23%。本次分析共处理有效评论11,299条,总体情感得分为0.2498,表明用户整体满意度处于中性偏下的水平,其反馈中存在大量亟待改进的负面意见,也体现出用户对于二手交易电商平台APP较为不满的态度。各主题的评论数量和情感倾向由表3所示,评论数量体现了用户对于该主题的重视情况,评论越多,意味着用户对于该主题越关注,也就更值得运营者重视。进一步对三个主题进行剖析,可发现其情感得分存在显著差异,深刻揭示了平台在不同运营环节上的服务短板。
Table 3. Sentiment analysis statistics
表3. 情感倾向统计
序号 |
主题 |
评论数量 |
情感倾向 |
1 |
质检服务的专业化与透明化需求 |
6396 |
0.3023 |
2 |
价格评估机制的公平性与合理性需求 |
2293 |
0.2495 |
3 |
售后支持的可靠性与响应性需求 |
2610 |
0.1213 |
总体 |
11,299 |
0.2498 |
首先,“质检服务的专业化与透明化需求”主题的情感得分为0.3023,在三个维度中相对最高,但仍为负面。该结果反映出,用户对此环节存在大量讨论与质疑,尽管平台所提供的验机服务、检测报告等功能在一定程度上获得了用户的认可,但认可程度有限,得分偏低说明其服务质量与用户的理想预期仍存在较大差距。用户对专业质检流程存在的必要性表示肯定,而负面情感则密集指向报告细节不足、检测标准不统一、原装部件判定存疑等具体问题。这表明,质检服务作为平台构建交易信任的核心环节,其基础框架已获用户接纳,但在执行的精细度、标准化与透明度方面仍有巨大的优化空间。
其次,“价格评估机制的公平性与合理性需求”主题的情感得分为0.2495,略低于总体平均水平。该数据清晰地表明了用户在价格这一敏感问题上的复杂矛盾心理。卖家对于手续费的合理性表达了不满,而买家则对价格评估的透明性表现出强烈的不信任感。情感得分不高说明当前的价格体系未能有效平衡买卖双方的利益诉求。
最后,“售后支持的可靠性与响应性需求”主题的情感得分最低,仅为0.1213,远低于其他两个主题及总体均值。这一数据表明,该维度是当前用户满意度最低、负面情绪最集中的领域。用户评论中,客服响应迟缓、人工服务难以接通、售后态度恶劣、处理时间过长、退货运费纠纷、以及遭遇问题后申诉无门等常见交易问题,是引发用户强烈负面情绪的关键触点。极低的情感得分指出,平台的售后支持系统在可靠性、响应效率和问题解决能力上存在缺陷,极大地侵蚀了用户对平台的整体信任感。
综上所述,情感分析结果表明,平台在售后支持环节面临最严峻的用户信任危机,在价格评估环节需着力提升其公平性与透明度,而在已获部分认可的质检服务环节,则需向更深度的专业化和透明化迈进。
4. 二手交易电商平台APP优化建议
4.1. 构建多维透明的质检认证体系,夯实平台信任基石
分析结果表明,质检服务是用户最为关注的需求维度,令用户信服的质检认证体系是数码二手产品交易的重要保障。然而,当前0.3023的情感得分远未达到理想水平,表明其服务深度与透明度仍有巨大提升空间。平台应致力于构建一个多维、立体、高度透明的质检认证体系,并严格遵照执行。具体而言,首先需建立并公开一套详尽的标准化检测规程,将用户所关心的关键部件的检测项目、技术指标、成色判定标准悉数公开,消除检测过程的信息不透明操作。其次,目前一些平台的商品展示多依赖于用户自行拍摄的静态图片和文字描述,质量参差不齐,信息维度单一,导致买家在决策时面临较高的不确定性与心理门槛。为有效降低用户的决策成本,平台需开发并提供一套沉浸式、标准化的新一代商品可视化展示工具。这包括强制推行多角度、高清背景统一的图片上传模板,并提供视频上传功能,允许卖家动态展示商品细节与功能完好性。更进一步,平台可研发并集成简易的AR (增强现实)预览功能,允许买家将家具、电子产品等特定商品虚拟放置在自己的真实环境中查看效果,或通过AR直观感知商品的尺寸比例。对于数码产品,可提供简单的性能测试工具(如电池健康度检测、屏幕显色测试),并自动将测试结果以数据卡片形式生成在商品页面。通过这些技术手段,将商品的关键信息以更丰富、更直观、更可信的方式呈现给潜在买家,极大弥补了线上交易无法实地查看的固有缺陷,从而提升购买意愿与交易转化率。最终,平台可探索引入区块链等分布式记账技术,确保二手商品的真实性与可追溯性。通过这些举措,将质检从一项后台服务提升为可视化的信任工具,能够极大缓解二手商品交易中的信息不对称风险,从根本上巩固用户的交易信心[13]。
4.2. 重构全周期闭环售后保障系统,扭转用户安全感知
“售后支持的可靠性与响应性需求”主题0.1213的情感得分无疑表明该环节已成为严重侵蚀用户信任、损害平台口碑的最大短板。用户投诉集中于响应迟缓、效率低下、申诉无门与态度恶劣,这反映出平台售后体系在流程、资源与执行力上存在系统性问题。平台必须对此进行战略性投入与结构性优化,打造一个全周期、高效响应的闭环保障系统。首先,应适当扩充人工客服团队并加强专业培训,同时优化智能客服系统,确保能精准识别用户问题并实现高效转接,压缩用户寻求帮助的等待时间,降低用户不满。其次,必须建立一套标准化的纠纷处理流程(SOP)与强有力的授权机制,客服人员被赋予足够的权限,能够基于用户提供的凭据快速做出裁决并执行退款、赔付等操作,避免用户在不同部门间被反复推诿。最终,平台应建立先行赔付基金与卖家诚信保证金制度,在纠纷责任明晰前优先保障买家权益,极大降低用户的维权成本与风险。通过构建一个响应迅速、裁决有力、执行到位的售后支持网络,改变用户对交易安全性的负面感知,重塑平台可靠、负责任的品牌形象。
4.3. 增强社交属性与社区信任建设,构建用户情感联结
传统二手交易平台通常以C2C作为交易主体模式,如果缺乏用户间的互动与情感维系,容易加剧交易中的不信任感。平台应突破单纯买卖的定位,主动构建具有高度粘性的社区生态,以此培育信任,提升用户忠诚度[13]。具体而言,可在APP内开辟独立的社区或论坛板块,鼓励用户分享闲置物品改造技巧、选购指南、防骗心得等有价值的内容。通过引入关注、点赞、评论等社交互动机制,促进用户间的交流与知识共享,形成一批具有影响力的核心用户(KOL)。对于交易成功的用户,可引导其发布“买家秀”或交易体验帖文,这些来自真实用户的内容远比官方广告更具说服力。平台还可定期举办主题征集、在线问答等社区活动,激发参与感。此举不仅能显著增加用户停留时长,更能在一个个真实的互动中潜移默化地构建起以共同兴趣和互助精神为纽带的情感联结与社区信任。这种基于社群的非正式监督机制,将成为平台官方规则之外的重要补充,有效抑制欺诈行为,营造温暖、可靠的交易氛围。
4.4. 推行个性化与智能化的信息推送服务
部分平台目前的信息推送机制往往过于泛化,未能精准匹配用户的个性化需求,导致大量无关信息淹没用户,使其错过真正感兴趣的商品,同时也降低了卖家的商品曝光效率。平台应充分利用大数据与人工智能技术,构建一套深度个性化的智能信息流与推送系统[14]。该系统需超越基础的关键词匹配,通过对用户浏览轨迹、停留时长、历史搜索、收藏及购买记录进行多维度深度学习,精准刻画每位用户的兴趣偏好、预算区间与消费习惯。基于此用户画像,系统不仅能为买家主动推送高度契合其需求的闲置商品,还能为卖家提供定价建议与最佳上架时间预测,并将其商品优先展示给最可能成交的潜在客户群体。同时,系统可设置智能提醒功能,如“心仪商品降价提醒”、“稀缺商品上架提醒”等,确保用户能及时捕捉关键交易机会。这种用户画像驱动的精准化服务,将大幅提升买卖双方的连接效率与交易成功率,从根本上优化用户的核心体验。
4.5. 健全隐私保护框架,筑牢安全信任防线
在数字化交易环境中,用户数据安全与隐私保护已不再是技术保障的附加项,而是维系平台存续与用户信任的关键[15]。二手交易平台汇聚了用户身份、财产、社交关系、行为偏好等海量敏感信息,一旦泄露或滥用,将造成无法挽回的声誉与财务损失。因此,平台必须超越零散的技术补丁,从战略高度构建一个贯穿数据采集、传输、存储、处理的全生命周期系统性隐私保护框架。同时,平台应积极引入前沿技术,在确保数据可用性的同时,实现数据的“可用不可见”,从根本上杜绝原始敏感信息的暴露风险。透明、可审计、技术驱动的安全体系能够向用户清晰传递其捍卫数据安全的决心与能力,有助于将隐私保护转化为一项显著的核心竞争力。
5. 结语
本研究通过LDA模型与情感分析相结合的方法,系统挖掘了二手交易电商平台APP的用户需求,并识别出质检、定价与售后三大核心议题。结果表明,用户对当前平台的服务整体持负面态度,尤其在售后支持方面存在显著信任缺口。未来,平台应致力于构建更透明的质检流程、更公平的定价机制以及更高效的售后保障体系,同时积极引入社区化运营与智能推荐技术,增强用户粘性与交易安全感。本研究不仅丰富了电子商务领域用户需求挖掘的理论方法,也为平台优化实践提供了方向。在后续研究中,仍可深入探究不同平台的用户需求特色,增加数据的收集量,从而进一步丰富和创新相关理论。