1. 引言
随着科技的飞速发展和人们生活品质的不断提升,智能家居产品越来越成为智能时代居家必备产品[1]。其中,智能马桶以其人性化设计、便捷的使用功能和不断创新的科技应用,在消费市场的热度不断攀升。据奥维云网线上推总数据显示,2023年智能坐便器零售额为68.4亿元,同比增长10.0%;零售量为308万台,同比增长19.7%。在线评论作为消费者网购时做出购买决策的重要依据[2],其中蕴含着用户的真实需求[3]。因此,研究智能马桶的在线评价有助于企业把握消费者对智能马桶的功能、造型、品质等多个方面的期望和设想,从而为创造以消费者为导向的产品提供策略支撑。
2. 研究方法与数据处理
2.1. 研究方法
首先,利用网络爬虫技术获取京东商城相关产品的用户评价文本数据,数据清洗后利用jieba分词工具对文本进行分词处理;其次,使用Word2Vec对分词后的文本进行向量化训练,构建高维词向量空间,使得原本难以量化的语义关系得以数值化呈现[4];再次,运用LDA主题分析和余弦相似度算法,准确识别产品核心特征及核心特征与评价感性词汇的关系[5],并以此为依据计算每个产品特性的感性评价值;最后,着重分析了不同功能的用户情绪值,并结合产品特征感性价值的计算结果,为智能马桶的设计提供相应的产品改进建议。具体研究流程如图1所示。
2.2. 数据的采集与处理
本研究采用八爪鱼采集器从京东商城爬取在线评论数据,使用Excel进行数据清洗。智研咨询发布的国内智能坐便器竞争格局如图2所示。从市场竞争梯队看,国外科勒、TOTO等知名品牌仍牢牢占据市场第一梯队;国产品牌如九牧、箭牌等发展较快,智能坐便器生产线已初具规模,技术水平稳步提升,占据市场第二梯队;第三梯队主要是规模较小的国产品牌。
为确保所使用的文本数据具有全面性、代表性和可信性,本文根据三级梯队均衡选择TOTO、科勒、九牧、箭牌、恒洁、浪鲸、云米7个品牌共14件销量和评论数较高的代表性产品作为研究对象,最终筛选出10,092条有效数据,构成在线评论原始语料库,具体的智能马桶型号如图3所示。
Figure 1. Research framework
图1. 研究框架
Figure 2. Smart toilet brand echelon chart
图2. 智能马桶品牌梯队图
Figure 3. Smart toilet online review data description
图3. 智能马桶在线评论数据描述
2.3. 在线评论数据预处理
中文分词是进行中文文本处理最为关键的步骤,分词的质量直接影响着文本挖掘的结果[6]。由于在线评价文本中包含了大量例如“?、了、吧”等特殊符号和词汇,它们包含的有效信息有限,且高频率的出现会妨碍对其他重要词汇的挖掘,从而降低文本处理的效率[7]。因此,本研究使用哈工大停用词表对文本中无助于信息检索的超高频词汇进行停用处理。然后利用jieba分词工具进行中文分词操作和词性标注[8],按照词频排序的前20个形容词如表1所示。
Table 1. Top 20 adjectives and their word frequencies
表1. 排名前20的形容词及其词频
形容词 |
词频 |
形容词 |
词频 |
不错 |
2309 |
很棒 |
186 |
方便 |
651 |
很好 |
186 |
干净 |
547 |
完美 |
181 |
耐心 |
465 |
简单 |
170 |
强大 |
337 |
完全 |
163 |
合适 |
275 |
仔细 |
163 |
便宜 |
267 |
简洁 |
129 |
漂亮 |
265 |
愉快 |
127 |
光滑 |
260 |
完好 |
115 |
舒服 |
242 |
认真 |
111 |
2.4. 词向量模型的构建与验证
词向量有两种表示方式:独热(one-hot)表示和分布式(distribution)表示。独热表示法将词独立编码,不体现词间关系,当词汇量很大时会导致维度灾难[9]。分布式表示通常通过将词映射到一个较低维度的连续向量空间来实现,能使相似词在向量空间中相近。谷歌于2013年发布的Word2Vec模型是分布式词汇表示法的代表,它基于文本中离得越近的词语相似度越高这一假设[10],由跳字(Skip-gram)模型和连续词袋(CBOW)模型来计算词向量矩阵[11],两者的运算区别如图4所示。CBOW由上下文词来预测中心词,而Skip-gram由中心词来预测上下文词。相较之下,本文采用的Skip-gram在训练大语料和输出大维度词向量情况下,其总体准确性和语义、语法准确性上都更具优势[12]。
Figure 4. Two kinds of word vector models of Word2vec
图4. Word2vec的2种词向量模型
在线评论属于非结构化数据,需要将其表达为结构化数据后才能进行计算机处理[13]。本研究将预处理后的在线评价数据作为训练语料,采用gensim工具包的Word2Vec模块生成在线评价词向量空间。其中,词向量维度设置为20维,忽略总频率小于3的词汇,模型训练迭代次数设置为7,每次采样10个负样本,窗口大小设置为2,sg设置为1 (0为CBOW,1为Skip-gram),得到Word2Vec模型。
由于该模型属无监督训练,为验证词向量空间在捕捉语义关系方面的有效性,采用类比实验验证模型训练效果。词向量空间的类比验证通常是根据式(1)计算余弦相似度来实现。它是n维空间中两个n维向量之间角度的余弦,等于两个向量的点积(向量积)除以两个向量长度(或大小)的乘积[14],其值范围在−1到1之间。当两个向量的方向完全相同时,余弦相似度为1;当两个向量垂直时,余弦相似度为0;当两个向量的方向完全相反时,余弦相似度为−1 [15]。
(1)
通过调用已经训练好的模型实例,并将正面和负面词汇列表作为参数传入,实验获取了与这些标准最为匹配的词汇及其相似度分数,结果如表2所示。以表中首个类比为例,模型准确识别出与“冲水”和“舒适”正面语义相近,同时与“强劲”负面语义相远的词汇,如“坐上去”(相似度0.8420)、“坐”(相似度0.8218)及“如厕”(相似度0.8174),即该词向量空间在类比任务中展现出良好的性能。因此,该词向量空间在捕捉词汇间语义关系方面具备较强的有效性。
Table 2. Word2vec word vector model training effect
表2. Word2vec词向量模型训练效果
序号 |
输入 |
输出1 |
输出2 |
1 |
冲水-强劲 = ?-舒适 |
坐上去0.842 |
坐0.821 |
2 |
功能-全 = ?-好看 |
样子0.770 |
看起来0.765 |
3 |
水温-合适 = ?-热 |
座圈0.868 |
坐垫0.867 |
4 |
样子-好看 = ?-干净 |
下水0.910 |
冲刷0.889 |
5 |
TOTO-九牧 = ?-实惠 |
不贵0.874 |
超值0.868 |
3. 智能马桶用户评价分析
3.1. 核心特征提取
LDA是一种主题模型,它能够将若干文档自动编码分类为一定数量的抽象主题,并且每个主题可以由一系列相关的单词来表示[16],因此使用LDA来确定智能马桶的核心特征是一个合理的方法。在分析设置上,提取排名前1500个特征词语,人为指定主题数量为9,打印每个主题下面前15个词语,运行分析结果以及根据特征词语人为定义的主题名称如表3所示。
LDA可以通过多种方法来确定最佳的主题数,本研究选择困惑度(Perplexity)作为确定主题数量的参照标准[17],它表征了文档集合中的文档隶属于特定主题的不确定性。以10092条评价作为文档集合的困惑度得分如图5所示,观察可知,相关文本的主题数在K = 6时实现了困惑度最低,因而本研究选择以K = 6作为智能马桶核心特征的目标主题数。
利用训练好的词向量空间,对智能马桶的核心特征进行推断。通过计算9个主题词与“马桶”在
Table 3. Subject and feature word classification table
表3. 主题和特征词语分类表
主题 |
特征词语 |
#0 物流 |
物流、服务、产品、发货、速度、购物、服务态度、态度、卖家、高端、大气、速度快、商家、商品、五星 |
#1 品质 |
售后、马桶、问题、垃圾、联系、产品、结果、坑距、评价、配件、漏水、质量、收费、厂家、换货 |
#2 功能 |
专业、效果、声音、静音、服务、感觉、冲力、质感、力度、整体、省水、热情、节水、吸力、马桶盖 |
#3 售后 |
客服、商家、联系、服务、态度、问题、商品、购物、电话、保价、免费、下单、运费、时间、服务态度 |
#4 智能 |
马桶、功能、智能、水压、冲水、水箱、自动、冲洗、遥控器、问题、老人、座圈、普通、基本、水流 |
#5 品牌 |
品牌、马桶、质量、信赖、九牧、服务、颜值、恒洁、智能、箭牌、品质、釉面、朋友、态度、用心 |
#6 价格 |
价格、活动、感觉、实惠、实体店、质量、优惠、下单、不值、牌子、马桶、降价、正品、购物、性价比 |
#7 结构 |
考究、优雅、现代、精巧、透亮、触感、摸上去、讲究、粗糙、曲线、舒服、匀称、瓷质、真材实料、白亮 |
#8 外观 |
外观、马桶、体验、大气、美观、功能、设计、专业、大方、颜值、整体、细心、时尚、造型、材质 |
Figure 5. Confusion score
图5. 困惑度得分
向量空间中的距离,衡量这些要素与用户对智能马桶满意度的重要程度。具体采用式(2)的余弦距离作为度量标准,两个特征向量之间的余弦距离越小则表明它们的语义联系越紧密,相似程度就越高[18],越有可能构成智能马桶的核心特征。通过这种方法,能够基于词向量空间的丰富语义信息,系统地推断出与智能马桶最为相关的核心特征。计算结果如图6所示,距离最近的六个词汇分别是“智能(0.1382)”、“结构(0.2729)”、“价格(0.2782)”、“功能(0.2994)”、“品质(0.3182)”和“外观(0.3347)”,它们共同构成本次研究中智能马桶的核心特征要素。
(2)
Figure 6. Cosine distance results for core features
图6. 核心特征的余弦距离结果
3.2. 产品特征感性评价分析
情感倾向判断中,种子词是衡量其他词语情感倾向的一个参照物[19]。为准确选定与智能马桶核心特征相关的、具有明确情感倾向的种子词,本文结合感性工学中感性词汇的获取方法,选取了词频较高且能够准确描述6个核心特征的6对形容词作为感性评价种子词。根据情感极性的不同,又分为正向种子词和负向种子词,分别定义其情感强度为+1、−1,具体如表4所示。
Table 4. Perceptual evaluation seed words
表4. 感性评价种子词
核心特征 |
正向种子词 |
负向种子词 |
核心特征 |
智能 |
方便 |
麻烦 |
智能 |
结构 |
舒服 |
难受 |
结构 |
价格 |
便宜 |
太贵 |
价格 |
功能 |
强大 |
不足 |
功能 |
品质 |
不错 |
最差 |
品质 |
在文献[20]中,贾丹萍等人指出在词向量空间中,与种子词相似度在一定阈值范围之内的词其感性情感表达能力更强,并提出了一种依据非种子词与种子词的语义距离来确定情感强度的研究方法。基于这一理论,本研究结合训练好的词向量空间,根据智能马桶的6个核心特征获取关联度最高的感性评价词汇和词频,计算感性评价词汇与对应种子词的语义距离。文献[21]提供了如式(3)所示的基于情感强度和词频的感性评价值计算方法,式中:m和n分别为该产品特征正向感性情感词的数量和负向感性情感词的数量;Zi和Xi分别为该产品特征的第i个正向感性情感词的情感强度和词频;Pi和Yi分别为该产品特征的第i个负向感性情感词的情感强度和词频。基于智能马桶核心特征的感性评价值如表5所示。
(3)
Table 5. Product characteristics perceptual evaluation of value
表5. 产品特征感性评价值
核心特征 |
感性情感词 |
情感强度 |
词频 |
感性评价值 |
智能 |
便捷 |
0.8112 |
32 |
0.0835 |
好用 |
0.8724 |
36 |
纳闷 |
−0.7351 |
23 |
厉害 |
0.5833 |
11 |
不灵 |
−0.7510 |
3 |
结构 |
稳定 |
0.7630 |
13 |
0.0704 |
合理 |
0.7209 |
59 |
结实 |
0.6635 |
18 |
舒适 |
0.8780 |
111 |
不稳 |
−0.6090 |
3 |
价格 |
亲民 |
0.7473 |
19 |
0.1962 |
不值 |
−0.9337 |
18 |
不贵 |
0.8273 |
18 |
实惠 |
0.8184 |
65 |
小贵 |
−0.9611 |
7 |
功能 |
齐全 |
0.8594 |
39 |
0.0887 |
强劲 |
0.8867 |
43 |
太弱 |
−0.8090 |
2 |
流畅 |
0.8392 |
37 |
复杂 |
−0.7689 |
13 |
品质 |
很棒 |
0.8841 |
186 |
−0.1346 |
有名 |
0.7005 |
5 |
蛮好 |
0.7035 |
13 |
很差 |
−0.8338 |
7 |
很烂 |
−0.7157 |
5 |
外观 |
简洁 |
0.9344 |
129 |
0.3347 |
精致 |
0.8401 |
87 |
|
柔和 |
0.6143 |
7 |
|
笨重 |
−0.5484 |
4 |
优雅 |
0.7210 |
6 |
3.3. 整体评价分析
核心特征及其感性评价值如图7所示。该图直观地显示了智能马桶的用户关注核心特征及其感性评价值,图中外观(0.3347)和结构(0.1962)的感性评价值最高且为正向,说明用户对其持正面评价且较为满意;其次是功能(0.0887)、品质(0.0835)和智能(0.0704),用户对这几个方面尚且满意,但依然有很大的发展空间;价位(−0.1346)数值为负,表命用户对智能马桶的定价持负面评价。
Figure 7. Core characteristics and their perceptual value
图7. 核心特征及其感性评价值
4. 产品改进分析
4.1. 精准强化功能和智能水平
家具智能化归根结底是使得家具产品为人服务[22],然而在用户感性评价中“智能”和“功能”两个词汇得分均较低,传达出当前市面上的智能马桶存在智能化功能过于鸡肋,且功能也不成熟的困境[23]。为进一步分析智能特征感性评价值不高的原因,本研究对智能马桶的几个核心智能功能进行情感分析。利用台湾大学NTUSD词典和知网Howne这两个通用行业词典,对每条评论数据进行情感倾向的判断,并计算出每条评价的情绪得分,情感分析结果如图8所示。
通过剖析当前市面上主流的智能马桶功能,选取“自动翻盖”、“妇洗”、“臀洗”、“自动冲水”、“遥控”、“烘干”、“加热”及“抑菌”作为研究重点,并作为筛选词来定位数据源,分别计算对应评价文本的情绪得分均值以及正面评价占比,结果如图9所示。
加热、抑菌、烘干和妇洗的情绪得分排名为前四位,但其正面评价占比却不高。原因是这些功能在获得较高正评分的同时,也伴随着数量较多、但整体分值并不太低的负评分。研究分析后得出以下结论:首先,加热、妇洗等功能对特定人群的需求有极强针对性,且能在特殊使用场景下为用户带来优质使用体验,即便部分用户对这些功能持保留态度,也不会引发强烈的负面情感反应。其次,抑菌功能虽然用户无法直接感受到其效果,但在大多数用户的常识中,马桶内存在着大量的细菌,因此它被视为一项很有必要的功能。最后,烘干功能作为妇洗和臀洗功能使用后的一个环节,同样能够显著提升用户的使用体验。
Figure 8. Sentiment Analysis Table (Part)
图8. 情感分析表(部分)
相对而言,自动翻盖、遥控、臀洗和自动冲水功能的情绪得分较低。结合评价文本分析发现,技术实现的复杂性、用户体验的不佳以及个性化需求未满足是关键原因。例如,自动翻盖技术可能受传感器精度、环境因素以及不同用户的体型、动作习惯等差异影响,导致误判或延迟,导致不如手动操作来得方便和习惯;遥控操作界面的复杂性和用户学习成本的增加可能是影响情绪得分的重要原因;臀洗功能的出水方式、水温控制、清洁效果以及不同用户对臀洗功能的接受程度等因素增加了该功能满足用户需求的难度;自动冲水则可能无法准确识别用户的冲水需求而影响使用效果。
综上所述,企业在开发和推广智能马桶时,应根据不同市场和消费群体的实际需求进行精准定位和功能筛选,避免盲目追求智能化而忽视实际效用。同时,要不断加强技术研发投入,只有加强智能技术这一核心竞争力,才能帮助企业打造出独特的产品功能和服务,从而实现品牌差异化,提升消费者对品牌的认知度和忠诚度。
4.2. 持续优化外观和结构设计
在心理学中,产品外观是消费者首先接触并形成第一印象的关键因素,外观形象给消费者带来的“首因效应”将直接影响其对产品其他要素的评价[24]。通过分析用户评价可知,大部分用户满意于智能马桶的外观。相较于传统马桶带有一个明显的水箱,智能马桶采用了更先进的技术来实现冲洗功能,因而取消了水箱的设计,使智能马桶在产品外观设计上更为简洁流畅和现代化,更符合当代审美趋势。企业必须重视智能马桶的外观设计研究,结合感性工学、美学、心理学等多学科理论,以优秀的外观设计塑造积极的产品第一印象,增强消费者的购买意愿[25],从而为其后续的使用体验打下良好的基础。
智能马桶的结构设计对用户的使用便捷性和舒适度具有直接且深远的影响,是消费者在使用过程中直接感受到的特征。合理的外部结构设计需要综合考量产品的颜值和用户的使用体验,如产品造型和
Figure 9. Mood scores for different functions
图9. 不同功能的情绪得分
座垫在运用科技感曲线进行设计的同时,还需考虑是否符合人体尺寸的维度。相应的,内部结构是否合理也是重要环节。如智能马桶具备的座垫加热、烘干、臀洗等多种功能的实现都依赖于内部复杂的电路系统和元器件。随着智能马桶功能模块设置的增加,如果内部结构设计不合理,不可避免地会出现控制电路繁复、内部结构拥挤、输出功率不足等难题[26],电路短路、元器件损坏等一系列影响智能马桶使用的问题往往会在用户使用过程中立即显现出来,从而对顾客满意度产生显著影响。因此,企业应平衡产品外部结构的颜值与用户体验,优化加固内部结构,做好智能马桶美观性与实用性的平衡。
4.3. 实现定价与品质的合理匹配
图中品质特征的感性评价值偏低,而价位特征更是陷入负值区间,这一现象揭示了一个关键问题:智能马桶的品质未能与其价格相匹配,已成为阻碍其市场发展的主要障碍。智能马桶是典型的不尖端但很复杂的产品,功能繁多,其研发需要高额的资金成本投入[27]。高投入导致高售价,对于预算有限的消费者群体而言,他们更倾向于选择经济实惠且功能实用的传统马桶。同时,智能马桶复杂的功能设计也可能增加其故障率和维护难度,给消费者带来额外的经济和时间成本。根据DoNews的消费者调研数据,许多终端导购在阐述不同价位智能马桶功能差异时表现乏力,这也从侧面反映了智能马桶在性价比方面的不尽如人意。具体来看,具备臀洗、自动烘干等基本功能的智能马桶价格通常位于3000至5000元区间,而更高端的如配备泡泡盾功能的智能马桶则标价5000元以上。面对这样的市场现状,企业迫切需要调整成本控制策略,将资源集中于提升消费者关注的核心特性和性能,创造出价格较低、品质更高的本土智能马桶品牌[28]。
5. 结语
近年来,随着消费不断升级,智能马桶越来越受到消费者的喜爱。然而,通过对智能马桶的在线评论进行文本分析和感性评价后发现,当前市面上的智能马桶产品仍存在诸多亟待解决的问题,如功能同质化严重、实用性不足、价格虚高导致的性价比失衡等。针对这些局限性,本文提出了智能马桶未来研究与发展的三大方向:一是精准强化功能与智能水平,确保每一项功能都能切实解决用户的痛点,提升使用体验;二是持续优化产品的外观与结构设计,以满足消费者对美学与舒适度的双重追求;三是推动定价与品质的合理匹配,让智能马桶真正成为物有所值的家居必备品。这些建议旨在为智能马桶行业的未来发展提供有价值的参考,期望能为推动该领域的创新与进步尽一份绵薄之力。
注 释
文中所有图表均为作者自绘。