1. 引言
国家卫生支出自2014年的35312.4亿元飞速增长到2022年的85327.49亿元,这一显著变化彰显了卫生行业在民生领域的核心地位。在卫生行业的诸多领域中,医疗与康养最为关键,涵盖了从疾病治疗到健康养护的全周期服务。护理床作为医疗与康养领域的重要辅助器具,在提升医疗服务质量及满足康养需求方面发挥着不可替代的作用。当前护理床相关的研究虽有进展,但仍存在诸多不足,特别是在用户需求探索方面,用户评论这一关键数据来源并未得到充分挖掘与分析,其在一定程度上限制了护理床设计的优化与创新。
医疗方面,优化医疗辅具设计的目的多为提高医疗服务质量。例如Zhiyong Zhou等[1]通过结合感性工程、眼动追踪和脑电图的方法来优化医疗护理床设计,使医疗护理床的操作更加便捷。王时惠等[2]提出了以医疗护理床为中心的ICU患者温控人机智能协同系统,以降低患者生命健康风险。
康养方面,辅具的安全性、功能性、用户体验感(图1)、美观性等问题都应被关注[3];与此同时,人口老龄化带来的老年护理问题,使得适老化辅具——尤其是智能适老辅具发展存在必要性[4]。优化康养辅具设计的目的是多样化的,包括增加患者舒适度、满足患者多样化需求等。现有的康养护理床设计研究多集中在功能与结构形态方向。其中涉及的护理床功能多为起背与便孔,例如潘澳等[5]设计一种新型抬背机构,减少护理床抬背过程中给使用者造成的压背感;孙学斌等[6]设计一种新型单自由度八杆起背机构,提高可分离式护理床椅的舒适性与稳定性;潘国新等[7]设计一款辅助大小便护理的新型护理床,保证了护理床坐姿变换过程中病人的舒适性和安全性。结构形态的研究例如李翠玉等[8]设计了一款适应家庭环境的多功能康养护理床。然而在当前护理床相关研究中,虽然有使用到访谈与问卷方法,例如朱琳等[9]结合感性工学理论进行社会调研,使用多种产品设计方法输出了一款护理床设计图,但是用户评论作为用户体验数据的一大来源,并未得到充分的利用和分析。
目前应用于文本挖掘的技术,主要有传统机器学习和深度学习方法。传统学习方法中,较常用到的方法包括朴素贝叶斯等单一模型或集成算法,例如Zhi Li等[10]开发了一个结合朴素贝叶斯和情感词典的弹幕视频情感分析方法,有效地分析弹幕评论中的多维情感;李高翡等[11]将分裂粒子群优化算法与集成学习相结合,用于优化文本情感分析中基分类器的权重分配,使模型达到了92.29%的精确度。深度学习常用到循环网络、卷积网络和预训练模型等,例如刘星等[12]将ResNet结合入LSTM网络,在高效分析长序列数据的同时,缓解深度学习中梯度消失的问题孔繁钰等[13]提出了一种结合改进双向长短期记忆网络(Bi-LSTM)和Word2Vec词向量的评教文本情感分析方法,创新性地解决了深度学习中的网络退化问题,并通过语法规则增强了模型的鲁棒性;闵洁等[14]通过融合CTM模型和Bi-LSTM网络,捕捉到了文本中的深层次情感信息;李俭兵等[15]提出了一个引入跳转机制的LSTM-CNN模型,通过两层感知机在处理Twitter文本时,动态决定是否跳过某些单词,提高了模型效率;张国方等[16]通过结合依存句法分析和BERT预训练模型,实现了从用户评论中提取产品特征和情感倾向;何传鹏等[17]提出了BL-LABL模型,结合BERT和Loc-Attention机制,以及Bi-LSTM,不仅考虑了文本中的语义信息,还结合了文本结构和主题词的位置关系;Shunxiang Zhang等[18]构建了一个基于ELECTRA模型的混合神经网络,通过替换BERT模型使用ELECTRA模型,避免了传统预训练模型在掩码训练和微调过程中的不一致性问题。这些技术的发展为深入挖掘用户评论数据提供了有力支持,但在护理床用户需求研究中的应用尚不充分。
综上所述,本研究聚焦于康养辅具设计中的用户需求探索,特别是护理床这一关键辅具。通过基于用户评论数据,运用Stacking算法集成传统机器学习与深度学习方法,深度挖掘护理床用户的需求,不仅能够弥补现有研究的不足,为护理床设计的优化提供精准依据,还能为其他康养辅具的设计优化提供有益参考,具有重要的理论意义和实践价值,有望推动康养辅具设计向更加人性化、智能化的方向发展,更好地满足日益增长的康养需求,提升患者的康养体验与生活质量,这对于促进康养产业的高质量发展、应对人口老龄化挑战具有深远的战略意义。
2. 数据获取与预处理
实验环境依托Windows 10的操作系统,使用Jupyter Notebook和Pycharm IDE,运行Python 3.9来搭建实验平台。对比各个网络购物平台中护理床产品的评论页,京东的用户评论数据较为优质,即数据充足、真实性高、刷单行为少,故将其作为数据来源。
2.1. 数据获取与筛选
Figure 1. Price distribution and categories of nursing beds
图1. 护理床价格分布情况以及护理床类别
使用Pycharm编写爬虫,以护理床为关键词,爬取了综合排名前40的护理床产品参数,及其评论数据共7737条,以保证数据代表性。使用Jupyter notebook进行数据的统计性分析并绘制图1,价格存在离群值,且存在非医疗器械与护理床配件商品类别。
鉴于产品存在迭代、评论有时效性,选取2022~2024年的数据;为保证数据的可靠性,剔除价格中包含离群值的样本,去除非医疗器械与配件相关评论,仅保留电动护理床评论,并删除无效和默认评论。最后留存2561条评论文本,对其评论时间进行可视化,由图2可知护理床的评论数量存在随时间缓慢增长的趋势,也印证了护理床是不可或缺的医疗辅具,其用户数量可能还会进一步提升,意味着其设计优化迫在眉睫,且类比可得相关的康养辅具可能存在相似的趋势。
Figure 2. Time distribution of nursing bed reviews between 2023 and 2024
图2. 在2023~2024年间,护理床评论时间分布情况
2.2. 数据预处理
首先需要对评论文本数据进行情感极性的再标记。可能由于文化环境或平台限制等因素,评分为1的差评占比极少,仅约1%,而好评中反而提出不少产品缺陷。故随机选取1/2的数据集,由两人进行双盲标注,以用户是否提出产品缺陷不足为标准,将数据标记为积极与消极两类。两组标签一致度为95.52%,保留标签一致的数据共1,172条作为训练数据。
其次,采用分层抽样的方法,从训练数据中划分出占比0.3的样本作为测试集,用于测试各模型的分类性能,剩余部分保留做训练集。
接着对训练集进行非平衡处理。经过再标记的数据集中,提到过产品不足的评论占比为9.63%,仍然是不平衡数据,因此采用SMOTE过采样的方法处理训练集,得到一个含有1482条样本的训练集,且积极与消极标签分别占比1/2。
然后对训练集、测试集、无标签数据集进行分词、删除停用词、文本向量化操作。评论有口语化的特点,适用Jieba分词。结合百度停用词表和哈工大停用词表,并自定义部分停用词诸如“护理床”、“京东”等,以避免此类冗余词汇干扰模型性能,对文本数据进行了停用词过滤操作。采用TF-IDF (Term Frequency-Inverse Document Frequency)方法将文本向量化,该方法是一种特征提取方法,用于衡量词语在文档中重要性,由两部分组成:TF(词频)表示词语在文档中出现的频率,IDF (逆文档频率)表示词语在语料库中的稀缺性。两者相乘得到的值越高,词语对文档的区分能力越强。虽然其无法捕捉语义关系且对长文档不够鲁棒,但其存在计算效率高的优点。此外,文本向量化过程中自定义了不可分割词汇,诸如“可曲腿”、“电动起背”等,以免错误分割导致的词汇误解。分词并删除停用词后,可能产生新的空值评论数据,再次删除空值后共保留了2454条评论文本数据。
Figure 3. Word cloud of nursing bed attributes (Left) and reviews (Right)
图3. 护理床属性词云图(左)和护理床评论词云图(右)
绘制商品属性和评论分词结果的词云图如图3可知,电动护理床的商品更倾向于多功能化;且用户多为老人,更在意质量、安装等售后服务以及功能性和实用性。这也验证了在社会老龄化的大背景下,对康养辅具设计的优化有重要意义,且辅具的适老化、多功能化和智能化是其发展迭代的必经之路。
最后,将预处理过的数据保存到array文件,保证后续模型训练所使用的数据的一致性。
3. 集成算法模型构建
分别构建多个传统机器学习模型与深度学习模型,对其进行穷举调参。为了充分发挥传统机器学习模型和深度学习模型各自的优势,将所有调参后的模型作为Stacking算法的基分类器,并选择逻辑回归(LR)作为元分类器,输出最终的分类结果。
3.1. 传统机器学习模型
除了一些众所周知的英文缩写,如IP、CPU、FDA,所朴素贝叶斯算法(NB)、决策树(DT)、随机森林(RF)、梯度提升分类器(GBT)、极端随机树分类器(ERT)、支持向量机(SVM)共6种机器学习方法被纳入考量。使用训练集数据,分别训练6个模型,并使用网格搜索法寻找出最佳参数,如表1所示。
Table 1. Optimal parameters of traditional machine learning models
表1. 传统机器学习模型最佳参数
模型 |
参数名 |
参数值 |
参数含义 |
NB |
alpha |
0.01 |
进行较强的平滑处理 |
DT |
criterion |
gini |
节点分裂准则,使用基尼不纯度 |
splitter |
best |
寻找最佳分裂的策略 |
max_depth |
50 |
树的最大深度,防止过拟合 |
RF |
n_estimators |
100 |
森林中决策树的数量 |
criterion |
gini |
节点分裂准则,使用基尼不纯度 |
max_features |
log2 |
在寻找最佳分裂时要考虑的特征数量 |
GBT |
criterion |
friedman_mse |
分裂节点的标准为最小化均方误差标准 |
learning_rate |
0.2 |
学习率 |
max_depth |
7 |
树的最大深度 |
n_estimators |
200 |
模型中树的数量 |
续表
ERT |
criterion |
gini |
节点分裂准则,使用基尼不纯度 |
n_estimators |
200 |
模型中树的数量 |
max_features |
log2 |
在寻找最佳分裂时要考虑的特征数量 |
SVM |
kernel |
poly |
决策边界 |
C |
1 |
正则化参数 |
gamma |
scale |
核函数的系数,根据数据自动调整 |
采用最佳参数模型,分类测试集数据,计算各模型真正例率和假正例率,并绘制相应ROC曲线,如图4所示。由此可知,决策树的分类性能明显逊色,而其他模型性能较优且相差不大。因此,将采用NB、RF、GBT、ETR、SVM共5个算法,作为Stacking模型的部分基分类器。
Figure 4. ROC curve of traditional machine learning models
图4. 传统机器学习模型的ROC曲线
3.2. 深度学习模型
由于循环神经网络擅长处理序列数据且能够捕捉时间依赖性[19],且长短时记忆网络(LSTM)作为一种特殊的循环网络,可以解决自身梯度消失的问题,使得LSTM网络十分适合用于自然语言处理。因此,选择LSTM网络模型作为Stacking算法的基分类器之一。
对LSTM网络模型进行调参。使用交叉熵损失函数和Adam优化器训练模型,将隐藏层数、学习率等参数设置为超参数,并使用网格搜索方法自动调参。为了找到模型最佳阈值,在LSTM模型预测概率的基础上,通过比较不同阈值下的接收者操作特征曲线(ROC)下的面积(AUC)来确定最佳阈值。
在模型训练过程中多次出现梯度爆炸,表现为损失函数突然剧烈增大,导致LSTM模型不能正常输出预测结果。因此,对LSTM中隐藏层的参数,进行了正交初始化;此外在LSTM模型中进行了梯度范数截断操作,将模型参数的梯度限制在一个最大范数内,如果梯度的范数超过了这个值,便按比例缩小梯度。经过改进的LSTM模型,在一定程度上克服了梯度爆炸问题。
最终求得最佳参数如表2所示。
Table 2. Optimal parameters of long short-term memory (LSTM) neural networks
表2. 长短时记忆神经网络最佳参数
参数名 |
参数值 |
参数含义 |
input_dim |
X_train_tensor.size(2) |
输入数据的维度,等同于各时刻的特征数量 |
hidden_dim |
128 |
隐藏层节点数 |
out_dim |
2 |
输出层的输出维度 |
num_layers |
2 |
隐藏层数 |
bidirectional |
True |
设置为双向LSTM神经网络 |
dropout |
0.1 |
遗忘率 |
learning_rate |
0.001 |
学习率 |
threshold |
0.5 |
阈值,用于分类决策 |
3.3. Stacking模型
将上述5个传统机器学习模型和LSTM模型的分类结果,作为Stacking算法元分类器的输入数据,并评估其在测试集上的性能,达到了90.34%的准确率。
最后,使用Stacking模型,对剩余1284条无标记的数据进行情感极性的分类。将含有人工标记的数据以及含有Stacking模型分类结果的数据合并,共得到2454条护理床评论数据。其中消极评论共127条,占总评论数的5.18%,因此总体而言,当前购买者对于护理床产品可能是相对较为满意的,但护理床产品依旧存在一定改进空间。
4. 用户需求分析
使用Stacking集成算法模型,可将护理床相关评论文本分类为消极和积极两类。其中积极评论,理应指向购买者已被满足的需求,即商品某些特质已被用户认可;反之消极评论,应指向购买者未被满足的需求,即商品存在缺陷的部分。因此,LDA方法被用于提取消极评论的主题关键词,针对性地分析并总结护理床购买者所未被满足的真实需求。
Table 3. Review keywords
表3. 评论关键词
主题 |
评论主题关键词 |
商品质量 |
结实、设计、不合理、高低不平、护栏、气垫、功能…… |
物流速度 |
急用、隔天、不确定、物流时效、道歉、到不了、怎么办…… |
商品包装 |
防褥疮垫、一起发、交流、记录、原因、奇怪、白纸黑字…… |
退换渠道 |
拆完再打包、闹剧、投诉、七天无理由退款、流程、混乱、退不掉、恶心…… |
售后服务 |
不包安装、视频、自查自纠、断电、自营、失败、体验、客服…… |
LDA是一个生成统计模型,其假设文档中的每个词都以一定的概率代表一个主题,并且通过一个三层的层次贝叶斯模型,分析了各个词汇属于不同主题的组合[20]。使用LDA模型提取主题关键词,通过调整相应参数,令该模型将所有差评关键词分类为5个主题,通过观察分析各主题的关键词发现,这5个主题分别侧重于:商品质量、物流速度、商品包装、退换渠道、售后服务,各主题涉及的部分关键词如表3所示。
物流包含的因素包括送货时间、商品可用性、信息质量、产品质量和状况、退货物流(逆向物流)、客户关怀、运费和付款方式等[21]。因此,除商品质量外的剩余4个主题,都可以被归类为物流问题。综上,用户需求可被分割到物流和产品两方面。
4.1. 物流问题分析
Table 4. Selected comments for each dimension of the 7Rs
表4. 7Rs各维度相关评论
7Rs理论维度 |
维度解释 |
部分相关评论文本 |
Right Product |
产品为顾客所期望的 |
1. 照片和货一点也不一样。 |
2. 视频与实物差距太大,东西质量真差。 |
3. 发货和订单不一致,一直不给更换。 |
Right Quantity |
产品数量确切 |
1. 护栏没有发。 |
2. 放便盆的篮子少根支条不能用。 |
3. 寄漏了螺丝。 |
Right Quality |
产品满足顾客质量要求 |
1. 粗制滥造,而且有很多快口的安全隐患。 |
2. 电机功能紊乱。 |
3. 质量太差了,运输过程直接破裂。 |
Right Place |
送达顾客指定地点 |
1. 没收到货无法评价。 |
2. 送货安装服务就是摆设。 |
3. 送到楼下一看没有电梯扔下就走,后来联系客服说再让回去上门,结果回来看了看又跑了。 |
Right Time |
在顾客期望时间内交付 |
1. 洗头盆未寄,延期送货。 |
2. 让售后人员加急发一下,也是不慌不忙的搞一个星期。 |
3. 延迟两天配送,怎么催都没有用。 |
Right Price |
产品与服务的价格合理 |
1. 因其它原因在下单第二天申请退货,卖家以已发货不能中途拦截。最后扣了我334元邮费!!! |
2. 让他们拆需要先行支付150元拆卸费。 |
3. 取件就要支付几百块打木架费用! |
Right Information |
产品与物流状态信息准确 |
1. 售后无法沟通,京东物流无法沟通。 |
2. 外婆瘫痪在床,满身都是褥疮,所以才想到帮买个有防褥疮气垫的护理床,特地还问了客服有没有防褥疮气垫,客服发了个连接给我,我按照他发的连接下单,结果是没有防褥疮气垫的。 |
3. 买的时候说急用显示7号到,问能到吗,说7号能到,还反复确认过可以到吗,客服说可以,然后我看物流觉得7号到不了,6号的时候我就问客服,问几号到,然后说不确定按物流时效。 |
京东作为一家综合性电商平台,拥有物流子公司——京东物流,京东自营商品通常由京东物流进行配送。京东物流作为典型物流企业,物流服务质量(Logistics Service Quality, LSQ)管理,是其整体营销重要的组成部分[22]。7Rs理论是一种经典的物流服务质量评估框架,其核心在于确保企业在物流服务过程中能够满足客户的期望,具体包括如下7个维度。
综合7Rs理论与用户评论,如表4可知:电动护理床存在实物与图不符、产品零部件缺失或缺少、产品质量不达标、物流配送时间与地点不正确、产品与服务收费不合理、产品与物流信息不准确的问题。
通过访谈多位护理床用户及其家属,也可以印证这些现象。护理床产品存在照片或视频与实物不符的情况,违背了Right Product维度。护理床零部件存在少发或漏发的情况,违背了Right Quantity维度。而护理床由于质量与体积较大,配送员可能只将其送至代收点或楼下,给用户取件增加难度,违背了Right Place维度。其次,护理床往往是紧急需求,失能者陡遭意外伤害或者被迫出院时,亲属需要购置护理床以照料病患。若物流延迟,则会打破患者的诊疗计划并增加亲属的照料难度,因此护理床的购置者往往较为在意物流速度,印证了Right Time维度的重要性。同时,用户诟病无人上门安装,且实物与视频不符,无法自行安装,或专人安装需额外收费等问题,违背了Right Price维度。除此之外,部分护理床由于体积或重量限制问题,会选择将床垫与床架分成多个包裹寄出,而购买者对此并不知情,也违背了Right Information维度。
7Rs理论也存在不足,其未涵盖逆向物流服务的概念。逆向物流对顾客满意度和忠诚度都有显著的正面影响,便捷的退、换货服务能够增加顾客的信任和满意度[21]。而京东的一部分护理床产品虽然标注了七天无理由退换货,但在实际退换流程中可能受阻,而商家常见的拒绝理由为“安装后禁止退换货”。用户在床架安装后,发现实物与商品图不符,即便自行拆解后装入原包裹内,其退货需求依旧不被受理。
4.2. 产品问题分析
针对Right Quality维度进一步分析商品质量问题,所涉及主题的关键词大致被分为产品设计和产品材质两类。同时,评论所聚焦的视角可以分成床架和床垫两部分。基于此,对商品质量问题的分析如下:
(1) 产品设计不合理
床架的设计问题包括:床架过高,用户无法自主下地;便孔无用,一方面是尺寸单一,用户体型稍大就不适配,另一方面是便孔位置塌陷,易造成褥疮;护栏过短,头部与足部无护栏,且放下后护栏高于床面,照顾者无法坐在床边;底条过低,无法部署移位器;部件不兼容,尺寸不适配,无法安装。此外,智能产品还存在语音提示过响,打扰睡眠的情况。床垫的设计问题包括:床垫过窄,无法覆盖床面;系带易断,难以固定。
(2) 产品材质不适用
床架的材质问题包括:架构松散,坐卧产生噪声与摇晃;材料单薄,多部件易因外力弯折;漆皮脱落。床垫的材质问题包括:床垫过薄,硬床因压力分布不均更易造成褥疮;气垫过滑,用户起坐不便;棉垫过软,易凹陷。
5. 结语
通过构建一个基于Stacking算法的集成模型,本研究成功地对护理床用户的网络评论进行了情感极性分类和需求挖掘。研究结果表明,通过精心设计的数据处理流程和模型调参,能够实现90.34%的分类准确率,有效地从用户的消极评论中提取出关键的用户需求信息。模型分类结果显示,护理床评论中约5.18%含有消极情绪或提出未被满足的需求,护理床产品及其物流服务可能存在一定优化空间。
消极评论的主题分析结合7Rs理论与逆向物流概念,揭示了用户对护理床产品存在8个未被满足的需求:正确的产品、正确的数量、正确的质量、正确的地点、正确的时间、正确的价格、正确的信息、便捷的逆向物流。这些发现为护理床的设计优化、物流服务改善和用户体验提升提供了宝贵的用户反馈。未来研究可以进一步探索如何将这些用户反馈具体应用于护理床的产品设计与物流服务改进中。综上,要想进一步提高用户体验,商家或可采取例如通过增强物流合作、优化商品包装、简化退换流程、提升商品质量和改善售后服务等措施。随着技术的进步和用户需求的不断变化,持续的用户反馈收集和分析将是产品创新和市场竞争力提升的关键,而在线评论始终可以作为一个可靠的反馈数据来源。此外,本研究的方法论可以扩展到其他医疗辅具产品,以更全面地理解用户需求,推动医疗康养产业的发展。
NOTES
*通讯作者。