基于在线评论数据的用户感性需求挖掘研究
Research on User Kansei Demand Based on Online Comment Data Mining
DOI: 10.12677/SEA.2021.102008, PDF, HTML, XML, 下载: 630  浏览: 1,288  国家自然科学基金支持
作者: 袁 建, 吕 健*:贵州大学现代制造技术教育部重点实验室,贵州 贵阳;李媛媛:贵州大学机械工程学院,贵州 贵阳;万 露:华东计算技术研究所,上海
关键词: 感性工学在线评论数据用户感性需求需求挖掘Kansei Engineering Online Comment Data User Kansei Needs Requirement Mining
摘要: 为了满足用户日益增长的感性需求,提升产品的满意度,本研究基于在线评论数据进行用户感性需求的挖掘研究。首先,以产品在线评论为数据源,通过网络爬虫获取评论数据中的感性需求;然后,通过关键词提取算法和聚类算法采集在线评论中具有代表性的用户感性需求;最后,基于感性工学技术对用户感性需求进一步展开分析,进而推测出符合用户需求的产品特征。将本文所提的用户感性需求挖掘研究方法应用在智能手表的感性需求挖掘中,验证了该方法的可行性。文章所提的研究方法能够快速从在线评论数据中挖掘到用户真实的感性需求,为感性工学中感性数据库的构建提供全新的信息输入渠道。同时,也为其他传统工业产品的设计提供思路的借鉴和参考。
Abstract: In order to meet the increasing kansei needs of users and improve product satisfaction, this re-search is based on online review data to conduct research on user kansei needs. First, use online product reviews as the data source to obtain kansei needs in the review data through web crawlers; then, collect representative kansei needs of users in online reviews through keyword extraction algorithms and clustering algorithms, which are represented by adjectives; finally, based on the kansei engineering technology, further analyze the user’s kansei needs, and then infer the product characteristics that meet the user’s needs. The user kansei demand mining research method proposed in this paper is applied to the kansei demand mining of smart watches, and the feasibility of this method is verified. The research method proposed in the article can quickly mine the real kansei needs of users from online comment data, and provide a new information input channel for the construction of perceptual database in kansei engineering. At the same time, it also provides reference for the design of other traditional industrial products.
文章引用:袁建, 吕健, 李媛媛, 万露. 基于在线评论数据的用户感性需求挖掘研究[J]. 软件工程与应用, 2021, 10(2): 51-59. https://doi.org/10.12677/SEA.2021.102008

1. 引言

随着消费者情感性消费的不断增加,仅诉诸理性、逻辑和功能的产品不足以获得消费者的青睐。专家学者指出,将设计重点放在用户感性需求上,是使设计获得消费者青睐的必要途径 [1]。在当前产品设计领域,用户感性需求的研究主要包括需求获取及需求偏好分析 [2]。王玉婷等 [3] 基于市场、网络及书籍等渠道收集老年用户的需求,并综合聚类分析法、因子分析法及回归分析法对老年用户群体的感性需求偏好进行挖掘,从而获取影响老年浴缸设计的关键形态表现要素;苏建宁等 [4] 从用户的感性需求出发,提出了应用类目层次法、数量化I类和蚁群算法的产品造型优化方法。在上述研究中,用户需求的获取主要基于人工搜集,这种方式虽然能够较为全面的搜集用户感性需求,但通过该方式搜集需求意象词不仅费时费力,且获取到的用户需求相对滞后。为了解决这一问题,学者们开始尝试将产品在线评论数据引入到感性需求的相关研究中。宋君等 [5] 基于文本挖掘技术构建了一种产品设计综合评价模型,协助设计者从用户需求认知的角度进行设计实践;李少波等 [6] 以某电子商务网站的手机购物评论作为数据源,从在线评论中提取关键意象词作为用户需求项,并基于BP神经网络构建了用户需求与其需求偏好的映射模型,从而实现对用户需求的全面挖掘。

随着电子商务的高速发展和人们生活水平的显著提高,网络购物已经成为人们生活的重要组成部分。与此同时,人们越来越倾向于在网络上发表自己的购物心得及体验,这些评论不仅具有较强的实时性和客观性,且蕴含了大量真实且客观的用户感性诉求 [7]。基于此,本文以感性工学为导向,以用户对产品的在线评论信息为需求挖掘接口,综合网络爬虫、关键词提取算法、聚类算法等对用户感性需求展开挖掘研究。首先,基于网络爬虫获取用户对某产品的在线评论语料和图像;然后采用关键词提取算法从爬虫到的海量文本中提取关键的需求意象词;最后结合感性工学技术构建用户感性需求模型,有针对性地捕捉用户真实的情感偏好,从而为设计者的设计创作提供更准确的参考和指引。

2. 研究思路

本文在感性工学的基础上,从数据驱动的角度出发提出一种以感性工学为导向的用户需求挖掘研究方法,该方法整体研究思路如图1所示,主要内容包括:① 需求数据获取,基于网络爬虫获取某网站的产品在线评论文本及图像样本;② 需求意象词获取,通过TEXTRANK算法获取产品在线评论中的需求关键词,并对获取到的关键词进行排序,以遴选具有代表性的词汇;③ 需求挖掘研究,以图像样本为参考,对产品各构成特征进行分析并解构,采用聚类算法将用户需求与产品特征进行映射,从而生成设计指导方案。

Figure 1. Overview of research ideas

图1. 整体研究思路

3. 用户需求挖掘研究方法

3.1. 基于网络爬虫获取需求数据

网络爬虫是一种根据既定规则,自动从网上抓取数据的程序,其具有可定制化程度高、实施成本低廉、简便易行等特点,在各个领域中作为一种有效的数据获取手段被广泛使用 [8] [9]。网络爬虫的爬行策略一般可分为广度优先、深度优先、广度深度相结合三种,本研究针对用户感性需求获取过程耗时较长、获取到的需求意象词相对少的问题,采用深度优先的爬取策略实时获取产品在线评论数据中的需求数据,并以此作为用户需求分析的数据基础。如图2所示为本研究网络爬虫的运行流程。

Figure 2. Web crawler running process

图2. 网络爬虫运行流程

3.2. 基于关键词提取算法获取需求意象词

在感性需求意象词的提取过程中,通过关键词提取算法来获取文本关键词,能够快速提取大量文本的关键信息,从而提升感性意象词获取的效率 [10]。在本研究中,由于上述爬虫获取到的产品文本未进行标注,且文本量相对较大、领域较为集中,因此本研究采用无监督关键词提取算法进行感性意象词的提取 [11]。目前,较为常用的无监督关键词提取算法主要有基于词频的TF-IDF [12] 与基于图的TEXTRANK算法 [13]。由于本研究涉及的产品评论文本普遍偏短,文档信息复杂,而TF-IDF算法对文档信息较为敏感,更适用于长文本的关键词提取,因此本文研究采用基于图的TEXTRANK算法提取感性关键词。TEXTRANK算法公式为:

W S ( V i ) = ( 1 d ) + d * V j I n ( V i ) ω j i V k O u t ( V j ) ω j k W S ( V j ) (1)

其中, V i 为时所要计算的词汇, V j 为与词汇相关的词汇, W S ( V i ) W S ( V j ) 分别表示词汇 V i V j 的重要程度, I n ( V i ) O u t ( V j ) 分别为指向 V i 的词语集合、 V j 指向其他词汇的集合, ω j i ω j k 表示相应词汇之间边的重要性。

TEXTRANK算法通过式1对词汇的重要程度进行了定义,随后通过无监督的机器学习算法,分析输入文本中的词汇间关系,不断迭代优化并最终得到 W S ( V i ) 值,通过分析词汇的 W S ( V i ) 值的大小比较词汇的重要程度,从而实现需求意象词提取。

3.3. 用户需求映射模型构建方法

对于简单的公式,可以直接以文本方式输入;对于复杂的公式,可以考虑使用公式编辑器,或者将公式制作成图片后插入文中。编辑公式的过程中要特别注意减号与连字符的区别,前者较长,后者较短。

为精准挖掘用户多样化的需求偏好,构建具有普适性的需求映射模型,本研究提出一种用户需求映射模型构建方法,在感性工学的基础上,应用聚类算法将离散的产品特征与用户感性需求结合进行分析,从而获取能够指导产品设计的实施方案,具体方法如图3所示。

Figure 3. User demand mapping model construction method

图3. 用户需求映射模型构建方法

图3可以看出,本研究所提的用户需求映射模型可以分析不同用户对于同一需求的产品特征偏好,其描述内容主要包括以下三个方面:

1) 对于用户P1,Pi,Pn来说,其均对某产品有相同的需求K;

2) 对于任意产品来说,其均具有n个产品特征Fn,通常包括产品的形态、材质、色彩等要素,合理且全面地解构产品特征将有助于构建高质量的需求映射模型,从而更好地挖掘用户深层次的感性需求;

3) 通过聚类算法计算多位用户在同一需求下对产品特征F1,Fi,Fn情感偏好的相似程度,从而将多类用户对产品特征的同类偏好重新组合成为FA,FB,FC等,每组方案C1,C2,C3均代表者某类用户Pi的需求偏好或相似偏好,由这些产品特征组合成的设计指导方案可以涵盖并满足多数用户对某产品的同类需求 [14]。

在本研究所提的模型构建方法中,要将用户需求与产品特征进行映射,进行意象认知实验是获取用户需求偏好的必要环节 [15]。在此环节中,首先基于问卷有目的的甄选产品特征,然后记录每位被试者的选择结果,最后将被试者的选择结果进行参数化处理 [16],并将参数化处理后的数据输入到MATLAB软件中进行聚类处理,可得到多组产品特征的新组合方案。

4. 实例验证

4.1. 产品需求数据获取

本研究以“智能手表”为设计对象。使用scrapy工具定制网络爬虫,以某购物网站中智能手表大类的页面作为初始页面,爬取其中各型号手表的页面地址信息,将其存入商品页面地址库。然后从商品页面地址库中选取一款智能手表的商品页面,通过分析网页的页面元素以设定匹配规则,从中获取手表的评价文本、手表型号、手表图片、评论页面下一页地址,并分别存入产品评论文本库、产品图片库、商品页面地址库。之后进入所获得的评论页面下一页地址的页面,并再次执行上一步的页面分析步骤。当某款手表的评论页面下一页的地址为空时,停止该型号手表评论页面的循环爬取,从商品页面地址库中获取下一型号的智能手表评论页面,重复上述过程。设定爬取手表型号数量为10000,第2000条手表的评价页面爬取完成时停止scrapy爬虫,完成产品图像库与产品评论库的构建。所获得的部分评价文本共获取10104条评价;获取的部分产品图片共计2683张。

4.2. 基于TEXTRANK与感性需求的词汇提取

对文本进行预处理,删除其中的重复文本。由于用户感性需求一般通过形容词进行表达,为获取文本中的代表性感性需求词汇,对全体文本进行分词和词性标注,然后通过TEXTRANK算法分析其中形容词的重要程度,从而得到相应的需求关键词及其权重参数,表1所示为需求关键词排名前30的词汇列表。

Table 1. Demand keywords and their weights

表1. 需求关键词及其权重

4.3. 产品特征解构

本研究以爬虫获取到的产品样本库为基础,以产品与人的多感官信息交互为前提,依据Han提出的Human Interface Elements (HIEs)理论 [17],从产品硬界面、软界面出发,对智能手表产品进行全方位解构。解构结果如表2所示。

Table 2. Product features and catalog

表2. 产品特征及其目录

4.4. 基于聚类算法构建需求映射模型

为构建用户需求与产品特征间的映射模型,本研究开展了一项问卷调查,过程如下:

1) 实验目的:获取年轻用户对智能手表产品的需求偏好,构建用户需求偏好矩阵;

2) 实验步骤:本实验以权重最高的需求关键词“精致的”为目标需求,以37个产品特征目录为实验样本。首先,实验主导者告知被试者实验规则,被试者从可选要素目录中勾选出最符合自己偏好的特征, 其中每个特征目录均为单选项;然后,实验主导者向被试者发问,如果要设计一款智能手表,这款手表需要能带给您“精致的”感觉,您心目中这样一款产品应该由哪些特征组成。

3) 实验结果,回收有效问卷21份,被试者平均年龄为22.86岁,年龄标准差为1.65,其中男性10人、女性11人。考虑到获取的用户感性信息是定性变量,无法直接用于聚类建模,因此需要对这些定性变量进行参数化处理。此工作需要在Microsoft Excel软件中进行,设 B i ( m , i ) 为第i位被试者对第m个产品特征的选择,当第m个产品特征被第i位用户选择时,则 x = { B i ( m , i ) } = 1 ,否则为0,将试验结果按此规则进行赋值,从而得到j位被试者对所有特征目录下所有x值构成的输入矩阵T。在矩阵T中,定义第j位受测者的选择结果为行向量Xj,由n个选择结果组成,记为 X j = { X j 1 , X j 2 , , X j n } ,则所有被试者j对所有产品特征n的选择结果所构成的矩阵如下,其中j = 22,n = 37。

T = ( X 11 X 1 n X j 1 X j n ) (2)

将参数化处理后的需求偏好矩阵输入到MATLAB统计分析软件中,采用K-means算法和欧几里得距离测量两两特征间的距离。依据聚类中每组下的产品特征不宜过少的原则,分别将组数设定为2、3、4,一一分析其聚类结果的合理性,最终确定将产品特征分为3组,输出聚类计算结果,构建如表3所示的用户需求映射模型。

Table 3. User demand mapping model

表3. 用户需求映射模型

从产品特征在3组方案中的分布比例可以看出,聚类输出的结果理想,各类中的实例个数均衡,达到了预期效果。表3中列出了每组设计方案下各产品特征的均值和偏差值,能够说明被试者在某方案中选择产品特征的分歧程度,其中偏差值越趋近于零,表示该偏差值对应的产品特征越能代表该方案,如组一中的主体宽度为宽时偏差值最小,值得特别关注。通过对用户需求映射模型的分析,可得出符合用户需求偏好的关键产品特征组合,见表4

Table 4. Key product feature combination scheme

表4. 关键产品特征组合方案

根据这些产品特征组合方案,可快速推测各类用户对产品的需求偏好,从而为设计者能够设计出更加符合用户感性需求的产品提供设计依据。

5. 结语

本研究从产品的在线评论数据出发,在统计学、感性工学的基础上对用户的感性需求进行挖掘,为设计者获取有价值的用户需求信息提供了新途径。通过网络爬虫,设计者可高效、全面地获取用户的感性反馈;通过关键词提取算法,可快速筛选关键的需求意象词,为后续感性工学的实施奠定基础。本研究提出的基于在线评论数据的用户感性需求挖掘方法合理,并以智能手表为案例对该方法的实施流程进行了详细阐述,为产品设计提供了思路的借鉴和参考。然而本研究仍有局限,如意象认知实验的被试者主要是在校生,不同学历、职业、地区等因素可能会对实验结果产生影响。因此在后续的研究中,考虑适当地扩大被试者的数量和范围,为用户需求的挖掘提供更为客观的数据支持。

基金项目

国家自然科学基金《多维认知耦合驱动的产品设计过程情境演化建模方法研究》52065010。

贵州省科技厅自然科学基金:基于隐性知识转化模型的产品概念设计方法研究(黔科合基础[2018]1049)。

NOTES

*通讯作者。

参考文献

[1] Francalanza, E., Borg, J., Fenech, A. and Farrugia, P. (2019) Emotional Product Design: Merging Industrial and Engi-neering Design Perspectives. Procedia CIRP, 84, 124-129.
https://doi.org/10.1016/j.procir.2019.03.263
[2] 林丽, 郭主恩, 阳明庆. 面向产品感性意象的造型优化设计研究现状及趋势[J]. 包装工程, 2020, 41(2): 65-79.
[3] 王玉婷, 张守京. 老年浴缸设计中的感性要素研究[J]. 包装工程, 2020, 41(10): 168-174.
[4] 苏建宁, 王瑞红, 赵慧娟, 等. 基于感性意象的产品造型优化设计[J]. 工程设计学报, 2015, 22(1): 35-41.
[5] 宋君, 战洪飞, 余军合. 基于网络评论数据的产品设计综合评价模型的构建[J]. 计算机应用与软件, 2019, 36(1): 88-93+110.
[6] 李少波, 全华凤, 胡建军, 等. 基于在线评论数据驱动的产品感性评价方法[J]. 计算机集成制造系统, 2018, 24(3): 752-762.
[7] 刘蓓贝, 张融, 陈旭, 等. 基于大数据的产品色彩设计[J]. 包装工程, 2019, 40(14): 228-235.
[8] 任帅, 陆光. 基于在线评论的网络视频情感分类平台设计与实现[J]. 现代电子技术, 2019, 42(6): 170-174.
[9] 赵京胜, 朱巧明, 周国栋, 等. 自动关键词抽取研究综述[J]. 软件学报, 2017, 28(9): 2431-2449.
[10] 林丽, 张云鹍, 牛亚峰, 等. 基于网络评价数据的产品感性意象无偏差设计方法[J]. 东南大学学报(自然科学版), 2020, 50(1): 26-32.
[11] 常耀成, 张宇翔, 王红, 等. 特征驱动的关键词提取算法综述[J]. 软件学报, 2018, 29(7): 2046-2070.
[12] 张雪, 孙宏宇, 辛东兴, 等. 自动术语抽取研究综述[J]. 软件学报, 2020, 31(7): 2062-2094.
[13] 柳林青, 余瀚, 费宁, 等. 一种基于TextRank的单文本关键字提取算法[J]. 计算机应用研究, 2018, 35(3): 705-710.
[14] 周美玉, 龚丽娜, 刘飞. 聚类模型在感性设计中的应用[J]. 机械工程学报, 2008(7): 248-252.
[15] 师洁, 苏建宁, 李雄. 产品意象原型形态耦合优化设计研究[J]. 包装工程, 2019, 40(8): 47-53+129.
[16] 吕佳, 陈东生. 基于聚类算法的服装感性数据挖掘方法[J]. 纺织学报, 2014, 35(5): 108-112.
[17] Han, S.H. and Hong, S.W. (2003) A Systematic Approach for Coupling User Satisfaction with Product Design. Ergonomics, 46, 1441-1461.
https://doi.org/10.1080/00140130310001610928