1. 引言
随着社会的发展和管理决策问题的复杂化,由单人或小群体专家做出的决策结果越来越难以满足社会大众群体的需求。而群体决策能够充分利用不同领域专家的意见,其决策结果更容易被大众接受 [1] [2] [3]。此外,现代化的信息技术改变了传统的决策方式,社会公众可以通过网络平台交流信息、发表意见,例如商品评论、旅游游记等UGC (User-Generated Content, UGC)信息。这些用户生成内容是消费者使用产品或享受服务后的体验感受,对产品或服务的评价更加真实可靠,成为众多现实决策问题的信息来源 [4] [5] [6]。
目前已有许多学者研究如何利用在线UGC评论构建多属性决策框架,对备选商品进行排序 [7] [8] [9] [10]。与传统决策的结构化评价不同,在线评论比较复杂,用于多属性决策时其属性及评价意见需要从文本中挖掘。相关研究中方案属性的提取仍然依赖人工确定,且对评价意见的计算粒度较粗 [8] [10],容易造成属性维度抽取不够全面和情感信息的丢失。此外,现有方法通常将抓取的所有评论信息统一看待处理,构建评论用户关于产品的整体评价矩阵。然而,互联网由于更新迭代快且信息数量呈现爆炸式增长,用户生成内容无论多好,都有其时效性和流行性,时间久远的UGC数据越不容易被用户选择,且对于决策的参考价值会大大降低。一般来说,UGC内容会受到用户和产品两方面因素的影响。以旅游UGC为例,一方面,游记内容会随着目的地的更新而不同,比如目的地增加了旅游项目或是改进了活动体验,对应的游记内容会与以往的不同。另一方面,旅游者的需求是不断变化的,对目的地的要求与体验评价会随之改变,这些变化都将反映在游记中。因此,从不同时段的UGC中获得的决策信息对当前的产品决策参考价值是不同的,需要分别处理。
综合考虑文本信息的复杂性与UGC文本的动态变化性,本文提出基于UGC的动态群体多属性决策方法。首先给出了本文的属性、属性权重及评价意见提取方法,为构建评价矩阵奠定基础。进一步以内容的变化划分时间窗口,区分UGC在时间维度上的决策价值,构建时间序列动态决策模型。
2. 相关研究及预备知识
2.1. 基于UGC的多属性决策相关研究
UGC中包含用户关于产品或服务的使用感受,不仅能支持消费者做出购买决策,也能被企业用于产品的售后了解,支撑功能或服务的改进,这使得大量真实可靠的UGC越来越广泛地被用于决策领域。然而,用户发表评论没有范围的限制和参照的模板,用户关于产品属性的评价信息需要借助文本分析方法进行挖掘。这也使得基于UGC的多属性决策问题有别于传统的多属性决策问题,研究此类问题具有重要意义。
目前已有学者研究如何利用UGC进行方案决策或排序。由丽萍 [8] 采用人工标注的方法从手机评论中提取主题属性和情感词,将商品评论转化为关于属性的评价向量,通过VIKOR方法测量顾客满意度。张瑾等 [7] 将在线评价信息转化为关于属性评价标度的概率分布,构建商品属性的累积分布函数矩阵。尤天慧等 [9] 针对轿车的4类属性分别提取在线评论,并将属性的评价表示为离散情感强度等级的概率分布,最后基于证据理论融合评价信息。李永海 [10] 通过特征挖掘方法提取在线评论中的商品属性,并基于词频统计确定属性权重。接着通过评论中情感词的挖掘确定情感程度标度集,以此为基础统计所有用户关于属性的情感标度离散概率,构建商品购买决策矩阵,最终采用TOPSIS方法对商品进行排序。Kang等 [11] 基于评论构建移动服务的满意度测量框架,基于词性标注提取评论中的属性和情感词,基于情感词的极性和强度确定5类评分等级,属性权重的确定基于词频统计的方式。汪兰林 [12] 则针对评论语言的特点,提出利用概率语言描述评价信息,代替以往的离散情感标度。
综上,基于评论文本的多属性决策中,关于方案属性的确定主要通过对文本进行分析并从文本中提取用户关注的产品特征 [10] [11] [13],但是属性评价体系仍然由专家依据自身经验从抽取的特征集中确定 [8],这种评价体系构建方法显然不够全面,不能代表广大群体的意见。针对评价信息的提取,由于文本评价信息为中文评价词,现有方法通常采用离散的情感强度对属性评价词加以区分 [7] [10],或构建概率语言术语 [12]。这些方法对情感值的计算不够细粒度,会丢失部分用户评价信息。关于属性权重的确定主要有基于词频统计的产品特征权重确定、或者直接基于用户个人感知的优先级直接确定。在决策矩阵构建方面,现有方法通常汇总所有评论信息,以情感强度等级或语言术语概率分布的形式构建整体决策矩阵,这种方法忽略了UGC信息在时间维度上的动态变化给决策参考带来的影响。
2.2. VIKOR排序方法
VIKOR方法,又称折衷排序法,是一种基于理想点解的决策方法。通过对群体效用值、个体遗憾值和折衷评价值的计算,按照一定的排序条件和规则,对备选方案进行排序和选择 [14]。假设有关于m个
备选方案、n维属性的决策信息矩阵
,
为方案
在属性
下的评价值,基于VIKOR的方
案排序过程如下:
Step1:确定正理想解和负理想解。正理想解
是各属性下的最优值的集合;而负理想解
则是各属性下最差值的集合,公式如下:
(1)
(2)
当属性
为效益型指标:
,
。
当属性
为成本型指标:
,
。
Step2:针对每个备选方案,计算群体效用值
和个体遗憾值
,其中
表示属性
的权重,公式如下:
(3)
(4)
Step3:基于群体效用和个体遗憾值,计算备选方案
的折衷评价指数
,公式如下:
(5)
其中,
(6)
(7)
指决策机制系数,也称折衷系数,满足
。如果
,则选择最优方案时倾向于群体效用,决策依据大多数人的观点;如果
,则表示决策时倾向于个体遗憾度;如果
,两种因素兼顾且同等重要。
3. 动态多属性决策方法
3.1. 问题描述
一般的在线评论多属性决策框架为:
表示待排序的M个备选产品;
为从文本中挖掘的N个属性,且随着文本内容的变化而变化;
表示基于文本求解的属性权重向量,满足
;对备选商品发表评论的K个用户组成决策群体,表示为
。
考虑到UGC内容的动态性,本文从时间和内容维度进一步划分UGC,以区分不同时段的UGC参考价值。假设
为划分的时间窗口集合,对每个窗口中的评论文本分别构建多属性决策矩阵;以时间权重
区分窗口决策价值,从而构建基于UGC的动态多属性决策模型。
UGC文本是非结构数据,非传统多属性决策中的结构化评价,属性维度、属性评价值以及属性权重需要从文本中获取。此外,如何基于文本内容的变化划分时间窗口并量化窗口权重是本文需要解决的问题。因此,本文提出的动态多属性决策方法主要包括三部分:首先介绍本文的属性提取、权重及评价值计算方法;接着提出基于文本内容变化的时间窗口划分方法与时间权重计算方法,并构建动态多属性决策模型。
3.2. 属性相关信息提取
3.2.1. 属性提取
传统的多属性决策问题中,方案属性由专家根据经验知识构建,这种方法确定的产品属性往往不能体现用户的关注点,且专家确定的属性不一定全面。UGC文本涵盖了用户的产品使用体验与感受,从文本中提取属性能真实反映用户的属性诉求。LDA主题模型 [15] 是一种无监督学习方法,避免了人工标注数据的复杂性,适用于对大规模文本进行处理,挖掘其中隐藏的主题信息。本文采用LDA主题模型挖掘不同时间窗口中的UGC主题描述,以确定时间窗口方案属性集
,每一主题对应的高频词为该属性的基本属性词。属性-属性词的映射集和C表示为:
(8)
其中
表示属性,N表示属性的数量,
表示与属性
相关的属性词,
表示属性
对应的属性词数量。
确定属性后,基于词性模板和依存句法关系 [16] 对每位用户发表的UGC评价进行细粒度评价意见抽取,抽取结果包含评价对象及对应的情感词两部分,表示为词对<评价对象,情感词>。例如对评价语句“缆车上风景很好”提取评价对象–情感词对“<风景,很好>”,其中“风景”为评价对象。评价对象通常指产品的整体、某个部件或某个特征 [17]。由于用户对产品属性的描述用语丰富,基本属性词集难以匹配所有评价对象,本文进一步将词语转化为词向量,以向量余弦相似度衡量评价对象与属性之间的相似度,并将评价对象归类到与之相似度最高的属性中,完成属性分类。评价对象key与属性
的相似度
计算公式为:
(9)
其中,
为属性词
的分布概率。
3.2.2. 属性权重计算
多属性决策中属性权重对决策结果有很大影响。本文的属性来源UGC文本,属性权重也将从文本中挖掘。现有研究中基于偏差最大化思想确定属性权重是应用较多的方法 [18] [19]。其基本思想是,当属性内部的评价存在争议,表示用户关于属性的评价未达一致,应重点解决,相应的属性权重越高。另外,用户对属性的关注度也是影响决策结果的重要因素,用户对属性的关注度通常以属性频次计算。因此本文将综合属性频次和属性评价偏差两方面因素确定属性权重。
1) 属性频次
UGC文本中,属性被提及的次数能够反映用户对属性的关注度,属性频次越高,用户越重视。本文以
值表示属性频次,其中
为属性
在文本集中出现的次数,则
为属性出现的次数与所有属性出现的次数之和的比值,计算公式如下:
(10)
2) 属性情感分歧度
属性偏差表现为用户对属性评价的差异性。本文利用情感分析方法量化决策评价值,对意见分歧的计算将通过构建情感分歧度来表示。情感分歧度为用户对属性的情感差异均值,基于文献 [20] 计算方法,公式如下:
(11)
其中,
表示属性
的情感分歧度;Q为关于属性
的评价用户数量;
,
分别表示用户
与用户
对属性
的情感值。
值越大,属性
内部的评价争议越大,属性权重越高。
综合属性的重要度和情感分歧度指标,以权重平衡因子
和
来平衡两类指标的影响程度,从而确定目的地属性
的权重系数
,公式如下:
(12)
3.2.3. 属性评价值计算
UGC文本中,用户评价为对该产品的情感表达,情感表达通常以情感词存在于评论文本中。沿用3.2.1节的意见抽取结果,构建基于情感词典的情感计算规则,对每个评价对象对应的情感词进行情感计算。分析情感词的情感强度str、情感极性polarity、否定词强度nw以及程度词强度dw,设计情感词的情感计算规则如下:
(13)
计算用户对每个评价对象的情感值,汇总计算属性下评价对象的平均情感值作为属性评价值,计算公式如下:
(14)
其中,属性
表示产品
对应的属性
;
为属性
包含的评价对象数量;
表示评价对象对应情感词的情感值;
表示关于属性
的综合评价值。
3.3. 动态多属性决策模型构建
由于产品和用户需求引起的内容变化速度很难获知,如何从时间维度上对UGC进行分类是本文的研究难点。现有方法通常依据UGC发布日期与当前时间的间隔长短划分时间窗口,这忽略了UGC内容本身的变化。内容的变化表现为用户评价产品的属性会发生变化,包括属性维度和属性内容。本文以主题变化代表属性的变化,提出基于属性相似性的时间窗口识别算法,并定义时间权重。最后,以3.2节属性与评价值计算方法构建每个窗口的评价矩阵,并结合时间权重构建动态多属性决策模型。
3.3.1. 时间窗口识别方法
按照时间一定时间窗口长度对UGC文本集进行初始分类,共划分T个初始时间窗口。以3.2.1属性提取方法提取每个窗口中UGC文本隐藏的属性,时间窗口t的属性和属性集为
,其中属性
包含
个基本属性词,表示为
。
1) 属性相似性
采用向量之间的余弦夹角的相似性度量属性
和
之间的相似性。由于属性为基本属性词的词集,基于词向量将属性词映射至相同的向量空间,并以各属性词的词向量组合作为属性向量。向量相近的属性,可被认为具有相似的语义。具体的计算公式如下:
(15)
其中,属性向量
和
均处于同一向量空间,相似度
值越大,主题之间相似性就越大。
2) 属性集相似性
从时间窗口中提取的属性通常为多个属性的集合,属性集一定程度上反应了窗口中的文本内容,本文以不同窗口中属性集的相似性表示UGC内容的相似性。当相邻窗口的属性集长度不同,则窗口属性集必然发生了变化;当长度相同时,需要进一步判断属性内容语义是否相似。
基于属性相似性计算公式计算两个属性集
和
的语义相似性,首先计算两个集合中两两属性之间的相似性,最终以平均相似度表示属性集语义相似性,公式如下:
(16)
其中,
,
分别表示两个集合的长度,即窗口主题数量。
为属性集语义相似度,值越大,表示属性集越相似,两个窗口的文本内容也越相近。
3) UGC划分算法
基于属性集相似性,对划分初始时间窗口的多时段UGC文本进行调整,获得最终的游记分类结果。首先判断相邻窗口的属性集长度是否相等,若长度不同,表示用户关注的产品属性增加或者减少,产品本身或者用户偏好出现变更,则判定两个窗口的UGC内容发生了明显变化;若属性集长度相等,进一步判断窗口属性集语义相似性是否达到临界阈值
,相似度小于该阈值的窗口UGC内容未发生明显变化。UGC文本划分的具体算法步骤如下:
输入:以一定窗口长度划分的初始UGC文本集,共有T个时间窗口;设定临界阈值
;算法遍历以时间窗口
作为起点;设定初始
。
输出:重新划分时间窗口的UGC文本集。
Step1:定位相邻时间窗口
与
,
,
,且
。
Step2:比较窗口属性数量是否相同。若数量相同,进一步判断属性集
和
之间的相似性,若大于阈值
,标记
。
Step3:判断
值。当
时,合并窗口
与
中的游记,并将合并后窗口标记为
,执行step4;若
,执行Step5。
Step4:
指针后移一步,转置Step6。
Step5:
,
指针后移一步,转置Step6。
Step6:重置
,重复Step1,直到遍历所有时间窗口。
迭代多轮UGC划分算法,直到时间窗口不在变化,获得最终的UGC时间窗口划分结果,共有H个时间窗口,表示为集合
。
3.3.2. 时间权重定义
UGC信息具有很强的时效性,在浏览产品评论时,用户倾向于参考最新的评价信息,对评论日期有隐性的心理要求。另外,由于内容的更替无法获知,时间久远的UGC也可能存在一定价值。因此,若仅考虑评论日期的新鲜程度,会削弱内容本身对用户决策的参考价值,本文将结合时间距离和UGC内容区分不同时段的UGC文本权重。
1) 时间衰减度
艾宾浩斯遗忘曲线可以反映人的学习遗忘规律,遗忘过程是先快后慢的非线性变化 [21]。考虑到游记本身存在的时间衰减性,本文基于遗忘曲线的基本思想定义不同时段UGC的时间衰减度:
(17)
其中,
为时间衰减因子,
为决策时的时段,
为目标UGC所处的时段。权重
随着时间距离
的增大而减小,意味着越久远的UGC越不容易被用户选择。
2) 时间权重
现实中,用户的兴趣和产品的更新速度可能相对平稳,时间久远的UGC同样具有参考价值。仅仅以时间衰减度赋予UGC权重,会忽视内容本身的有用性。本文基于属性相似性衡量UGC内容的变化度,并结合时间衰减度定义时间窗口权重:
(18)
其中,
表示时段
中的属性集与当前时段的属性集相似度,
数值越大,表示时段
中的UGC对当前用户的决策参考影响越大。
3.3.3. 动态决策模型构建
通过UGC划分算法获得H个时间窗口的UGC文本集,基于属性提取和评价计算方法构建时间窗口评价矩阵,以
表示:
(19)
其中,
为基于窗口
中的UGC文本集提取的用户关于属性
的评价值。
结合时间权重计算方法,构建时间维度上的动态决策模型,模型与H个时间窗口的评价矩阵及时间权重相关,
为评价矩阵融合方法,决策模型ET表示如下:
(20)
4. 实验结果及分析
4.1. 数据来源及处理
以基于游记的目的地排序实例来说明动态群体多属性决策方法的可应用性。在“古城”和“古镇”旅游主题中,选择携程网中游记发表数量排名靠前的5个5A级古城或古镇景点作为备选产品,分别为“丽江古城”、“西塘古镇”、“乌镇”、“周庄古镇”、以及“平遥古城”。通过编写爬虫脚本,采集发布时间在2019年10月9日至2022年11月10日近3年的游记作为研究语料,共采集游记1964篇。数据内容包括目的地名称、游记标题、游记内容、发布时间以及作者信息等。考虑到中文游记文本为长文本非结构化数据,无法直接作为模型的输入,对采集的游记文本进行分词和去停用词处理得到游记语料库。
4.2. 时间窗口识别实验
设定30日为初始时间窗口长度,依据游记发表时间对游记文本集进行划分,共划分36个时间窗口,获得对应的游记文本子集,作为文本初始划分结果。
4.2.1. 属性提取
针对每个时间窗口,迭代主题数量,得到不同主题数下的模型困惑度。以其中一个窗口为例,将游记文本进行多次迭代,绘制LDA主题模型困惑度变化图。根据图1可知,当主题数量设置为6时,困惑度变化出现显著拐点,由此确定该窗口中的属性数量为6,并提取每种属性下频率较高的10个词作为基本属性词。
36个初始时间窗口的主题提取结果如表1所示,属性数即基于窗口游记文本提取的主题数,是该窗口的评价维度。
4.2.2. 时间窗口调整
在第1轮迭代中,以全部相邻窗口的属性集平均相似性设定临界阈值
。基于3.3节中的UGC划分算法,判断相邻窗口的属性数量和内容是否相关。当属性数量相同且相似度大于临界阈值时,合并相邻窗口,并重新提取新窗口的目的地属性。窗口调整见示例1和示例2。

Figure 1. The change chart of LDA perplexity
图1. LDA主题困惑度变化图

Table 1. Number of attributes of initial time windows
表1. 初始时间窗口属性数量
调整示例1:针对相邻窗口t1和t2,属性数量相同,进一步计算属性集语义相似性
,相似性大于阈值,合并窗口t1和t2并标记合并后的窗口为t1,对新窗口重新提取属性数为6。
调整示例2:新窗口t1和t3相邻,两者属性数量分别为6,8,表示属性维度不同,不予调整。
经过对初始时间窗口的2轮迭代,相邻窗口的属性不再相似,窗口数量及对应的属性数量变化及分布如图2。第1次迭代后,合并后的时间窗口数量为30。在第1次迭代结果基础上,进行窗口调整,第2次调整后的窗口数量为29。

Figure 2. The change chart of time window adjustment
图2. 时间窗口调整变化图
4.3. 动态多属性决策模型实验
由于不同窗口中
的属性维度和内容存在差异,不能以时间权重简单加权融合
。因此,本文首先运用VIKOR方法求解静态决策矩阵
,获得每个窗口中的目的地折衷评价指数,接着按照时间权重融合求解结果,得到最终的目的地排序结果。
4.3.1. 基于VIKOR方法的窗口评价矩阵求解
基于本文的属性评价值计算方法,构建不同时间窗口的评价矩阵。基于属性权重计算结果,求解不同窗口的目的地折衷评价指数,部分窗口的目的地折衷评价指数如表2所示。时间窗口t1中,目的地丽江古城(A1)、西塘(A2)、乌镇(A3)、周庄(A4)、平遥古城(A5),对应的折衷评价指数Q分别为0.066、0.399、1、0.008、0.017。根据指数最小,排名最高原则,则周庄排名最高,目的地排序结果为
。

Table 2. The indicator Q of destinations in partial time window
表2. 部分窗口目的地折衷评价指数Q
4.3.2. 动态决策模型求解
首先计算时间窗口权重,以最近的时间段作为基准点,分别计算历史时间窗口的时间衰减度和主题集语义相似性,作为计算时间权重的基础。部分窗口的衰减度、主题集相似性以及时间权重计算结果如表3所示。

Table 3. The example of time weight calculation
表3. 时间权重计算示例
依据时间权重融合各窗口中的目的地折衷评价指数,得到备选目的地的综合评价指数如表4,其中目的地A2指数最高,目的地A5指数最低,根据指数越低方案越优的排序准则,最终的目的地排序结果为

Table 4. Comprehensive evaluation index of destination
表4. 目的综合评价指数
5. 总结与展望
本文基于在线UGC评论展开对多属性决策问题的研究,提出了动态多属性决策方法。考虑到文本信息有别于传统的结构化评价,无法直接应用于决策,用户的属性评价信息需要从文本中挖掘。本文首先对文本进行分析以提取属性评价信息,包括基于LDA主题模型和词向量的属性维度确定、基于情感分析的属性评价值计算以及基于属性频次和情感分歧度的属性权重确定。其次,考虑到现实中的UGC内容会在时间维度上动态变化,本文提出了基于属性相似性的时间窗口识别方法,通过计算不同时间窗口UGC文本的属性相似性作为时间窗口划分依据。在属性相似性基础上,基于遗忘曲线计算不同窗口的游记时间衰减度,模拟用户选择UGC的时间偏好度,从而确定时间窗口的权重。这种方法不仅考虑到时间距离偏好度,同时考虑了内容本身的有用性。接着,本文在时间窗口识别基础上,分别构建时间窗口评价矩阵,并结合时间窗口权重构建了时间序列动态多属性决策模型。最终基于本文提出的方法,构建了基于游记文本的目的地排序模型,并应用VIKOR方法求解得到关于备选目的地的折衷评价指数和排序结果。本文的动态决策模型有效区分了决策信息在时间维度上的决策价值,具有可操作性,能够为管理决策问题提供决策支持。
本文研究了如何更好地将UGC用于多属性决策中,在时间维度上对UGC内容的决策价值进行了区分,但是还存在一些研究局限:1) 本文直接集成时间窗口中所有UGC的评价意见构建窗口评价矩阵,忽略了对决策用户可信度的探讨。可信度一般与UGC作者和评论相关,后续需要挖掘可用于表征可信度的衡量指标,例如粉丝数、评论数和浏览数等。2) 由于在线UGC评论用户规模大、背景复杂多样,不仅增加决策过程的复杂性,还会导致决策共识度的降低。后续可以考虑构建决策子群,将基于UGC的大群体决策转化为小群体决策,区分决策群体的差异性,提高意见集成效率与决策共识。