1. 引言
近年来,随着电子商务的发展和互联网的普及,越来越多的消费者选择在网上购物。在这个过程中,在线评论成为了一个重要的参考因素,消费者往往会通过阅读他人的评论来决定是否购买某个产品 [1] 。因此,了解在线评论对销量的影响,对于企业制定销售策略具有重要意义 [2] 。目前,许多企业都使用基于历史销售数据的预测模型来预测未来销售额。然而,这种方法往往只能反映出过去销售数据的趋势和规律,忽略了消费者需求和市场变化等因素的影响。因此,一些研究者开始考虑到在线评论的有用性 [3] ,探索使用在线评论等非传统数据来源来预测销售额。本研究旨在基于在线评论等非传统数据,建立销售预测模型,以提高销售预测的准确性和可靠性。具体地,本研究将收集哔哩哔哩动画网会员的历史销售数据和与该产品相关的在线评论数据,并使用机器学习方法对这些数据进行分析和建模。通过比较模型预测结果和实际销售数据,评估模型的预测准确性和可靠性。本研究的研究结果将为企业提供销售预测和决策提供参考,也将为相关学科领域的研究提供有益的借鉴。
200年,Chatterjee P [4] 首次提出在线评论这一概念。Ren J和Yeoh W等人 [5] 探讨了在线消费者评论与销售之间的“先有鸡还是先有蛋”的双向关系,通关使用格兰杰因果关系检验发现在线消费者评论量与销售额之间存在因果循环。过去的研究关注了产品评论的内涵要素和对购买意愿的影响。近年来,焦点转向了分析在线评论的有用性 [6] ,即其是否影响消费者决策,这种主观感知有助于减少购买过程中的不确定性,为购买决策提供参考 [7] 。随着互联网技术的不断发展,用户在网上发布的评论数量急剧增加,如何利用这些评论来预测产品或服务的销售量和用户需求,成为了近年来的研究热点 [8] 。研究指出在线评论在特定环境中对促进情感表达和人际关系交往方面具有激励作用 [9] ,同时也能促进显性知识在网络平台传播共享 [10] 。此外,特定评论还能够在一定程度上提高受众在进行在线学习中的参与度 [11] 、满意度和效果 [12] 。通过在在线学习视频中加入评论交互的形式,Lee Y C等人发现动态的弹幕评论能够增强用户的参与感、社会交互感以及学习成果感,而且与视频内容相关的评论也将在未来一定程度上促成用户深入学习、展开高参差研究 [13] 。Pan H等人基于评论数据进行了一系列的统计分析,发现较短且情感丰富的评论更具观点表达能力,有助于促进人与人的意见和情感交流 [14] 。Li L等基于在线评论进行的情感分析相关研究重点关注基于在线评论的情感分析方法及其应用,并指出未来进行情感分析研究模型的需求会越来越强 [15] 。
主题建模是一种基于文本数据的数据挖掘技术,通过对用户在线评论进行主题建模,找出评论中的关键词和主题,进而预测产品或服务的销售量和用户需求。郑晓龙等人面向复杂决策场景的认知图谱构建与分析方法,提出了一种基于在线评论的分析方法,从而对公众情绪的演变和群体性事件的走向进行可靠的预测 [16] 。为了克服在产品特征提取过程中准确率不高、需要大量人工参与的问题,受到评论口语化倾向的挑战,张新利用LDA模型改进了MULTIMOORA的商品推荐方法,为消费者提供决策支持 [17] 。同时,也有学者从以往的销量出发进行研究。时间序列分析是一种将时间作为自变量的分析方法,通过对用户在线评论的发布时间和数量进行分析,预测产品或服务的销售量和用户需求。金家华和吴浪涛基于时间序列的网络口碑对销售额的影响进行了研究,通过对外卖平台上用户评分的时间序列进行分析,发现评论数量与销售额之间存在一定的关联性 [18] 。Chen以整个中国汽车市场的销售数据为样本,利用时间序列分析方法,建立了基于ARIMA模型的汽车销售预测模型,并进行了模型检验和预测分析。结果表明,该模型预测精度较高,能够为国家监管和其中企业提供销售预测支持和决策依据 [19] 。王书田等人使用情感分析算法获取在线评论的效价,并应用前景理论和熵值法对在线评论的效价进行调整,结合评论数量和网络搜索数据,建立了自回归分布滞后模型对不同价位档次汽车销量进行预测分析发现,考虑了消费者受负面信息影响的在线评论的效价、数量和网络搜索数据的模型预测效果优于传统模型,更符合实际情况 [20] 。史伟等学者在研究中运用微博数据和预先构建的情感本体分类,成功地提取了微博中的情感因素,并将这些因素融入了电影票房预测的自回归模型中,研究发现综合考虑情感因素的预测模型在预测电影票房方面表现出色,其效果超越了仅考虑微博数量的模型,而且仅以微博数量为依据的预测模型也在预测效果上胜过了传统的自回归模型。这一研究结果凸显了情感因素在电影票房预测中的重要性,为提升预测准确性提供了有益的方法 [21] 。
当前,国内外学者已经对不同平台和产品的在线评论数据进行了研究,关注点主要在评论的有用性以及对产品销量的影响因素上。然而,结合主题建模和时间序列分析来筛选和利用评论的研究还不够充分,基于在线评论同时考虑促销因素对预测结果的研究较少。此外,针对在线评论对产品销量的影响,尚未得出普适性的结论。因此,本文将专注于流媒体平台,探究高有用性评论的自身特征,以及这些评论对平台付费产品销量的影响效果 [22] 。研究的目的是降低用户寻找有用评论的成本,并帮助企业更好地理解在线评论对产品销量的影响机制。通过这项研究,我们希望为企业提供有关在线评论的关键信息,以优化产品推广和销售策略。
2. 模型构建
随着社交媒体的兴起,信息交流的范围变得广泛丰富,人们能够在不同的社区中进行信息交换。在做出购买决策之前,消费者往往倾向于浏览社交媒体上的内容,以便更好地决定采取何种行动。多项研究的表明,在线评论被证明对于预测产品销量具有重要的影响力。这一发现凸显了社交媒体在引导消费者购买行为和影响市场趋势方面的显著作用。本文总结、改善前人研究结果选取变量,采用Python爬虫软件对所使用的在线评论数据、产品销售数据及产品特征数据进行获取,基于有用性清洗过滤评论,建立模型分析,探究在线评论对销售绩效的影响 [23] ,建立基于在线评论数据和历史销售数据构建情感自回归模型,完成对销量预测任务。
2.1. 构建基础情感词典
本研究采用的是hownet和NTUSD两个基础情感词典。Hownet情感词典为我们提供了包含正向和负向评价以及情感表达的词汇资源。这个词典的独特之处在于,其中的情感词汇主要用于描述表达者的内心感受,而非评价对象。因此,在本研究中,我们仅使用了Hownet情感词典中提供的积极和消极评价词汇。为了建立基础情感词汇表,我们首先对两个情感词典进行了合并,并清除了重复的情感词汇。这一过程为我们提供了有助于更准确地分析和理解文本中的情感内容的基础情感词典,其中共包含6305个正向情感词,12,478个负向情感词。
2.2. 构建细粒度情感指数
在以往的情感分析研究中,情感倾向的计算通常仅着眼于不同特征条件下正负评论观点的数量,而对于这些观点的情感强度却往往被忽视。这种方法的局限性在于,它未能充分考虑评论中情感表达的深度和强度。因此,本研究在前人的基础上进行了深入探索与创新,特意引入了“特征观点情感强度”的概念,将其纳入情感指数的构建中。这一新颖方法在处理不同特征维度时,不仅将正负评论纳入考量,还考虑了情感表达的程度,从而使得所得到的情感指数更具有综合性和准确性。通过这一方法,我们能更深入地洞察评论中的情感信息,为情感分析提供更为精确和全面的视角。
1) 情感倾向计算
在情感分析领域,除了情感词汇本身,否定词和程度副词在塑造特征观点的情感倾向方面发挥着重要作用。这些因素的影响不可忽视,因此在进行情感值的量化计算时,必须充分考虑它们的影响。在计算特定观点的情感倾向时,我们应当注意以下几个要点:
① 对于情感词汇而言,我们首先要判断其是否出现在动态情感词典中。若存在于该词典中,我们可以依据特定情感对应的特征来判断情感值为1或−1。然而,当情感词汇并未包含在动态情感词典中时,我们需要依赖通用情感词典来评估其情感倾向。若情感词汇出现在正向情感词典中,情感极性被定义为1;反之,若出现在负向情感词典中,情感极性被定义为−1。
② 程度副词的影响同样至关重要。不同的程度副词承载着不同的情感强度,因此,当观点词汇前出现程度副词时,情感极性应当乘以程度副词的强度值,以此来调整观点的情感值。
③ 否定词的存在能够颠倒观点的情感倾向。在判断中,我们会计算否定词的出现次数。若出现次数为奇数,情感值将与−1相乘;若为偶数,情感值则不做改变。
④ 在处理否定词和程度副词同时出现的情况时,我们会根据它们的相对位置来进行情感值的计算。若否定词出现在程度副词之前,最终情感值将为0.5乘以程度副词的强度值再乘以情感值;而若否定词出现在程度副词之后,情感值将为−1乘以程度副词的强度值再乘以情感值。
这一分析方法为我们提供了一个更加全面、准确的情感分析框架,能够更好地捕捉文本中的情感倾向。
2) 特征–观点对的情感值计算
由于提取出的特征–观点对的保存形式是一个三元组 [24] ,我们在计算情感值时应该结合其特征和观点对的情感特征进行计算,其过程如图1所示:
3) 周期性情感倾向计算
周期性的情感倾向是指从整体的角度来看,在一个固定的时间周期内,评论情感呈现的正负倾向。在此背景下,由Antweiler和Frank等学者 [25] 所定义的“看涨指数”被广泛地用于计算情感倾向。本研究在这一基础上进行了探索性工作,将“看涨指数”与情感强度相融合,以便计算固定时间周期内的情感倾向。通过这种方法,我们能够更全面地了解情感在特定时间范围内的变化趋势,为情感分析提供了更深入的视角。具体计算方式如式(2.1)所示。
(2.1)
其中,
表示在时间𝑡内正向评论的情感值的和,
表示在时间𝑡内负向评论的情感值的和,情感值的计算在本文中沿用Chintagunta P K [23] 。该情感倾向可以理解为,若式(2.1)的值大于零,则认为在时间周期𝑡内评论的情感倾向为正,反之,则为情感倾向为负。
4) 特征权重确定
对同一产品特征往往存在不同的表述,为了方便后续对产品特征进行情感分析,需要对前两节得到的特征词进行分类。本文采用K-means算法对特征聚类。K-means算法是一种常用的聚类算法,用于将数据集中的样本分成K个不同的簇,以便使簇内的样本相似度最大化,而簇间的相似度最小化。
特征–观点对是一个词对,包含了产品特征和评价词,表示为一个二元组。特征–观点对是进行细粒度情感分析的基础。在本研究中,前面的工作已经确定了产品的特征词库,下一步的任务主要是根据语法抽取规则提取评论句中的特征–观点对。为了完成抽取任务,我采用自编python代码分析来识别与特征词相对应的观点词,按照规则提取特征观点对,该特征–观点对抽取算法的伪代码如表1所示。

Figure 1. Emotional feature calculation process
图1. 情感特征计算过程
通过在线评论中提取产品属性并进行情感分析,在此基础上构建识别不同属性需求的分类模型特征抽取工作 [26] ,本研究得到了{剧情,动作,音乐,画面,深度}五个特征集合。在确定特征权重时,通常采用的方法是等权重法,然而这种方法未能准确地反映出消费者对不同特征的偏好。为了更精准地衡量特征的重要性,本研究借鉴了文献中的方法 [27] ,即消费者在评论中更倾向于提及他们所关注的特征。基于这一思路,出现次数较多的特征被认为具有更高的重要性。因此,研究中借鉴金家华等人 [18] 的研究,即根据每个特征集合中特征的出现次数来确定细粒度特征集合的权重。这种方法有助于更准确地捕捉消费者对不同特征的偏好,为特征权重的确定提供了一种更为有实际依据的方式。具体计算方式如式(2.2)所示。

Table 1. Pseudocode for feature viewpoint extraction algorithm
表1. 特征观点抽取算法伪代码
(2.2)
其中,Ni表示特征集合i中特征出现的频数。
5) 细粒度情感指数构建
在每个时间周期内,综合特征权重,特征维度以及周期情感倾向构建时间周期t内的细粒度情感指数,计算方式如式(2.3)所示。
(2.3)
2.3. 基于在线评论的销量预测模型
根据之前的分析,我们了解到细粒度情感指数的变化在一定程度上可以解释销量的波动,因此它被视为影响销量变化的一个重要因素。而自回归预测方法在销量预测领域中具有广泛的应用,在预测与自身前期相关的经济现象有良好表现。为此,本研究以销量和细粒度情感指数作为基础数据,构建了一种新型的情感自回归模型。这个模型着重考虑了三个关键影响因素,首先是前期销量的影响,其次是前期细粒度情感指数的影响,最后是考量季节促销因素的影响。通过将这些因素结合到预测模型中,我们希望能够更准确地预测销量的变化趋势。
1) 自回归模型
自回归模型是统计上一种处理时间序列的方法,用同一变数例如x的之前各期,亦即
至
来预测本期
的表现,并假设它们为一线性关系。因为这是从回归分析中的线性回归发展而来,只是不用x预测y,而是用x预测x;所以叫做自回归。
首先考虑第一个影响因素,即前期的销量对当前销量的影响,所构建的模型如式(2.4)所示。
(2.4)
其中,
表示时期t的会员销量;p表示滞后期数,即考虑滞后p期的销量对当前时期销量的影响;
为利用最小二乘法拟合得到的参数;
表示误差项。值得说明的是,自回归模型发挥效用的前提是时间序列是平稳的。为了获得平稳的时间序列,本研究对销量数据进行式(2.5)所示的取对数操作。
(2.5)
利用经过取对数处理后的数据,构建新的自回归模型,如式(2.6)所示。
(2.6)
2) 情感自回归模型
由于传统的销售预测方法主要基于历史销售数据,存在一定的滞后性,而且一般的自回归对于受社会因素影响较大的经济现象预测存在限制。因此考虑在自回归模型中引入在线评论情感因素 [28] 以修正模型(2.6),并结合前景理论和相关的在线评论数据,将涉及影视作品每个属性的文本评论转换为相应的情感得分,即利用前文公式计算得出
。融合了细粒度情感指数的情感自回归模型如式(2.9)所示。
(2.7)
其中,
、p、
和
的含义与2.1节中的一样,q表示细粒度情感指数的滞后期数,即考虑滞后q期的细粒度情感指数对当期产品销量的影响;
为滞后
期的细粒度情感指数;
为利用最小二乘法拟合得到的参数值。
3) 考量季节变量的情感自回归模型
考虑到企业在每年固定时间节点进行促销,可以构建以下基于虚拟变量的自回归方程,其中的季节变量用虚拟变量表示,通过这些虚拟变量来考虑季节性的影响。具体来说,我们可以将季节变量表示为多个虚拟变量。对于一年中的四个季节(春季、夏季、秋季、冬季),可以用三个虚拟变量来表示将季度转换为春季、夏季、秋季和冬季四个季节,分别表示为d1、d2、d3三个虚拟变量,具体如表2所示:

Table 2. Definition of dummy variables
表2. 虚拟变量的定义
(2.8)
其中
表示当前时刻的季节变量,即春季、夏季和秋季的虚拟变量,春季用d1表示,夏季用d2表示,秋季用d3表示,冬季则不用表示,因为冬季可以用d1、d2、d3都等于0来表示。这样,我们就可以将季节变量添加到模型中,并考虑季节性变化的影响。
本章相关参数及其含义如表3所示:
2.4. 小结
本章主要是进行了模型构建工作,后文将基于此进行实证研究,流程如下:
1) 利用获得的在线评论文本数据,基于特征词库和依存句法提取规则提取出特征观点对,并基于情感词典对提取出的特征观点进行情感倾向的判定,根据每个特征集合中特征的出现次数计算出细粒度特征集合的权重。
2) 综合每个时间周期内的特征权重,特征维度以及周期情感倾向构建时间周期t内的细粒度情感指数。
3) 对于实验科学性进行分析。选取大会员的销量数据以及相应的情感指数,通过进行相关性分析来探究二者之间的关联,以验证在线评论的细粒度情感指数与大会员销量之间是否存在相关关系。
4) 建立模型,进行拟合,与自回归模型、情感自回归模型性能进行对比。
3. 实证
3.1. 数据获取
研究样本源于哔哩哔哩动画网站,其网站视频评论机制较为完善,且评论质量较高,并提供产品的播放排名信息,可满足样本要求,其付费用户情况如图2所示。数据抓取时间为2018年6月5日至2022年12月15日。我们在研究中选择了哔哩哔哩平台上季度热门的付费连载视频作为数据来源。通过对每个产品进行全面的数据抓取,我们获取了它们的产品信息以及相关的评论信息。为了确保数据的质量,我们排除了那些没有评分或评论数量的产品数据。在数据收集过程中,我们汇总了诸如ASIN (商品ID)、剧集名称、产品价格、播放排行、评论数量、总评论星级以及各个评论星级的评论数量等关键信息。对于评论信息,我们采集了每条评论的星级、标题、评论者ID、评论者昵称、评论时间、评论有用数以及具体的评论内容。这些详细的数据将为我们的研究提供有力的支持和深入的洞察。
在一定的周期内,一共收集得到42,714个特征,通过式(2.2)计算得到的各特征权重如表4所示。对计算所得的
进行了分析,具体的结果如表3.2所示。由表5可知,在观测的十八个季度时间内,细粒度情感指数分布在0.31和2.457之间,呈现出比较平稳的水平,其平均值是1.325。

Table 4. Result of feature weight calculation
表4. 特征权重计算结果

Table 5. Statistical analysis results
表5. 统计分析结果
3.2. 情感指数与销量相关性分析
考虑到在线评论可能对销量产生滞后影响,我们在研究中将滞后期定义为一个时间周期。换言之,我们假设当前时间周期内的评论情感指数会对下一个时间周期的会员销量产生影响。因此在相关性分析方面,我们采用了皮尔逊相关系数作为衡量两个变量相关性强度的指标。该系数的取值范围在−1到1之间,负值表示负相关,0表示无相关,正值表示正相关。此外,相关系数的绝对值越接近1,表示相关性越强。通过这一分析方法,我们将揭示在线评论的情感指数与大会员销量之间的关系,为深入理解这一影响机制提供有力支持。

Table 6. Correlation analysis results
表6. 相关性分析结果
借助SPSS软件进行相关性分析,分析结果如表6。可以看出,销量和滞后一期的情感指数在0.01水平(双侧)上显著相关,且二者为正向相关关系,变量间的相关系数为0.482。
3.3. 结果分析
在进行影视作品销量预测任务时,安紫萌的研究 [29] 指出,在流媒体平台会员的历史销量数据中,涵盖了大约一年半以内的数据,这个时间段的数据基本上反映了对当前销量的影响趋势。研究还表明,消费者在计划购买当季会员时,通常会在接下来的5个季度内阅读评论并进行购买。基于这些发现,本研究针对预测模型中的参数进行了设定,将参数p的取值范围限定在1到6之间,而参数q的取值范围限定在1到5之间。经过网格搜索,我们成功地获得了最优的参数组合,即(p = 1, q = 5)。将以上设定的参数带入式(2.9),得到式(3.1)。
(3.1)
以哔哩哔哩动画王大会员16个季度的会员销量为数据源进行计算,得到的模型参数如表7所示。

Table 7. Model parameter estimation results
表7. 模型参数估计结果
(3.2)
为了更直观地反映模型的拟合结果,将计算得到的模型进行可视化处理,得到的结果如式(3.2)和图3所示。
通过观察图形可以明显看出,所建立的模型呈现出令人满意的拟合效果。此外,模型的R2值达到了0.695,进一步验证了其良好的拟合能力。为了充分说明模型的有效性和适应性,我们对模型的残差进行了白噪声检验。通过利用eviews软件进行残差的自相关和偏自相关分析,我们观察到在这些分析中,Q检验量所对应的P值均大于0.05。基于这一分析结果,我们可以得出结论:该模型能够有效地提取出有价值的信息,同时具备良好的适应性。因此,可以相信这个模型能够成功地完成所需的预测任务,能够为进一步的决策和研究提供坚实的支持。
我们利用经过良好拟合的模型对测试集中未来两个季度的销量进行了预测,并将预测结果整理于表8中展示。从预测结果中可以看出,模型的平均绝对误差百分比仅为0.034,这一结果显示出模型预测效果较好。为了验证包含细粒度情感指数的情感自回归模型的性能优越性,我们将其与传统自回归模型在p = 1、q = 5的条件下进行了对比。
表9呈现了自回归模型、情感自回归模型和加入了季节指数的情感自回归模型的预测结果对比。包含细粒度情感指数的情感自回归模型在拟合效果和预测效果上对比自回归模型均表现出明显优势,证明了细粒度情感指数在预测模型中的积极作用,为未来的预测任务提供了有价值的参考;加入季节指数的情感自回归模型则更优于情感自回归模型,证明了考量季节因素在销量预测中具有现实意义。

Table 9. Model performance comparison
表9. 模型性能对比
用拟合好的模型预测四个季度的销量,预测结果如表10所示。
在现有研究的基础上,本章采用情感分析结果,构建了一种融合特征观点强度的细粒度情感指数。通过使用在线评论数据和会员销量数据,本研究探究了历史销量数据和历史细粒度情感指数在预测会员销量方面的作用。实证结果显示,将细粒度情感指数和季节指数融入的情感自回归预测模型的精度达到了0.044,相较于传统自回归模型,预测精度提升了19%。在考察变量关系时,本研究虽然只考虑了线性关系,但在实际情况中,会员销量与各影响因素之间可能存在着复杂的非线性关系。关于评论特征的影响,研究发现评论对销量具有显著影响,其中情感正向的评论以及评论回复对销量产生积极影响,而评论数量、评论长度和评论差异性则对销量产生负面影响。
另外,研究还指出评论中包含的产品属性特征情感倾向对销量有显著影响,而消极情感较多的产品属性对销量的负面影响要大于积极情感的产品属性。为了构建更准确的销量预测模型,本研究综合考虑了销量、产品属性、评论特征以及评论中包含的产品属性特征对销量的影响,进而建立了多元线性回归预测模型。值得注意的是,在考虑了产品属性特征情感的回归模型中,调整后的R²值更大,这意味着模型对于产品销量的预测能力有所提升。综上所述,本研究在挖掘情感对销量影响的基础上,构建了更准确的预测模型,为了解销量波动提供了实用性和有价值的信息。
4. 总结
评论文本数据作为一种信息丰富的资源 [30] ,蕴含了消费者对于产品的看法、情感和意见。这其中的一些有价值信息,早已引起学术界和实践领域的广泛关注。尤其在销量预测领域,越来越多的学者开始认识到,在线评论信息蕴含的消费者反馈和情感可以为预测未来销量提供有力支持。在这一背景下,本研究在前人研究的基础上,深入挖掘评论文本中的信息,从细粒度的角度出发,探索了这些信息对销量的潜在影响,以及如何将这些信息应用于实现更准确的销量预测。通过采用某视频网站的会员销量和评论数据,本研究在预测会员销量方面取得了显著成果。研究发现,预测结果不仅在提升企业对于作品引入和推送方面具有实际应用,还通过分析在线评论的内容,能够捕捉消费者的意见、期待和建议,进而为产品的优化和营销策略的调整提供有力支持。
在未来的研究中,值得关注的是进一步提升评论信息的准确性,以及排除可能存在的虚假信息。同时,对于变量之间的非线性关系,可以运用更复杂的机器学习方法进行建模,从而更好地捕捉多变量间的相互影响。这些努力不仅可以进一步提升预测模型的准确性,还有望为企业提供更智能化、精准化的决策支持,实现销量预测与产品优化的双重目标。