1. 引言
近年来,在线评论一直是电影票房预测领域研究人员的热点 [1] 。在线评论是是从消费者的角度表达对于电影的体验感受,其反映了消费者对服务或产品的积极或消极态度 [2] 。根据消费者转化理论和信息加工理论,在线评论中蕴含了许多有价值的信息 [3] ,这些信息也会通过说服效应影响潜在消费者的态度并最终影响其购买决策。
然而,在线评论对电影票房的影响并不总是清晰的,尤其是在后新冠肺炎时代。一些电影因收视率高而取得票房成功,比如《饥饿游戏》就是一部是非常成功的电影,其收视率是85%,票房超过6.94亿美元。但也有部分电影尽管评论糟糕,却也取得了巨大的票房成功。例如《忍者神龟》尽管它的收视率只有22%,但其票房在上映前两周占据了票房的第一名,在全球获得了5.933亿美元的票房1。
以往的研究大多关注在线评论的整体情感效果,忽略了不同维情感的影响。根据的多属性态度理论,不同维度的情绪对潜在消费者的购买行为影响各不相同 [4] 。此外,对于消费者口碑的调节作用,以往的文献研究了消费者情感方差对在线评论总体情绪的调节作用,但对不同维度情绪的调节作用尚不清楚 [5] 。为了解决上述研究空白,我们试图通过回答以下问题来研究不同维度情感情绪的影响:
1) 多维度情感对票房有影响吗?
2) 消费者情感方差在多维度情绪和票房之间是否有调节作用?
本文的主要贡献是:其一,将多属性态度理论引入到实证研究中,从多维度情感驱动的新视角考察在线评论对票房的影响。其二,在线评论的总体情绪不足以反映对票房的影响,为此本文提出了一种新的数据分析方法用于在线评论的研究。我们创新性的构建了一个多维度情感分析框架来提取消费者对电影不同属性的评价,然后分析多维度情感对票房的影响以及情感方差的调节作用。它有效地反映了消费者对电影不同属性的情感偏好。其三,本文的实证研究结果为在线评论与销售之间的联系提供了有力的证据。在社交媒体时代消费者倾向于在各种各样的在线平台上发表和阅读在线评论,电影业务必须将捕捉和分析消费者评论作为一项战略重点。仅仅关注在线评论的数量和整体情绪可能还不够,消费者讨论的产品属性更重要。研究人员必须开发更先进的程序来提取与消费者的感知和决策相关的信息。
2. 文献综述
2.1. 在线评论
在线评论对产品销售影响的研究大致可以分为以下三类:1) 在线评论的数量是研究购买意愿和产品销售的一个重要维度。研究发现产品评论的数量对产品销售有积极的影响;并且可以成为消费者购买意向的参考 [6] ,石等人的研究发现短评数量对电影票房有积极作用而专业影评对票房没有影响 [7] 。2) 在线评论的长度越长的在线评论表达的信息越丰富,对消费者越有用,Liu & Karahanna (2017)的研究表明平均句子长度正向影响评论的有用性 [8] 。3) 除此之外,一些研究者还探索了在线评论的情感效应 [9] 。但是他们只关注了整体情绪,结果也是各不相同。一些研究表明,情绪对电影票房或图书销售没有明显的影响 [10] 。其他研究结果表明,积极的情绪对销售有积极的影响 [11] 。也有研究结果表明,评论中的负面情绪会影响消费者的购买决定 [12] 。
2.2. 多属性态度理论
根据多属性态度理论,消费者对产品的总体态度可以分解为对每个产品属性的不同态度 [13] 。同样,消费者对产品的整体态度是对一个产品的各个维度或属性的偏好的总和。它可以表现为:
(1)
其中
代表包含在产品中的属性i的权重;
代表消费者对产品属性i的态度得分,A表示对产品的总体态度。
消费者可以自由的评价他们所关注产品的多维属性 [14] 。潜在消费者会根据不同的情感暗示,通过他们的偏好和评价来塑造他们对产品的态度。我们可以从在线评论中提取不同维度的情感,因为消费者通常关注产品的相对重要的维度属性。
当在线评论对产品的某个维度有很多正面评价时,潜在消费者一般会认为该产品具有维度属性 [15] 。在处理信息时,消费者不太可能平等地考虑在线评论的整个文本,这可能导致多维度的不同偏好。虽然情感偏好Ei不可见,但可以从多维度情感对销售的相对影响中得出结论。
2.3. 文本挖掘技术
2.3.1. 情感挖掘

Table 1. Natural language processing tools
表1. 自然语言处理工具
情感挖掘一直是在线评论的研究热点。主要致力于分析、识别和挖掘在线评论文本中所蕴含的情感(积极,消极情感),这些情感可能是文档级的句子级的或段落级的 [16] 。
现阶段的研究主要是通过结合机器学习算法和基于语法分析的语义理解来解决情感挖掘问题 [17] 。表1展示了相对成熟的自然语言处理工具。
鉴于本文的在线评论情感挖掘需要用到语法分析,所以我们选用Stanford Natural Language Process (NLP)工具包 [18] 。表2展示了目前也有许多成熟的情感词典。

Table 2. Main sentiment dictionaries
表2. 主要情感词典
2.3.2. 主题模型
DTM (Dynamic Topic Models)是D. M. Blei基于LDA模型基础,针对动态主题探测分析并实现主题追踪的概率分布模型 [19] 。相比较传统LDA模型,DTM模型中文档具有了时间属性,对分析数据的离散化分析处理优化效果明显,运行效率及实验精度有了进一步提高,Gensim中利用time_slices函数表示具有时间戳的文本序列 [20] 。如图1所示,q指服从参数α的狄利克雷分布(Dirichlet Distribution),定义数据源集合的主题概率分布;β表示不同时期下主题词生成概率与权重分布;N为输入文本向量。
下面的步骤展示了DTM生成时间序列评论的过程:
1) 取参数
2) 取参数
3) 对于每个在线评论:
(I) 初始化主题分布
(II) 对于每个单词:
① 生成主题
。
② 生成词
。
3. 假设提出
3.1. 多维情感对票房的影响
根据多属性态度理论,消费者对一部电影的总体情感受到多维度情感的影响。本文利用DTM主题模型和情感分析技术,从在线评论中识别出消费者感知的三个重要维度(明星、流派、剧情)。明星(Star)代表导演和电影演员,情节(Plot)指的是故事情节,类型(Genre)电影的类型和类别。由于在线评论强调三个属性(明星、类型和情节),消费者将关注这些多维度的情感。
由于电影是体验产品,与其他搜索类产品(如相机和手机)相比,在消费前无法充分评估产品和质量。消费者认为购买性能和质量高度不确定的产品是有风险的。在线评论是之前消费者对影片的评价,可以弥补潜在消费者对影片质量信息的缺失。为了避免观看低质量电影的风险,消费者会阅读更多关于他们感兴趣的电影属性的在线评论,以便更好地了解电影。当特某个维度的情感特别高时,会导致对电影更好的评价,从而增加潜在消费者观看电影的可能性。因此,基于上述讨论,我们提出以下假设:
H1:不同维度的情感(情节、明星、流派)对票房有正向影响。
3.2. 消费者情感方差的调节作用
消费者情感方差是指消费者的体验与购买的产品不一致。通常,消费者会根据对产品的认可程度来发布在线评论。消费者的在线评论评分反映了产品的质量,而情感方差则反映了在线评论的不一致性和产品质量的不确定性。当在评分较高时,高情感方差可能会降低其可信度,增加购买决策的风险,从而可能减少潜在消费者。然而,当评分较低时,高情感方差可能会刺激小众产品的销量。在这种情况下,高情感方差有助于商家从与之匹配良好的消费者那里获得需求,而在线评论的高一致性会使其对购买决策的帮助更小。因此,情感方差降低了高评分的积极影响和低评分的消极影响。同样地,在电影票房领域中,维度情感方差反映了消费者对电影在某一维度的观点不一致性。基于此提出如下假设:
H2:在线评论的情感方差负向调节多维度情感(明星、情节、类型)对电影票房的作用。
本文研究的概念模型如图2所示。
4. 数据处理
为了了解多维度情感对票房的影响,我们首先确定消费者感知的重要维度,最后探讨它们对电影票房的影响。我们构建了一个多维度情感分析框架来识别在线评论中包含的多维情感,该框架将加权情感算法与DTM、NLP和情感词典相结合。情感分析框架如图3所示。

Figure 3. Multi-dimensional sentiment analysis framework
图3. 多维情感分析框架
4.1. 数据收集和描述
本研究选取了2017~2021年上映的100部国产电影,利用爬虫技术从douban.com和mtime.com收集每部电影的评论,最终收集到121,603条在线评论。考虑到国内影院的上映周期一般为一个月,我们只收集影片上映前四周(28天)的评论数据。电影票房数据来自yien.com。在本研究中,我们选择每日票房数据作为统计数据分析的来源。表3显示了主要变量,表4是对变量的描述性统计。
4.2. 维度提取
首先,通过文本预处理删除无用词和一些重复评论来清理在线评论。接着将在线评论按照时间进行结构化,使得每部电影在每个时间窗口只有一个评论文档集合;去除在线评论错误的拼写、标点以及停用词,并对词性进行标注和词干提取,使得每部电影都形成一个“词袋”序列。
然后,利用DTM模型对“词袋”序列进行维度抽取。通过吉布斯算法抽取在线评论共有的主题;通过结合主题的语义和复杂度指标确定主题的数量;对抽取的每一个主题进行命名,并从中选取在线评论中包含的重要维度。
我们可以按照以下方式来命名主题:首先,选取权重最高的词语作为候选,如果该候选的词语与其他词语存在逻辑联系,则将其作为主题名称;否则,选取权重次高的词语作为候选主题,然后依次循环,直至确定主题的名称;我们也可以通过主题词之间的逻辑关系直接命名主题。
最终我们从在线评论中识别了三个关键维度:明星、类型和情节。明星代表导演和电影演员,类型涉及电影的类型和类别,情节指的是故事情节。这三个维度在以往的研究中也被认为是重要的维度。表5展示了情节维度的词及其权重在不同时间窗口上的变化。

Table 5. Changes of words and their weights in dimension plot
表5. 情节维度中的词和权重的变化
4.3. 情感计算

Table 6. Examples of grammatical relationships
表6. 语法关系示例
使用斯坦福大学教授结合WordNet和The Harvard General Inquirer生成的情感词典,结合StandfordNLP工具分析情感词典中的词和在线评论中词之间的语法关系,从而确定维度词的情感值。本文主要使用常见的六种语法关系进行维度词情感的挖掘,如表6所示,“情节很有趣。”这条在在线评论,“情节”是“有趣”的名词性主语,“有趣”用于修饰“情节”。因此,将“有趣”的情感值(0.758)赋值给维度词“情节”。
由于不同维度词的权重不同,在计算每个维度的情感值时应当考虑其权重。由于维度词的权重随着时间动态变化,因此在计算维度情感时需要考虑维度词权重的动态性。通过DTM模型学习得到
表示在第t天,维度k的第n个词的权重。由于每个维度的词语的数量较大,因此我们只选择权重靠前的词语用于维度情感的计算。为了方便比较计算结果,我们对权重进行归一化处理,如式(4)所示并用
表示:
(2)
最终结合
,计算时间窗t中,电影j的维度k的情感和情感方差,如公式(3)和(4)所示:
(3)
(4)
表示在第t天,电影j的维度k中的第n个词在评论d中第i次出现的情感值;N是维度k中词的数量;D表示时间窗t中电影j的评论数量;Ⅰ表示第n个维度词在其第d条口碑中出现次数。最后对情感值进行标准化如公式(5):
(5)
图4显示了所有样本电影在多维度上的平均情绪,我们可以发现在三个维度上差异很大的情绪。

Figure 4. Sentiment changes in different dimensions
图4. 不同维度的情绪变化
5. 评估方法和实证结果
5.1. 评估方法
传统的OLS回归模型研究的是因变量条件均值,无法分析各因素对票房分布的影响。为了弥补这个缺点,Koenker (2004)提出了QR回归 [21] 。QR的明显优势如下:1) QR不需要序列的正态分布,但是OLS回归要求序列满足计量经济学的基本假设。2) QR可以研究极值的重要影响,而OLS回归不能研究极值的影响。
本文选取电影票房为因变量,明星、剧情、流派为解释变量,消费者口碑为调节变量,是否、评论数量、排片量为控制变量。为了获得更准确的结果,我们将所有数据转换为自然对数,面板分位数模型如公式(6)所示:
(6)
其中t表示了电影上映的天数,
代表不同的分位点;
表示不随分位数
变化且不受其他变量控制的个体之间的差异,
表示待估计的参数。
5.2. 实证结果
如表7所示,变量的相关系数小于0.5。我们计算了变量的VIF值(方差膨胀因子),其中最大值为3.25,最小值为1.17 (小于临界值10)。所以各个变量的VIF都比较小,可以断定不存在多重共线性问题。
然后,我们采用联合假设检验(F检验)、拉格朗日乘数检验(LM检验)和豪斯曼检验(Hausman)来确定应该选择哪个模型。结果表明F检验的p为0.000,可以推断固定效应模型优于混合效应模型。LM检验的p为0.000,可推断随机效应模型比混合效应模型更好。Hausman的p也是0.000,所以最终选择固定效应模型。
Notes: ***p < 0.01, **p < 0.05, *p < 0.1。
我们使用QR来研究多维度情绪对电影票房的影响以及消费者buzz的调节作用。与OLS回归相比,QR考虑了多维情绪和情感方差的极端和正态观测值的估计,从而提供了更有意义和更全面的证据。QR的估计结果在表8的第2~6栏中列出。对于明星维度的情绪,可以发现其对票房的影响先增后减,在高分位数时下降。明星维度情绪正向影响票房,整体趋势呈倒U型。
可能是因为冷门的电影制作成本有限,虽然没有当红明星,但电影的内容质量很好。当红明星的影响力可以提高的热度电影。但随着电影票房逐渐上升,明星逐渐成为热门电影中的标配,呈现出更大的趋同性,明星的号召力提升空间有限。至于情节维度情绪,我们发现它对电影票房的影响对所有高分位数都是显著的,但对低分位数不显著。除了高低分位数之外,类型维度情感对票房的影响都是显著正向的。所以假设H1成立。
为了估计消费者传言的调节作用,我们设计了情感方差和多维情绪的交叉项。估计结果见表7,明星维度情绪和消费者口碑的系数显著,情感方差负向调节明星维度情感对票房的作用。情感方差对情节维度情绪的影响主要集中在高分位数,对体类型维度情绪的影响主要集中在低分位数,且所有影响都是负面的,所以H2成立。

Table 8. The results of quantile regression analysis
表8. 分位数回归结果分析
Notes: ***p < 0.01, **p < 0.05, *p < 0.1。
6. 结论与展望
本文选择了2017~2021年发布的121,603条在线评论,构建了一个多维度情感分析框架来提取消费者对电影不同属性的评价,将多属性态度理论引入到实证研究中,从多维度情感驱动的新视角考察在线评论对票房的影响。
6.1. 管理启示
首先,我们的研究发现并非所有在线评论中包含的情感都对电影票房产生影响。对于电影行业来说,只有消费者感知的明星、剧情、流派的情绪对票房有影响。因此,电影发行商可以通过合理整合三维情感(明星、情节和类型)来更准确地预测票房。
其次。我们发现明星是消费者谈论最多的话题,其次是剧情和类型。对于电影制片方来说,在制作成本允许的情况下,可以通过演员阵容适当利用明星效应来提高票房。他们还必须认识到,电影的质量始终是一个重要的特征。电影应该是迎合大众精神需求的艺术品,而不是廉价出售的产品。虽然观众很可能会被网络评论和营销技巧所吸引甚至误导,但只有质量才是电影票房成功的最有力保障。电影制片人不仅要选择优秀的导演和演员,还要考虑电影内容本身的质量,以制作出具有巨大艺术价值和观众欢乐的电影。
网络评论对电影票房的影响主要来自于认知效应。因此,电影网络卖家应积极建立和完善第三方网站的消费者网评体系,鼓励消费者积极参与网评,提升消费者对产品讨论的热情,充分发挥网评的认知效应,促进电影票房快速增长。对于观众来说,要保持批判和理性的态度,不要轻易为低质量的影片买单。这也将有助于为中国电影业营造一个积极健康的氛围,遏制名人效应,减少低评分电影可以获得高票房的现象。
6.2. 研究不足与未来方向
第一,电影是体验式产品的典型代表,而网络评论是体验式产品评论的重要组成部分,电影本身也具有独特的行业特性。因此,基于影评数据的研究结论是否可以应用于其他产品,还有待进一步探索。第二,在线评论对电影票房的影响可能因地区而异,进一步的研究应该探索在线评论在不同社会、文化和经济背景下的影响,而不仅仅是从中国公司营销的角度。第三,关于模型的改进,可以影响产品销量的因素有很多,但网评只是其中的一部分。其他因素如广告和个人特征可能会影响销售。因此,因素的改善也是未来票房研究的重要方向。
基金项目
教育部人文社会科学研究规划基金项目“企业社会责任影响资源配置效率的作用机制、理性边界与实证研究”(编号:20YJA630024)的阶段性成果。
参考文献
[1] 郝晓玲, 陈晓梦. 体验型产品消费行为的羊群效应及机理研究——基于电影行业消费行为的实证解释[J]. 中国管理科学, 2019, 27(11): 176-188.
[2] Zhang, D., Wu, P. and Wu, C. (2021) The Role of Key Online Reviews in Affecting Online Hotel Booking: An Empirical Investigation. Industrial Management and Data Systems, 122, 499-520. https://doi.org/10.1108/IMDS-06-2021-0355
[3] Ludwig, S., De Ruyter, K., Friedman, M., Brüggen, E.C., Wetzels, M. and Pfann, G. (2013) More than Words: The Influence of Affective Content and Linguistic Style Matches in Online Reviews on Conversion Rates. Journal of Marketing, 77, 87-103. https://doi.org/10.1509/jm.11.0560
[4] Li, X., Wu, C. and Mai, F. (2019) The Effect of Online Reviews on Product Sales: A Joint Sentiment-Topic Analysis. Information and Management, 56, 172-184. https://doi.org/10.1016/j.im.2018.04.007
[5] Wang, F., Liu, X. and Fang, E.E. (2015) User Reviews Variance, Critic Reviews Variance, and Product Sales: An Exploration of Customer Breadth and Depth Effects. Journal of Retailing, 91, 372-389. https://doi.org/10.1016/j.jretai.2015.04.007
[6] Duan, W., Gu, B. and Whinston, A.B. (2008) The Dynamics of Online Word-of-Mouth and Product Sales—An Empirical Investigation of the Movie Industry. Journal of Retailing, 84, 233-242. https://doi.org/10.1016/j.jretai.2008.04.005
[7] 石文华, 钟碧园, 张绮. 在线影评和在线短评对票房收入影响的比较研究[J]. 中国管理科学, 2017(10): 162-170.
[8] Liu, Q.B. and Karahanna, E. (2017) The Dark Side of Reviews: The Swaying Effects of Online Product Reviews on Attribute Preference Construction. MIS Quarterly, 41, 427-448. https://doi.org/10.25300/MISQ/2017/41.2.05
[9] Ma, H., Kim, J.M. and Lee, E. (2019) Analyzing Dynamic Review Manipulation and Its Impact on Movie Box Office Revenue. Electronic Commerce Research and Applications, 35, Article ID: 100840. https://doi.org/10.1016/j.elerap.2019.100840
[10] Zhang, Z., Li, X. and Chen, Y. (2012) Deciphering Word-of-Mouth in Social Media: Text-Based Metrics of Consumer Reviews. ACM Transactions on Management Information Systems, 3, 1-23. https://doi.org/10.1145/2151163.2151168
[11] Hu, N., Koh, N.S. and Reddy, S.K. (2014) Ratings Lead You to the Product, Reviews Help You Clinch It? The Mediating Role of Online Review Sentiments on Product Sales. Decision Support Systems, 57, 42-53. https://doi.org/10.1016/j.dss.2013.07.009
[12] Xu, D., Ye, Q., Hong, H. and Sun, F. (2022) Emotions for Attention in Online Consumer Reviews: The Moderated Mediating Role of Review Helpfulness. Industrial Management and Data Systems, 122, 729-751. https://doi.org/10.1108/IMDS-07-2021-0473
[13] Kraft, F.B., Granbois, D.H. and Summers, J.O. (1973) Brand Evaluation and Brand Choice: A Longitudinal Study. Journal of Marketing Research, 10, 235-241. https://doi.org/10.1177/002224377301000303
[14] Jiménez, F.R. and Mendoza, N.A. (2013) Too Popular to Ignore: The Influence of Online Reviews on Purchase Intentions of Search and Experience Products. Journal of Interactive Marketing, 27, 226-235. https://doi.org/10.1016/j.intmar.2013.04.004
[15] Sabatino, S., Frangopol, D.M. and Dong, Y. (2015) Sustainability-Informed Maintenance Optimization of Highway Bridges Considering Multi-Attribute Utility and Risk Attitude. Engineering Structures, 102, 310-321. https://doi.org/10.1016/j.engstruct.2015.07.030
[16] Tirunillai, S., and Tellis, G.J. (2014) Mining Marketing Meaning from Online Chatter: Strategic Brand Analysis of Big Data Using Latent Dirichlet Allocation. Journal of Marketing Research, 51, 463-479. https://doi.org/10.1509/jmr.12.0106
[17] Blei, D.M., Ng, A.Y. and Jordan, M.I. (2003) Latent Dirichlet Allocation. Journal of Machine Learning Research, 3, 993-1022.
[18] Manek, A.S., Shenoy, P.D. and Mohan, M.C. (2017) Aspect Term Extraction for Sentiment Analysis in Large Movie Reviews Using Gini Index Feature Selection Method and SVM Classifier. World Wide Web, 20, 135-154. https://doi.org/10.1007/s11280-015-0381-x
[19] Sha, H., Hasan, M.A., Mohler, G. and Brantingham, P.J. (2020) Dynamic Topic Modeling of the COVID-19 Twitter Narrative among US Governors and Cabinet Executives. arXiv preprint arXiv: 2004.11692. https://arxiv.org/abs/2004.11692
[20] Yao, F. and Wang, Y. (2020) Tracking Urban Geo-Topics Based on Dynamic Topic Model. Computers, Environment and Urban Systems, 79, Article ID: 101419. https://doi.org/10.1016/j.compenvurbsys.2019.101419
[21] Koenker, R. (2004) Quantreg: An R Package for Quantile Regression and Related Methods. The Comprehensive R Archive Net-Work Website.
NOTES
1https://www.looper.com/85579/movies-scored-big-boxoffice-despite-terrible-rotten-tomatoes-scores/