基于情感分析的影评数据挖掘
Data Min-ing in Film Review with Sentiment Analysis
DOI: 10.12677/HJDM.2019.92003, PDF,  被引量    科研立项经费支持
作者: 夏启政, 董益好:上海对外经贸大学,上海
关键词: 豆瓣网影评情感分析电影评分 Douban Film Review Sentiment Analysis Film Score
摘要: 用户评论已经成为人们选择商品的重要参考目标,影评亦是如此。为了帮助浏览者有效的解读影评文本,了解影评中的情感因素,寻找他们想要了解的内容,并通过评分的方式让用户了解电影整体评价;本文基于中文文本情感分析,获取影评中的评论者情感,基于《战狼2》和《红海行动》两部电影的豆瓣网的影评数据,分析影评文本中的情感倾向,并构建影评特征词表,进而绘制“影评–影评特征”二分网络,分析每条评论中的情感特征,结合用户的评价评分信息,最终构建包含影评情感信息的电影评分模型。通过与原始豆瓣评分比较,发现在考虑到用户影评情感信息后的电影评分与原始豆瓣评分有一定差异,而这些差异大部分是由于用户情感导致的,据此给出电影评分评价模型。
Abstract: The purpose of this paper is to improve the resolvability of film review, the understanding of the review for network users and become comprehensive approach in evaluation of film. Based on the information of Wolf Warriors 2 and OPERATION RED SEA on Douban, we construct “review feature” form and draw the bipartite network of “review-feature”. Second, we put forward a new score model by complex network projection and sentiment analysis. Then, utilizing complex network projection compute the sentiment score of two films and combining with the “star” score from users’ scoring information get the integral score of two films. Finally utilizing the model in other film website computes the score to check it effectiveness. It shows the co-occurrence and relevance between review and the feature under the bipartite network and the sentiment difference among different feature. Comparing with the films’ score on Douban, the score with sentiment information shows better performance in explaining the film evaluation. Besides, it gets the consistent score in other film website by utilizing the model.
文章引用:夏启政, 董益好. 基于情感分析的影评数据挖掘[J]. 数据挖掘, 2019, 9(2): 18-26. https://doi.org/10.12677/HJDM.2019.92003

参考文献

[1] 卢伟聪, 徐健. 基于二分网络的网络用户评论情感分析[J]. 情报理论与实践, 2017, 41(2): 121-126.
[2] 石文学. 数字化与商业化视野中的网络影评[J]. 北京电影学院学报, 2016(4): 39-45.
[3] 赵妍妍, 秦兵, 刘挺. 文本情感分析[J]. 软件学报, 2010, 21(8): 1834-1848.
[4] 郭宇, 王晰巍, 李师萌, 王楠, 阿雪. 基于情感分析的社会网络用户[J]. 情报学报, 2017, 36(11): 1139-1147.
[5] 王伟军, 黄英辉, 李颖, 刘辉, 张婷婷, 刘凯. 基于微博公众情感状态的新产品市场预测研究[J]. 情报学报, 2017, 36(5): 511-522.
[6] 潘云仙, 袁方. 基于JST模型的新闻文本的情感分类研究[J]. 郑州大学学报(理学版), 2015, 47(1): 64-68.
[7] 黄昭婷, 刘媛, 丁鑫. 一种基于影评文本情感分析的电影特征模型[J]. 现代电影技术, 2017(9): 26-30.
[8] 周敬一, 郭燕, 丁友东. 基于深度学习的中文影评情感分析[J]. 上海大学学报(自然学科版), 2018, 24(5): 703-712.
[9] Katz, E. and Lazarsfeld, P.F. (1955) Personal Influence: The Part Played People in the Flow of Mass Communications. Free Press, New York.
[10] 周纯洁, 黎崾, 徐翼龙. 文本情感分析研究[J]. 计算机科学, 2018, 45(10A): 296-299.
[11] Ghose, A. and Ipeirotis, P.G. (2007) Designing Novel Review Ranking Systems: Predicting the Usefulness and Impact of Reviews. ACM, New York, 303-310.
[12] 郝媛媛, 邹鹏, 李一军, 叶强. 基于电影面板数据的在线评论情感倾向对销售收入影响的实证研究[J]. 管理评论, 2019, 21(10): 95-103.
[13] 刘志明. 跨文化视角下在线评论有用性研究——基于说服双过程模型[J]. 江汉学术, 2015, 34(4): 79-85.
[14] 马松岳, 许鑫. 基于评论情感分析的用户在线评价研究——以豆瓣网电影为例[J]. 图书情报工作, 2016, 60(10): 95-102.
[15] Bismil, R., Dudek, N.K. and Wood, T.J. (2014) In-Training Evaluations: Developing an Automated Screening Tool to Measure Report Quality. Medical Education, 48, 724-732.
[16] 赵光霞, 宋心蕊. “红海行动” “战狼2”投资场景升级军事大片展示中国力量[N/OL]. 南方日报, 2016-07-12.
http://media.people.com.cn/n1/2017/0712/c14677-29399034.html