基于TextBlob与VADER的《盗梦空间》电影评论情感分析研究
A Sentiment Analysis of Inception Movie Reviews Based on TextBlob and VADER
DOI: 10.12677/ml.2025.137707, PDF, HTML, XML,   
作者: 王雨婷:上海海事大学外国语学院,江苏 南京
关键词: 电影评论情感分析自然语言处理Movie Reviews Sentiment Analysis Natural Language Processing
摘要: 随着互联网技术的发展,电影评论网站积累了大量用户评论数据。对这些评论进行情感分析不仅能够帮助用户快速了解电影口碑,也为电影产业提供有价值的决策参考。本研究以电影《盗梦空间》(Inception)的英文评论数据为研究对象,采用TextBlob工具对评论数据进行情感分类,分析评论的极性分数以判断观众对该电影的情感倾向为积极或消极,同时引入VADER工具进行补充,进一步分析影评中的情绪强度分布,以增强情感分析的深度和多维度表现。研究结果表明,绝大多数评论呈现出积极情感倾向,显示《盗梦空间》在观众中具有较高的认可度。然而,也有一部分评论表达了消极情绪,主要集中在对情节复杂性和结局开放性的不满。本研究验证了TextBlob在情感分析任务中的有效性,并展示了其在电影评论情感分析中的应用价值,为电影评论情感分析提供了有效的实践方法。
Abstract: With the rapid development of internet technologies, movie review platforms have accumulated a large volume of user-generated content. Analyzing the sentiment of these reviews not only helps users quickly grasp the general reception of a film but also provides valuable insights for decision-making in the film industry. This study focuses on English-language reviews of the movie Inception and employs the TextBlob to perform sentiment classification. By analyzing the polarity scores of the reviews, the study determines whether viewers’ attitudes toward the movie are generally positive or negative. At the same time, the VADER was introduced as a supplement to further analyze the distribution of sentiment intensity in the reviews, enhancing the depth and multidimensionality of the sentiment analysis. The findings indicate that the vast majority of reviews exhibit a positive sentiment, reflecting a high level of audience approval for Inception. However, a portion of the reviews expresses negative sentiments, primarily related to dissatisfaction with the film’s complex plot and open-ended conclusion. This research confirms the effectiveness of TextBlob in sentiment analysis tasks and demonstrates its practical value in analyzing movie reviews, offering an efficient method for sentiment assessment in this domain.
文章引用:王雨婷. 基于TextBlob与VADER的《盗梦空间》电影评论情感分析研究[J]. 现代语言学, 2025, 13(7): 259-266. https://doi.org/10.12677/ml.2025.137707

1. 引言

随着互联网的普及,用户在社交媒体和在线平台上生成了海量文本数据,反映其观点与情感。电影评论作为其中的重要组成部分,不仅体现观众的态度,也为电影行业提供了市场反馈和决策依据。如何从评论中高效提取情感信息,成为情感分析(Sentiment Analysis)领域的重要研究方向。

情感分析是自然语言处理(Natural Language Processing, NLP)的核心任务之一,旨在识别文本的情感倾向(如积极、消极或中立),广泛应用于商业决策、舆情监测与推荐系统等场景。电影评论中的情感信息不仅影响观众选择,也关系到票房与品牌建设。通过情感分析,制片方可预测市场反应,平台可优化推荐策略,广告商亦能制定更精准的营销方案。因此,对电影评论开展情感分析研究具有重要的理论价值与实践意义。

本研究旨在对电影《盗梦空间》的英文评论进行情感分析,探讨观众的整体情感倾向,并挖掘可能影响用户评价的关键因素。在方法论层面,情感分析技术涵盖情感词典、机器学习和深度学习等路径。本研究以电影《盗梦空间》的英文评论为对象,采用了基于情感词典的TextBlob工具对评论进行情感极性分析,并结合VADER工具对情绪强度作补充分析,旨在评估基于规则的情感分析方法在大规模文本处理中的可行性和有效性,拓展情感分析在实际应用中的方法体系。研究大致流程为:① 收集电影《盗梦空间》的英文评论数据;② 对评论数据进行预处理;③ 采用TextBlob对电影评论进行情感极性分类,引入VADER补充情绪强度判断;④ 基于情感分析结果,探讨观众情感倾向。

2. 文献综述

情感是人对客观事物是否满足自己的需要而产生的态度体验[1]。情感可以表现为人们对于某个事物的态度、评价、情绪或者观点。在情感分析中,情感的概念被认为等同于观点、评价、态度和情绪等,所以情感分析也被称为观点挖掘、评价抽取、主观分析[2]

情感分析,是文本挖掘的一个细分研究领域,情感分析运用自然语言处理、文本分析和相关计算机技术自动抽取或分类文本中的情感[3]。情感分析属于信息检索、自然语言处理和人工智能的交叉研究领域,包含了从基础到高级的多层次子任务,其中最早探索的任务是较粗粒度的情感分类任务[4],即将文本分为预定义的情感类别,如积极、消极或中性等。情感分析的主要研究对象是互联网中海量存在的商品评论、微博、博客和论坛帖子等文本。通过分析这些文本,企业可通过大量的产品评论实时和快速地获取顾客反馈数据来提升产品竞争力,以更好地理解网络用户行为,为企业和组织提供强大的决策支持[5]

当前,情感分析的方法多种多样,包括基于情感词典的情感分析方法、基于机器学习的情感分析方法、以及基于深度学习的情感分析方法等。基于情感词典的情感文本分类是传统的情感分析方法,其计算方式是通过构建情感词典来计算句子中的情感得分,然后根据情感得分来对文本进行分类[6]。Whissell [7]最早提出情感词典方法,之后又有很多的学者对情感词典的方法展开研究。例如,李寿山等人[8]根据英文情感词典的中文翻译,得到了较为完整的中文情感词典。魏慧玲[9]在句法关系及词性模板的基础上,抽取了小米公司产品评论的特征词和情感词对,对产品特征做文本情感分类。

由于情感词典分析过于依赖于构建的词典,所以很多学者便开展机器学习对文本进行情感分析的研究,常见的应用于文本分类的机器学习方法有朴素贝叶斯、支持向量机、最大熵等方法。Pang等人[10]第一次将有监督学习方法应用到文本的情感分类中,对比分析了传统机器学习模型的分类效果,得出在模型准确率方面SVM模型的值最高,分析效果最好。Whitelaw等人[11]选取了带有形容词的词语作为特征项,并使用词袋模型将文本向量化表示,之后使用SVM作为情感倾向分类器的算法。徐军等人[12]采用最大熵模型和朴素贝叶斯模型对新闻文本和评论语料进行情感分类研究,实验结果表明,基于机器学习的方法在该类文本的情感识别任务中表现出良好的分类性能。

深度学习则是更为深层次的机器学习,由于其结构由多维神经网络构成,所以常用于处理一些高维数据,例如图像、语音、文本等,并且在文本的情感分析领域也取得了很好的成效。常见的深度学习模型有卷积神经网络(CNN),循环神经网络(RNN),长短时记忆网络(LSTM)等。Kim [13]提出了基于卷积神经网络(RNN)的文本分类方法,并在多个情感分析数据集上取得了优秀的结果。Zheng [14]创建了BRCAN模型,该模型借助Word2vec模型和注意机制有效地结合了Bi-LSTM和CNN,实现了细粒度文本分类。Jang [15]构建BiLSTM-CNN-attention对IMDB电影评论数据进行情感分类,解决了数据中长期依赖问题和随着训练数据大小增加而发生的数据丢失问题。Pandey [16]提出的BERT-LSTM模型能够更有效地检测出讽刺句,和LSTM模型相比性能得到大幅提升。

3. 方法论

本研究以电影《盗梦空间》的英文评论为研究对象,从IMDb和Rotten Tomatoes两大主流电影评论平台收集相关数据,各筛选出500余条具有代表性的评论,共计构建了包含1000多条具体评价内容的评论数据集,并将其整理保存为名为Inception_reviews.txt的文本文件,作为后续情感分析的基础语料。

为了保证情感分析的准确性,数据预处理是不可或缺的一步。在数据预处理阶段,首先对原始评论文本进行清洗,去除特殊字符、无意义的标点符号及多余的空格。此步骤确保了评论文本的整洁,减少了无关信息对情感分析模型的干扰。然后,对所有评论文本进行小写化处理,确保文本统一性。最后,考虑是否需要去除停用词。在情感分析任务中,某些停用词(如“is”、“not”、“very”等)可能对情感的判定有重要作用。例如:“not good”表示负面情感,如果去掉“not”就会失去消极情感的提示。“very good”的“very”则强化了情感的积极倾向。所以,停用词在情感分析中有时对准确识别情感是必需的,不需要特意去除。

在数据预处理完成后,使用Python中的TextBlob工具进行情感极性和主观性分析,得出结果并生成文件inception_sentiment_results.csv,可结合直观的柱状图和散点图对结果进行可视化分析。TextBlob是一个简便的情感分析库,它通过计算每条评论的情感极性(polarity)和主观性(subjectivity)来进行分类。本研究对每条评论应用TextBlob的情感分析功能,计算其极性和主观性得分。根据极性得分的大小,可将评论分为积极、消极或中性三类。情感极性的取值范围为[−1, 1],如果polarity值接近1,表示评论情感倾向积极;接近−1表示评论情感倾向消极;接近0则表示中性评论。通过主观性得分,可分析评论是否倾向于表达个人感受。主观性的取值范围为[0, 1],如果subjectivity值接近1,表示评论偏主观,接近0表示评论偏客观。

为进一步增强情感分析的维度与结果的可信度,本文在使用TextBlob工具进行极性与主观性分析的基础上,补充引入了适用于短文本情境的VADER工具,对影评文本进行情绪强度分析。VADER是一种基于规则与词典的情感分析方法,可输出积极、消极、中性及综合得分(compound),其中compound值反映文本的整体情绪倾向强度。本文通过调用VADER中的SentimentIntensityAnalyzer模块,对每条评论提取compound得分,并绘制情绪强度分布直方图,直观展示评论的情绪分布情况。该方法有效补充了TextBlob未覆盖的情绪强度维度,为后续对比分析提供了更丰富的数据支持。

4. 结果与分析

通过TextBlob工具对电影《盗梦空间》的1000条英文评论进行情感分析,得出了电影评论的情感分布。对结果进行极性和主观性的可视化分析,如图1~3所示。

通过图1 Polarity值的分布图可以发现,绝大部分评论呈现积极的情感倾向,少部分评论偏向消极情感。也有一部分偏向中性的评论。图2 Subjectivity值的分布图显示主观性分布较为均匀,集中在0.4到0.6之间,这意味着多数评论在表达时包含了一定程度的个人主观观点,而不是完全客观的叙述。

Figure 1. Polarity distribution

1. 极性分布

Figure 2. Subjectivity distribution

2. 主观性分布

Figure 3. Scatter plot of polarity vs. subjectivity

3. 极性与主观性散点图

呈现积极情感的评论,主要是对电影的视觉效果、剧情复杂性、演员表现以及导演诺兰的才华表示赞赏,尤其在电影的创新性和思想深度方面给出了较高评价。例如:

评论1“inception is magnificent”情感极性为1,主观性为1。

评论2“the century had casablanca star wars the godfather blade runner and others this is the first of the st century masterpieces”情感极性为0.59,主观性为0.84。

呈现消极情感的评论,主要批评了电影的角色发展不足、情节过于复杂、观众缺乏共鸣以及过度依赖特效等。例如:

评论3“the movie is supposed to make you think but if you think about it the whole plot falls apart”情感极性为−0.25,主观性为0.55。

评论4“the root problem is that nolan replaces the fascinating surrealism of dream worlds with lengthy outtakes from james bond movies”情感极性为−0.294,主观性为0.573。

情感表达较为中立的评论,既没有过度褒扬也没有明显批评,主要描述的是电影的基本内容。例如:

评论5“dom cobb leads a highly skilled team specializing in stealing secrets from peoples minds by entering their dreams”情感极性为0.004,主观性为0.61。

评论6“more will be added soon”情感极性为0.5,主观性为0.5。

通过图3 Polarity vs. Subjectivity散点图可知,大部分点集中在Polarity的0~0.5区域,Subjectivity在0.4~0.7区域,表明主观性中等的积极评论较多,消极评论较少;主观性较高的评论会出现在不同情感极性上,但数量相对较少。此外,点的分布较为松散,说明Polarity值和Subjectivity值并没有非常强的线性关系,即评论的正负情感与主观性之间没有明显的相关性。观众可能同时表达强烈的个人观点和中性情感,也可能对电影持积极情感但表达较客观。

进一步引入VADER工具对电影《盗梦空间》的1000余条英文评论的情绪强度进行补充分析,得出了该电影评论的情绪强度得分,拓展了情感分析的深度与广度,为电影评论情感分析提供了一种切实可行的多工具联合应用的实践路径。对其结果进行可视化分析,如图4所示:

Figure 4. Distribution of compound sentiment scores

4. 情绪强度得分分布

图4情绪强度得分的直方图中可以看出,大多数评论的情绪倾向集中于正值区域,尤其是在0.5至1.0之间,这表明用户普遍对电影《盗梦空间》持积极评价。其中,得分在0.75以上的评论数量最多,反映出评论中存在大量高度肯定的正面情感表达,如“视觉效果震撼”、“剧情精彩”、“设定新颖”等等。

相较之下,负面情绪评论(得分小于0)的比例相对较低,且极端负面得分(接近−1)的评论数量极少,说明影片并未引发大范围的负面反馈。同时,中性或情感表达模糊的评论(得分接近0)也较少,进一步印证了观众对该电影的情感态度较为明确,评价趋于两极分布中的积极一端。

通过与TextBlob所给出的极性得分分布对比,VADER提供的compound情绪强度得分具有更细致的层次感,能更清晰地反映评论情绪的强弱程度。这一差异说明引入VADER作补充分析可以在情绪可视化方面提供更高的区分度,从而增强研究的多维度分析能力,也验证了影片《盗梦空间》的较高受欢迎程度。

综上,电影《盗梦空间》总体上受到观众的正面评价,评论通常保持理性和客观,少有极端的情感表现。这种数据分布符合该类高口碑电影的评论特征。通过上述各种分析,本研究完成了评论数据的收集、预处理、情感分析和结果解读等全流程工作,不仅验证了TextBlob和VADER在电影评论情感分析领域的准确性和适用性,为其他研究者提供了情感分析工具选择的参考依据,同时也为电影行业提供了有效的情感分析工具,帮助制作方了解观众对电影的情感倾向和接受度,为后续的电影制作和营销提供数据支持。

《盗梦空间》作为一部复杂且富有哲理性的电影,其英文评论的情感分析在字幕翻译中也发挥了十分重要的作用。电影评论不仅关乎电影情节,还涉及对电影艺术性、演员表现、视觉效果等方面的情感反应。对此进行情感分析能够帮助译者精准地捕捉评论中观众的情感倾向,从而在字幕翻译过程中更好地传递这些情感。例如,译者可以根据影评的情感分析结果调整词汇的情感色彩,选择合适的翻译方法,保证译文在观众心中传达出相似的情感反应,以确保目标语言受众能够准确感受到原字幕的情感氛围。此外,不同文化背景的观众对同一部电影的情感反应可能不同。情感分析不仅可以揭示评论中情感的基本倾向,还能帮助译者理解可能的文化差异。例如,英文评论中对《盗梦空间》的高度评价可能与西方观众对电影叙事结构的接受度有关,而在中文评论中,可能更多关注电影的娱乐性和视觉效果。情感分析工具可以帮助译者识别并考虑这些文化差异,以便在字幕翻译时做出适当的调整,使翻译版本更符合目标文化的观众期望。

5. 总结与展望

本研究以电影《盗梦空间》的英文影评数据为研究对象,采用TextBlob工具对评论文本进行情感极性分析,以判断观众对该电影的情感态度,同时引入VADER工具对电影评论的情绪强度进行补充分析。VADER能够提供更细致的情绪分数,尤其在衡量情感表达的强弱程度方面具有优势,从而弥补了TextBlob在强度判断上的不足。通过对比分析,验证了VADER在多维度情感分析中的实用性与补充价值。研究结果显示,绝大多数评论表达了积极情感,充分肯定了该片在叙事创新、视觉效果以及思想深度等方面的表现。然而,亦有部分评论流露出消极情绪,主要集中在对其复杂叙事结构和理解门槛较高等方面的质疑。

尽管本研究结合使用了TextBlob和VADER,实现了对极性、主观性和情绪强度的分析,研究取得了一定成果,但在数据来源、分析工具多样性和情感分析的深度等方面仍存在局限性。一方面,本研究所用数据仅来源于从IMDb和Rotten Tomatoes这两个平台选取的1000多条影评,无法全面代表所有观众的情感,且影评数量较小,可能导致样本代表性不足,影响研究结果的普适性与广泛适用性。另一方面,TextBlob和VADER都属于基于词典和规则的情感分析工具,虽然易于实现且解释性强,但在处理语境依赖较强的评论(如反讽、双关、复杂情绪交织等)时仍存在一定局限。未来研究可进一步引入基于深度学习的上下文模型(如BERT、RoBERTa等),以提升情感识别的准确性和语义理解能力。

基于此,未来的研究可以在以下几个方向进行改进和拓展:(1) 扩大数据来源与规模。为获得更具代表性的情感分析结果,可以扩大数据的来源范围,涵盖更多的评论平台(如社交媒体、博客、新闻网站等),同时增加数据集规模,提升统计分析的可靠性。此外,可结合电影的国际市场表现,分析不同文化背景下的情感差异。(2) 引入除TextBlob和VADER外的多种情感分析工具与方法。未来研究可尝试结合多种情感分析工具对同一数据集进行多维度情感分析,并通过模型对比验证分析的准确性和鲁棒性。同时,可以引入基于机器学习的情感分析模型或基于深度学习的情感分析模型,以提高对复杂语境中情感表达的理解能力。(3) 细化情感分类维度。除了情感极性的正负分类与情绪强度的分布,未来研究可以进一步探索具体情感类型(如愤怒、惊讶、悲伤)的分布,分析情感倾向与评论内容主题之间的关系。通过构建多维情感分析框架,可以为电影内容创作和改进提供更加精细化的指导。

综上所述,本研究不仅验证了TextBlob和VADER在电影评论情感分析中的应用潜力,也为未来研究提供了重要的参考方向。随着自然语言处理技术的不断进步,情感分析在电影评论领域的研究将更加深入,推动情感数据在电影产业中的广泛应用,为电影创作和产业发展注入新的动力。

参考文献

[1] 林崇德, 杨治良, 黄希庭. 心理学大辞典[M]. 上海: 上海教育出版社, 2003.
[2] Liu, B. (2012) Sentiment Analysis and Opinion Mining. Morgan & Claypool Publishers.
[3] Mohey, D. (2016) A Survey on Sentiment Analysis Challenges.
http://www.sciencedirect.com/cience/arti-cle/pii/S1018363916300071
[4] Turney, P.D. (2002) Thumbs up or Thumbs down? Semantic Orientation Applied to Unsupervised Classification of Reviews.
[5] 唐晓波, 刘广超. 细粒度情感分析研究综述[J]. 图书情报工作, 2017, 61(5): 132-140.
[6] 吴思文. 基于深度学习的电影评论情感分析方法研究[D]: [硕士学位论文]. 兰州: 西北师范大学, 2024.
[7] Whissell, C. (1998) Objective Analysis of Text: II. Using an Emotional Compass to Describe the Emotional Tone of Situation Comedies. Psychological Reports, 82, 643-646.
https://doi.org/10.2466/pr0.1998.82.2.643
[8] 李寿山, 李逸薇, 黄居仁, 等. 基于双语信息和标签传播算法的中文情感词典构建方法[J]. 中文信息学报, 2013, 27(6): 75-81.
[9] 魏慧玲. 文本情感分析在产品评论中的应用研究[D]: [硕士学位论文]. 北京: 北京交通大学, 2014.
[10] Pang, T.B., Pang, B. and Lee, L. (2002) Thumbs up Sentiment Classification Using Machine Learning. Proceedings of the 2002 Conference on Empirical Methods in Natural Language Processing, EMNLP 2002, Philadelphia, 6-7 July 2002, 79-86.
[11] Whitelaw, C., Garg, N. and Argamon, S. (2005) Using Appraisal Groups for Sentiment Analysis. Proceedings of the 14th ACM International Conference on Information and Knowledge Management, Bremen, 31 October-5 November 2005, 625-631.
https://doi.org/10.1145/1099554.1099714
[12] 徐军, 丁宇新, 王晓龙. 使用机器学习方法进行新闻的情感自动分类[J]. 中文信息学报, 2007, 21(6): 95-100.
[13] Kim, Y. (2014) Convolutional Neural Networks for Sentence Classification. Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), Doha, 25-29 October 2014, 1746-1751.
https://doi.org/10.3115/v1/d14-1181
[14] Zheng, J. and Zheng, L. (2019) A Hybrid Bidirectional Recurrent Convolutional Neural Network Attention-Based Model for Text Classification. IEEE Access, 7, 106673-106685.
https://doi.org/10.1109/access.2019.2932619
[15] Jang, B., Kim, M., Harerimana, G., Kang, S. and Kim, J.W. (2020) Bi-LSTM Model to Increase Accuracy in Text Classification: Combining Word2vec CNN and Attention Mechanism. Applied Sciences, 10, Article No. 5841.
https://doi.org/10.3390/app10175841
[16] Pandey, R. and Singh, J.P. (2022) BERT-LSTM Model for Sarcasm Detection in Code-Mixed Social Media Post. Journal of Intelligent Information Systems, 60, 235-254.
https://doi.org/10.1007/s10844-022-00755-z