1. 引言
互动媒介生产平台的飞速发展,从技术层次上降低了用户参与网络公共文化的门槛,使得集消费、生产、传播于一体的互动参与成为网络二次文化生成的主要形态。弹幕评论作为视频社区用户参与视频观看、文化交流以及二次文化创造的主要形式,当用户在观看视频时,发表的评论可以准确地反映其观点与态度,并能与其他在线用户进行实时交流。通过用户的视频观看日常行为的表达,形成了一种基于视频的文化参与氛围。弹幕评论是考察互动式参与文化形成路径的重要切入口。已有研究主要关注弹幕评论文本的“主题内容”、“情感特征”等,以及基于对两者关注而具有的用户行为预测、事态发展预测等实用性功能;较少关注“视频文本”及三者之间的关系。因此,本研究将以B站视频为例,尝试对三者进行关联分析,通过不同类型视频弹幕评论的主题、情感与视频内容间的内在关系,分析基于视频弹幕的参与式文化形成路径。
2. 文本分析对象的选择
为了保证文本数据的充足性和研究的可靠性,研究选择三个不同内容类型、热度较高、弹幕数量均过万的视频。“不同内容类型”基于考察不同类型视频弹幕评论的呈现形态及与视频内容的相关性,确保不同类型文本间的可比较性。“热度较高”指观看人数较多。“弹幕数量均过万”是为了保证有足够的、有效的,可供分析的弹幕语料。为避免弹幕内容受到粉丝文化的过度影响,保证研究的客观性,避免选择有流量明星参与的视频。
基于以上标准,本研究从哔哩哔哩弹幕网(简称“B站”)选择了知识传播型视频《中国通史》(2020年)、历史剧集《三国演义》(1994年)、时装职场剧《三悦有了新工作》(2023年)。随机各抽选出一个剧集,使用Python工具对相应剧集共抽取14,468条弹幕(截至2024年6月20日)。见表1。
Table 1. Selection of research sample
表1. 研究样本选择
序号 |
类型 |
视频名称 |
所选剧集 |
视频内容 |
时长 |
弹幕数 |
1 |
知识传播型 |
《中国通史》 |
19集 |
楚汉之争 |
44分钟 |
5865 |
2 |
历史剧集型 |
《三国演义》(1994版) |
14集 |
关云长挂印封金 |
44分钟 |
3050 |
3 |
时装职场剧型 |
《三悦有了新工作》 |
1集 |
赵三悦找到殡仪师工作 |
54分钟 |
5553 |
3. 弹幕文本的数据处理与可视化分析
通过对爬虫视频弹幕进行数据抓取,并生成DataFrame二维数据,再对数据进行词频分析、情感分析与主题聚类识别进行可视化分析,可以把握受众在观看视频时所持的观点、态度及情感表达;发现弹幕文本中隐含的话题或主题,分析基于视频文本而形成的弹幕议题。
3.1. 弹幕词频分析
通过统计和分析文本词汇出现的次数,可以深入了解文本的主题及议程分布。由于弹幕交流的实时性与临场性,用户会发送一些无意义的词语,如颜表情、外国语、特殊符号、表情包、符号、无意义字窜等。通过对视频弹幕进行数据抓取之后,先对获得的数据进行预处理,包括词语分离、去除重复和无效的信息和表情符号等,生成DataFrame二维数据后,再制作可视化成图表,如图1、图2、图3。各文本排名前六的高频词,《中国通史》为项羽、韩信、刘邦、历史、张良、英雄;《三国演义》为刘备、曹操、老板、英雄、皇叔、关羽;《三悦有了新工作》为哈哈哈、这个、真的、真实、好像、三悦(见图1、图2、图3)。
Figure 1. “General History of China” bullet screen high-frequency words
图1. 《中国通史》弹幕高频词
Figure 2. “Romance of the Three Kingdoms” bullet screen high-frequency words
图2. 《三国演义》弹幕高频词
Figure 3. “San Yue has a new job” bullet screen high frequency words
图3. 《三悦有了新工作》弹幕高频词
3.2. 弹幕情感分析
对文本信息进行情感倾向挖掘,通过计算分析弹幕评论的情感分值,可以分析用户对视频的情感度与文本体验的依赖度。研究采用百度为弹幕评论开发的多维情感词典,以及极性表进行情感分析。在研究中,研究样本3中有较多网络用语,如“哈哈哈”“玛卡巴卡”“奥力给”“666”等,结合视频文本判断这些网络用语的词性和当下情感类型,再替换为同类型的中文词语,以此提高情感预测的准确度。获得结果如图4、图5、图6:各图中x轴标签为“情感分值”,y轴标签为“占比%”。x轴上标注了从0.0到1.0的数值,表示不同的情感分值区间;0表示最悲观的评论,1表示最乐观的评论。y轴则展示了各个情感分值区间在总评论中的占比百分比(见图4、图5、图6)。
Figure 4. An emotional analysis of bullet screen in “General History of China”
图4. 《中国通史》弹幕情感分析
Figure 5. Emotion analysis of bullet screen in “Romance of the Three Kingdoms”
图5. 《三国演义》弹幕情感分析
Figure 6. Emotion analysis of bullet screen in “San Yue has a new job”
图6. 《三悦有了新工作》弹幕情感分析
在图4样本1中,弹幕主要集中出现在知识信息输出的时间点,情感分值从0到1分布较匀称,这说明知识型视频用户对视频所涉及历史知识持较中立、客观的态度,但也会因个人偏爱有一定的情感倾向。在图5样本2中,情感分值在0.0~0.1、0.4~0.5、0.9~1.0之间的弹幕评论数量最多,说明对有客观知识背景的历史剧的用户对视频内容的看法,存在着因内容而产生变化的极化现象。在图6中样本3中,情感分值则明显分为三个不同的分布层,0.7~1.0最多,0.0~0.1次之,0.1~0.7再次之;结合样本3情感与时间分布的关系,可知用户对视频内容经历一个接受、批判接受、代入的情感变化发展过程。
3.3. 主题聚类识别
为了验证弹幕主题与情感分析中提出的弹幕与文本内容之间的关联度,本研究通过LDA进行主题词提取,以得到弹幕数据主题聚类。考虑到弹幕文本具有年轻化、碎片化的后现代特征,为确保主题词提取的准确性,同时采用了传统的文本分析方法,对每个高频词所在的文本进行手动主题分类。并通过随机方法对弹幕文本所述视频帧内容进行检验,以确认两者之间的关系,最终得出了弹幕数据主题聚类。表2样本1《中国通史》的主题集中于中签到、历史、评价、情绪表达;表3样本2《三国演义》的主题集中于刘备、曹操、张飞、汉室;表4样本3《三悦有了新工作》主题集中于原生家庭、演技、职场、情绪表达。
Table 2. Cluster table of themes in “General History of China”
表2. 《中国通史》主题聚类表
主题 |
特征词 |
签到 |
签到、打卡、上线、续气、一口气(到多少集)、作业、我来、老师…… |
历史 |
英雄、汉族、刘亭长、汉文帝、刘三、霸王别姬、楚、秦、项籍、楚河汉界、鸿门宴、韩信、匈奴…… |
评价 |
大片、精彩、落泪、传奇、文案…… |
情绪 |
么么哒、喜欢、落泪、太好了…… |
Table 3. Cluster table of themes in “Romance of the Three Kingdoms”
表3. 《三国演义》主题聚类表
主题 |
特征词 |
刘备 |
三国杀、加特林、英雄、曹操、韬光养晦、高射炮、孙策、吕布、龙凤之姿、张飞、汉室…… |
曹操 |
刘备、董卓、丞相、汉献帝、曹氏、集团、曹孟德、荀彧、刘备、黄巾之乱、谋反、忠贞 |
张飞 |
关羽、三叔、日常可爱、是非、爆脾气、飞飞、书法、文武双全、大汉车骑将军…… |
汉室 |
刘渊、宗亲、刘备、中兴、刘协、汉帝、荀攸、荀彧、匡扶汉室发、曹孟德、诸侯、原著…… |
刘备 |
三国杀、加特林、英雄、曹操、韬光养晦、高射炮、孙策、吕布、龙凤之姿、张飞、汉室…… |
Table 4. Cluster table of themes in “San Yue has a new job”
表4. 《三悦有了新工作》主题聚类表
主题 |
特征词 |
原生家庭 |
伤痛、成长、治愈、共性、泪目、自我、觉醒、抚平、原生家庭、老人、陪伴、父母…… |
演技 |
温柔、悲情、写真、剧本、演技派、追剧、演技派、天赋、在线、炸裂…… |
职场 |
入职、殡葬专业学生、入殓师、挣得不少、新客户、专业、婚纱店、殡仪馆、殡葬行业…… |
情绪 |
伤痛、成长、治愈、共性、泪目、自我、觉醒、抚平、原生家庭、老人、陪伴、父母…… |
4. 基于弹幕的互动式参与文化形成的特性与路径
4.1. 弹幕形成的文本依赖性
弹幕为一种特殊的网络文本生成方式,文本生成类型依赖于其所依托的视频文本的特性,视频文本天然的具有议题设置功能。根据不同内容类型的视频以及视频参与者的目的、态度和方式,生成的弹幕文本类型倾向也十分明显。有学者从传播功能角度,将弹幕文本分为四个类型:包括特定用途工具弹幕(护眼、预告、强调、字幕弹幕)、观点型弹幕、立场型弹幕、情绪型弹幕[1]。
知识型《中国通史》中的弹幕文本主要以观点型和立场型为主。弹幕主题集中于“签到”和“历史”。在“签到”主题中,观众通过表达自己对视频内容的学习立场,使用关键词如“签到”、“上线”、“一口气(到多少集)”、“作业”、“老师”等形式表达自己的立场。而在“历史”主题中,观众通过与视频内容密切相关的词汇,如“英雄”、“汉族”、“刘亭长”、“鸿门宴”等,来表达自己对所学内容的观点和看法。
历名剧集《三国演义》兼具知识型与娱乐型,弹幕文本以立场弹幕和情绪弹幕为主,在表达立场和情绪的同时,兼顾有观点的表达。弹幕的主题主要聚焦于“刘备”“曹操”“张飞”“汉室”,呈现出观众对于这些历史人物和事件的个人认知和评价,例如“刘备”主题中出现“韬光养晦”等词汇,而“曹操”主题中涉及“谋反”、“忠贞”等词汇,同时“张飞”主题则包括“爆脾气”、“文武双全”等内容。这些弹幕不仅反映了视频内容和主题的表达,同时也展示了观众情感和立场,并融合了对相关内容观点的表述。
时装职场剧《三悦有了新工作》,其弹幕主题同样以立场弹幕和情绪弹幕为主。在表达立场和情绪的同时,更多关注与参与者个体生命、生活体验相关的观点表达。立场型的弹幕主题集中于对“原生家庭”“职场”的剧情评价和自我成长评价与感叹。其立场型弹幕表现出极强的视频文本生发性,即视频文本内容隐性设置了弹幕内容,但观影者的弹幕参与表现出了强烈的个体倾向,表现了更强于样本1和样本2的交流需求与情感性。此外,其表达情绪体验,如感动、悲伤、高兴的情绪型弹幕的占比也多于样本1和2,并且更具有临场感,表现出更多青年文化的后现代特征,其用语包括弹幕护体、玛卡巴卡、哈哈哈、小破站牛笔等。
4.2. 基于观看目的的参与感与身份认同
不同视频文本的受众观看目的不同,这直接影响了他们的参与感。弹幕允许用户在观看视频的同时,可以实时发送和阅读其他用户的评论,使得观众能够即时表达自己的观点和感受,并通过对弹幕的点赞获得参与感。研究者普通认为弹幕实时性强、临场感强、存在感强、互动性强的特点是受众获得参与感的主要原因[2] [3]。通过弹幕文本的分析,不难看出参与感与身份认同的获得与视频的文本内容高度相关。看样本1《中国通史》是为了学习历史知识,看样本2《三国演义》是为了获得一种历史沉浸的娱乐与学习,看样本3《三悦有一新工作》是为了在娱乐中获得情感共鸣。所有三个样本的高频词、主题类聚和受众的观看目的紧密相关,其情感分值的分布,也体现了其观看目的的满足程度。当参与目的得到满足地,受众有更强的意愿观看与发送弹幕,具有更强烈的参与感。
同时,视频观看目的不同还会影响受众的身份认同。对于寻求知识和信息的用户,文本观看的目的是获得知识,如样本1《中国通史》观看者,其弹幕的内容聚焦于对额外知识点或者不同观点解读的分享,以及对类似相关信息的点赞反馈。身份认同是与其在参与弹幕或观看视频之初“学习者”的身份设定高度一致。对于以娱乐为主要目的兼顾知识性满足的观众,弹幕提供了一个轻松互动、共享知识与事件观点的平台。样本2《三国演义》其弹幕的内容聚焦对剧集相关历史背景的分享、对人物事件的态度与评价等;身份认同于兼有学习性的娱乐者。对于纯粹寻求娱乐的用户,文本观看的目的是除了消遣之外,更需要通过视频内容产生情感共鸣,获得一个释放情绪的出口。如样本3《三悦有一新工作》,用户通过“哈哈哈”、“这个”、“真的”、“真实”、“好像”等无具体指向的词语,表达对视频内容(人物、事件、演技、场景等)等的认同,并进而把自己代入到剧集中,获得与剧集情感表达、价值感传递相关的身份认同。样本3中,剧集进行了三分之二的时段时,弹幕内容由最初高度相关视频具体内容转化关注主人公三悦的出身及由此引发的一系统社会、家庭问题的讨论,主题开始往“原生家庭的影响”进行聚合。观众的身份认同开始与主人公“三悦”重合。可见,视频内容越客观,用户在弹幕中的身份认同越接近自我设定;视频内容越具有娱乐性,用户身份认同越具有多元发展的可能性。可以说,视频内容是用户身份认同的底层逻辑。视频内容通过多种方式影响和塑造了观众的身份认同,在弹幕中又进一步加强和确认这种身份认同。
5. 结语
通过对知识传播型、历史剧集型和职场自制剧三种类型视频的弹幕评论进行深入分析,探讨了视频文本、情感特征及主题聚类之间的关联,并进一步揭示了基于弹幕的参与式文化的形成路径。不同类型视频的弹幕评论在主题和情感上表现出显著差异。这些差异不仅反映了观众在观看不同类型视频时的态度和需求,也揭示了弹幕评论作为参与式文化的重要载体,如何通过实时交流和情感互动,促进观众的身份认同和参与感。基于弹幕的参与式文化的形成,具有强烈的文本依赖性,文本的类型与开放性是弹幕参与者的个体文化动机、参与感与身份认同形成的底层逻辑。
基金项目
四川开放大学研究项目:基于“弹幕”传播现象的“微”网络公共空间的研究编号:KTKYC2020012Z。
四川省高等学校人文社会科学重点研究基地教育数字化与终身学习研究中心项目:生成式人工智能赋能终身学习新形态实践路径研究编号:DELL2024YB-29。