基于文本挖掘的短视频植入式广告媒介可供性分析
Analysis of Media Availability of Short Video Embedded Advertising Based on Text Mining
DOI: 10.12677/SEA.2022.113049, PDF, HTML, XML, 下载: 108  浏览: 203 
作者: 杨婷婷, 田书格:上海工程技术大学,上海
关键词: 文本挖掘短视频植入式广告情感倾向分析Text Mining Short Video Product Placement Affective Tendency Analysis
摘要: 随着移动互联网的飞速发展,短视频应用在人们生活中得到有效推广,一种在短视频中植入广告的新型营销方式逐渐兴起。本文基于媒介可供性分析框架,采用文本挖掘技术挖掘短视频平台头部主播植入广告视频文案及评论高频词和情感倾向,研究新型媒介环境对植入式广告的形塑作用。研究表明在内容可供性上更强调作品的独立观赏性,在移动可供性上强调通过标签的添加借助智能推荐算法增加作品曝光度,在社交可供性上弹幕的出现提供了更丰富的互动场景。本文将计算机专业的文本挖掘技术应用于社会科学研究中,整合定性分析与定量阐述,是媒介可供性分析在新媒体领域应用的有益探索。
Abstract: With the rapid development of the mobile Internet, short video applications have been effectively promoted in people’s lives, and a new marketing method of placing advertisements in short videos has gradually emerged. Based on the framework of media affordance analysis, this paper uses text mining technology to mine short video platform head anchors with high-frequency words and emotional tendencies in advertisement placement videos, and study the shaping effect of new media environment on placement advertisements. Research shows that the independent viewing of works is more emphasized in content affordability, and the mobile affordability is emphasized by adding tags to increase the exposure of works with the help of intelligent recommendation algorithms, and the emergence of bullet screens in social affordability provides more abundant interactive scene. This paper applies the text mining technology of computer major to social science research, and integrates qualitative analysis and quantitative elaboration, which is a beneficial exploration of the application of media affordance analysis in the field of new media.
文章引用:杨婷婷, 田书格. 基于文本挖掘的短视频植入式广告媒介可供性分析[J]. 软件工程与应用, 2022, 11(3): 466-473. https://doi.org/10.12677/SEA.2022.113049

1. 引言及文献回顾

根据CNNIC发布的第47次《中国互联网络发展状况统计报告》显示,截至2020年12月,我国网络视频(含短视频)用户规模达9.27亿,占网民整体的93.7%;其中,短视频用户规模达8.73亿,占网民整体的88.3% [1]。短视频的普及引领新媒体时代,人们的注意力逐渐被移动智能终端所占据,电视、电影等传统媒介中进行植入广告已无法满足营销人员与消费者建立长期关系的需求。基于此,为了将广告营销覆盖消费者群体最大化,营销人员尝试整合多种媒介资源广告信息并拓宽营销渠道,短视频植入式广告应运而生。植入式广告是广告主通过付费或其他赞助形式,将广告内容有计划、策略性地隐藏、融入媒介内容中,加深受众对产品或服务的印象,以达到营销目的一种广告形式 [2]。区别于传统广告植入在娱乐节目中有意识地将广告信息组合其中,短视频植入广告呈现出新的特点:个性化——同一产品推广因博主视频风格而产生不同的呈现方式、定制化——博主根据品牌公关推广需求策划视频脚本。基于上述短视频植入广告特点,虽然使得广告推广更易为消费者接受,却对视频制作者提出较之以往不同的要求。

随着市场的飞速发展,短视频的使用价值不仅限于文化娱乐,平台及营销人员各方对视频引入植入式广告的积极探索同样赋予其一定的经济价值,这一转变引起国内学者的关注。王昭馨研究了热门综艺中植入式广告价值观营销 [3];梁民达探析了抖音短视频植入式广告方式,并分析其发展趋势 [4];冯斯毓总结了自媒体植入式广告三种创意模式并以传播生态学视角分析其传播机制及传播效果 [5]。可见基于智能移动终端的视频APP的植入式广告研究引起了国内学者的注意,既有研究丰富了植入式广告在我国发展的研究成果,但更侧重于现象层面的描述性分析,缺乏对平台场景及算法逻辑对视频创作影响的深入探讨。因新传播媒介而产生的短视频植入广告却鲜有学者探究该媒介对植入广告的形塑作用,这便是本研究的缘起。

尽管短视频出现时间不久,但行业的飞速成长使得市场形成抖音、快手、B站“三足鼎立”的局面。三个短视频应用主攻不同用户群体,抖音在一二线城市占据主导地位,快手深耕下沉市场,B站因其独特的社区文化深受18~25岁年轻人的青睐。根据哔哩哔哩2020年财报显示,目前B站活跃用户超过1.5亿,每天视频播放量超过1亿,原创投稿总数超过1000万。B站70%的内容来自用户自制或原创视频,目前拥有超过100万的活跃视频创作者(UP主)。年轻的用户群体、友好的社区氛围、富有创意的UP主诸多因素使得B站倍受品牌公关的青睐,因此本文选取该平台作为研究对象。

在2017年一次学术访谈中,学者潘忠党首次将“可供性”这一概念引入国内新闻传媒学界,并给出了新媒体理论框架,即生产可供性、社交可供性、移动可供性三个层面的可供性要素。2019年,景义新和沈静,对上述理论框架进行了适当阐述和进一步分析,完善了媒介可供性理论框架 [6],使之成为分析新媒介现象、媒介技术影响力的一种新颖视角。武文颖等通过文献调研,结合媒介可供性理论分析国内外医学期刊新媒体传播现状,探索提升国内外医学期刊新媒体传播水平的策略 [7];陈小燕基于媒介可供性视角研究江南文化从传统媒体跨向网络媒体传播面临的问题,进行媒介可供性潜能挖掘,推动长三角产业共同体发展 [8]。与传统电视电影植入广告相比,短视频植入广告具有文本易得和反馈及时的特点,因此本文区别于传统理论分析辅以举例的分析方法,采取跨学科的文本挖掘方法,通过词频统计和情感分析对视频文案、评论和弹幕等进行研究。现有媒介可供性理论体系中生产可供性包括可编辑、可审阅、可复制、可伸缩、可关联五项可供力,然而B站植入广告视频均为用户自制上传平台的,上述五种可供力并不十分符合B站的媒介环境。新媒体时代存在海量信息冗余的自制内容,因此与用户交互的关键问题不在于作品的生产,而是作品内容对受众的吸引,因此使用“内容可供性”替换“生产可供性”更符合B站植入广告视频所处的媒介环境。

综上,本文从媒介可供性的视角出发,采用词频分析和情感分析两种在新媒体内容研究中较为常用的文本挖掘技术,通过对短视频植入广告从内容可供性、移动可供性和社交可供性三个维度的特征进行分析,解析B站的媒介环境对植入式广告的形塑作用,具备方法可行性和现实意义。

2. 数据来源与研究方法

2.1. 数据来源

本文选择UP主“硬核的半佛仙人(以下简称“半佛”)”播放量前十的植入广告视频作为研究对象。首先,半佛作为知识区UP主,其视频内容多为科普及知识传播,视频内容既有生活经验分享,又有热点事件分析,粉丝受众用户画像多元;其次,半佛作为一名拥有602万粉丝的UP主,在B站平台流量金字塔中位于顶端,其在保持高频“恰饭”的情况下仍能与粉丝保持良好关系,可以代表B站植入式广告发展的前沿。分析B站媒介环境对其植入式广告视频形塑的相关问题是较为适宜的。

本文运用视频字幕提取软件,收集到半佛播放量前十的植入广告视频文案(共计55,302字)。运用python爬虫技术,爬取上述植入广告视频高赞评论(共计33,134字)、弹幕(共计19,397字)及视频所添加标签。

2.2. 词频统计

2.2.1. 去除标点符号及特殊符号

文本的标点符号和特殊符号对词频统计过程无意义,为避免其对结果造成干扰,采用空格取而代之。

2.2.2. 分词

Python中提供的jieba库是文本挖掘研究中常用的分词方法,考虑到B站用户群体以网络原住民Z世代为主,语言环境网络化程度较高,因此本文使用搜狗细胞词库中的网络流行新词作为自定义词典,采用jieba对语料进行分词处理。

2.2.3. 去除停用词

本文结合哈工大停用词表以及实际分词效果对停用词表进行补充,迭代形成自定义停用词表,对分词后语料库去除停用词。

2.2.4. 词频统计

本文使用“词频逆文档频率( Term Frequency-Inverse Document Frequency, TF-IDF)”算法进行词频统计。该算法是一种评估一字词对于语料库中某一份文件重要程度的统计方法 [9]。因为数据收集的视频文案和评论篇幅各有长短,使用该算法可以规避重要信息遗漏风险。使用Python中jieba.analyse模块进行TF-IDF算法代码实现。

2.3. 情感分析

随着人工智能技术深入发展,情感分析成为自然语言处理的重点关注领域,目前主要有情感词典和机器学习两种研究方法。情感词典研究方法主要是将文本中情感词与构建的情感词典匹配,并计算每个情感词权重,从而得出整条评论语句的情感得分,从而判定其情感倾向;机器学习研究方法主要是通过基础算法人工选择所要分析的特征,并把这些特征带入分类器中进行训练,得到情感倾向分析结果。考虑到本研究数据量的较小,较难训练出精准模型,因此采用百度自然语言处理算法进行基于机器学习研究方法的情感倾向分析。在实际操作中运用Python语言调用百度情感分析aip,传入评论、弹幕等语料,返回其情感得分。

3. 研究发现

3.1. 内容可供性

B站植入广告视频制作过程通常为UP主与品牌公关就产品宣传点完成有效沟通后,由UP主完成视频策划及拍摄工作,经由品牌公关审阅后上传平台,平台审核后完成发布,因此生产可供性的五项可供力可编辑、可审阅、可复制、可伸缩、可关联均可实现。然而在信息洪流中,植入广告视频的内容可供性较生产可供性更值得予以关注。植入广告内容过于生硬则引起观众反感,对UP主自身产生不利影响,植入广告过于隐秘使观众甚至并未了解到宣传的内容,则是一次失败的品牌营销。对内容可供性的分析可通过对视频文案及评论文本词频分析了解。

通过对比植入广告视频文本和评论文本的高频词,可以发现半佛在内容创作目标和内容呈现效果上具有隐秘而有效的特点。首先,在内容创作目标上,区别于生硬植入广告文案,半佛倾向于通过与植入广告相关的科普向视频文本,提高观众的接受度。视频文本高频词中只有少数词语直接与植入广告相关,大多属于与植入广告间接相关的专业概念。以其播放量最高的广告视频《攒钱是年轻人改变命运的希望!》为例,其视频文本高频词前20位中,仅“攒钱”、“余额宝”是与视频中余额宝广告直接相关,其余高频词如“消费主义”、“改变命运”等则与视频知识传递导向的“干货”内容相关,见表1

Table 1. Implanted advertising video promotional content and related high-frequency words

表1. 植入广告视频宣传内容与相关高频词

其次,内容呈现效果可通过评论文本高频词反映。区别于社交网络下,“梗”文化在弹幕和评论区的泛滥,尽管半佛也拥有“ofo小黄车”等梗,但其植入广告视频的评论区呼应着视频内容的知识导向,每条视频的评论文本高频词均出现植入的广告产品,其他高频词也大多与视频内容相关,见表2。基于以上词频分析,半佛为构建内容可供性所采取的行动可以概括为知识传递。

Table 2. Top 10 high-frequency words in comment content (marked in red are high-frequency words that overlap with video copy)

表2. 评论内容前10位高频词(标红为与视频文案重合高频词)

3.2. 移动可供性

根据哔哩哔哩2021年Q2财报显示,其月均活跃用户数为2.37亿,其中移动端月均活跃用户数为2.2亿,移动端占比高达92.3%。庞大的移动端使用用户保证植入广告视频可以随时随地被观看,符合“可便携”属性。植入广告视频因其商业属性必然面向全平台公开,符合“可获取”属性。地理位置是算法平台较为重要的个性化推荐依据,而一些特殊的地理位置甚至具有联动线上线下的文化偏好意义 [10],符合并延伸了“可定位”属性。B站在内容供应侧和内容需求侧均提供了移动端和PC端的使用场景,在视频站外分享中还提供了微信小程序服务场景,在数据共享上支持物理可兼容性,符合“可兼容”属性。移动可供性的四个属性均得到实现,其中“可获取”属性经由智能推荐算法的广泛使用而得到进一步延伸。在智能算法体系中,移动终端及其使用主体信息经数据化、标签化后,与视频标签进行匹配,从而实现个性化推荐信息流推送。

本文筛选出半佛在数据收集期内播放量最高的10条植入广告视频,分析其视频标签添加情况。首先,在添加标签数量上,播放量最高的10条视频中,添加的标签数量最少为9个,最多为13个,表明半佛懂得利用尽可能多的标签以配合智能推荐算法实现广告视频的广泛传播。在添加标签内容上,出现最多的标签是“知识”,每条视频均有添加,其次是“商业”、“互联网”、“财经”、“科技”,标签内容贴合其知识区(原财经区)UP主的身份。所以,即便半佛已经拥有大量粉丝,其植入广告视频能够在粉丝的动态页面获得极大的曝光度,仍需要通过标签提高视频被推荐算法分发的概率,同时不断加固与相关领域的绑定关系。

3.3. 社交可供性

传统社交媒体的社交关系主要为账号关注,B站在此基础上增加个性化信息流“偶遇”,进一步升级用户与社交账号主体社交场境。因此,社交可供性的可致意、可传情、可协调、可连接四个特征均得到实现并有所升级。致意和传情的新方式有弹幕、充电、一键三连(长按点赞实现点赞、投币、收藏操作,视为对视频质量的极大肯定),协调和连接的新方式有信息流偶遇、评论区热评点赞,视频弹窗弹幕互动。

首先基于词频分析研究视频内容与评论内容之间的重合度,该重合度反映植入广告通过视频达到的传播效果。与传统的效果研究侧重传播声量相较而言,高频词重合度可以进一步呈现出用户反响的具体信息点。通过分析植入广告视频文本和评论文本前50位高频词的重合度发现,前50位高频词中有21个词重合,其中除“半佛”、“老师”、“硬核”、“资本”与UP主本人及其视频风格有直接关联外,其余重合高频词均与广告内容直接关联。该数据分析结果可与内容可供性相呼应。

在网络新媒体研究中,情感倾向分析在分析社交媒体用户对政治议题、社会热点、商业品牌的情感态度中得到广泛应用。本文采用百度自然语言处理的情感分类算法,得到植入广告视频评论文本情感倾向分布。在0至1区间内,数值越大,其对应评论文本越趋近于正向评论。本文将该区间分为三部分以便讨论:0~0.33为负向,0.34~0.67为中性,0.68~1.0为正向。半佛植入广告视频高赞评论情感倾向由负到正的比例为:63.78%、11.89%、24.32%。结合前文对评论区文本高频词的分析,评论中的负向情感大多与植入广告的产品有关。以其负向情感最多的鸿星尔克植入广告为例,其中一条高赞评论即为“不管半佛老师吹的再怎么用力我都不可能去买鸿星尔克,因为我穿的鞋码是45,而他家最大就44,呸”。然而,也存在少许负面评论是表达对这期“恰饭”视频质量的不满。仍以鸿星尔克植入广告为例,高赞评论中有多条专业人士对视频内容错误发表不满,如高分子和生物化学的研究生指出视频中鞋底材料介绍错误。

弹幕是一种新兴的视频网站互动机制,其具体表现形式为出现在视频屏幕中的实时滚动评论,随着视频播放依次出现,由观看视频的用户发出并被共同观看相同视频的群体看到 [11]。由于弹幕具有一定的字数限制,通常为30至40字,因此多为用户在观看视频时发表即时感受的即时性评论,其具有的情感倾向较之评论区更为强烈。B站作为国内率先引进弹幕形式的网络平台,弹幕文化是其典型特征及社区核心文化,因此对上文评论负向情绪最高的植入广告视频弹幕进行情感倾向分析,得到鸿星尔克植入广告视频弹幕情感倾向分布,弹幕情感倾向由负到正的比例为:36.16%、12.77%、51.08%,观众对视频情感倾向较为正面。一方面显示粉丝对于半佛的“恰饭”视频持友好态度,例如“要素察觉”、“收到暗号”等均为对视频植入广告的积极回应,印证本文研究对象选择的合理性;另一方面与评论区情感倾向对比,再次印证评论区的负向情感是与广告产品相关。

4. 结论

集合内容创意、个性化信息推送、丰富感官刺激的B站成为当下极具活力的虚拟社区网络视频平台,基于该平台的自媒体植入式广告也成为网络广告营销的新趋势。基于新媒体研究的理论框架——媒介可供性,以B站植入式广告领域前沿UP主半佛为研究对象,对其植入广告视频文本、评论文本及弹幕展开词频分析和情感分析,探究B站新的媒介环境对植入式广告的形塑作用有以下三个方面:

第一、在内容可供性方面,受限于视频时长及观众碎片化的阅读习惯,植入式广告视频在内容上首先表现为一个具有独立观赏价值的作品,其次表现为植入的广告与视频内容的融合性,尽可能降低受众对于广告的抵触。在词频统计结果中的表现即为视频文本中与广告间接关联的“干货”高频词占比远高于直接关联的“广告”高频词,保证视频知识传递。

第二、在移动可供性方面,智能推荐算法的出现,为视频传播开辟了一条崭新的路径——基于标签的个性化信息流推荐,实现从传统视频通过超链接完成个体间跳转到通过标签完成兴趣类跳转的转变。在植入广告视频中的应用即为视频标签数量和内容的添加,一方面增加视频曝光度,另一方面巩固自身与相关领域的联系。

第三、在社交可供性方面,B站相较于之前的社交媒体创造了更为丰富的社交场景。由于B站评论区设置在视频页面下方右侧分栏,查看较为方便,由此衍生出“课代表”、“省流大师”等对视频内容总结概括的热评,在评论区针对视频内容的讨论促进了用户间社交。弹幕这一新兴评论方式的出现,一方面为UP主和观众的互动提供一种方式,如视频开始发送“来了”、“高产”等对视频更新表示欢迎;另一方面,由于弹幕的即时性和保留性,能够打破时间和空间的隔阂,随时随地引发观众情感共鸣,实现情感传递,例如植入广告将要开始时发送“前方高能”、“恰饭预警”等对之后观众起到提示作用。通过对半佛评论及弹幕的分析发现,丰富的社交场景也易放大负面影响,例如评论区对视频内容错误的不满成为热评,对UP主形象造成伤害,由此也警示博主对植入式广告视频质量进行把控。

5. 结束语

本研究在黄淼学者对电商短视频媒介可供性分析 [12] 的研究基础上,首先将媒介可供性理论框架应用与短视频植入广告媒介分析,丰富相关领域理论成果;其次,黄淼进行文本挖掘的语料仅限于视频文案及评论,本研究增加弹幕这一更具情绪的语料进行情感分析,对计算机技术与社会科学研究结合做进一步探索。本研究通过对具有较高商业转化能力的博主进行分析,指出在视频内容上保证知识传递,通过添加标签增加视频曝光及领域绑定,丰富的社交场景会扩大负面情绪影响,对视频质量其警示作用,为自媒体产业实践发展提供经验。然而本文仅以半佛作为研究对象,涉及领域相对单一,无法囊括植入式广告在社交视频平台的所有情况,这将是后续研究需要探讨的问题。

参考文献

[1] 中国互联网络信息中心. 第47次中国互联网络发展状况统计报告[EB/OL]. http://www.cnnic.cn/hlwfzyj/hlwxzbg/hlwtjbg/202102/P020210203334633480104.pdf, 2021-06-29.
[2] 颜丹, 马欣, 邱诗韵, 姜敏桢. 现行《广告法》视野下植入式广告的规范对策[J]. 卫星电视与宽带多媒体, 2020(13): 128-130.
[3] 王昭馨. 养成类选秀节目植入式广告“IP价值观营销”分析[J]. 新媒体研究, 2020, 6(16): 44-46.
[4] 梁民达. 抖音带货: 短视频中的植入式广告探析[J]. 视听, 2020(6): 217-218
[5] 冯斯毓. 自媒体植入式广告的创意模式分析[J]. 新媒体研究, 2021, 7(12): 27-29.
[6] 景义新, 沈静. 新媒体可供性概念的引入与拓展[J]. 当代传播, 2019(1): 92-95.
[7] 武文颖, 朱金德, 梁路, 王艺璇. 媒介可供性视角下医学期刊新媒体传播的创新实践研究——基于8种中外期刊的对比分析[J]. 中国科技期刊研究, 2022, 33(2): 200-208
[8] 陈小燕. 媒介可供性视角下江南文化的融媒体传播[J]. 苏州科技大学学报(社会科学版), 2022, 39(1): 64-70.
[9] 刘展. TF-IDF算法在文章推荐系统的应用[J]. 电脑知识与技术, 2019, 15(7): 17-20.
[10] 孙玮. 我拍故我在我们打卡故城市在——短视频: 赛博城市的大众影像实践[J]. 国际新闻界, 2020, 42(6): 6-22.
[11] 王倩茹, 张荣. 弹幕文化生产的透视与引导——以哔哩哔哩网站为例[J]. 宜春学院学报, 2021, 43(7): 72-78.
[12] 黄淼. 电商短视频的媒介可供性分析——基于快手美妆主播的文本挖掘[J]. 北京邮电大学学报(社会科学版), 2020, 22(5): 1-9.