基于文本挖掘的食品安全网络舆情研究——以“3.15某品牌黄焖鸡事件”为例
Research on Food Safety Online Public Opinion Based on Text Mining—Taking the “3.15 Incident of a Brand of Cassoulet” as an Example
DOI: 10.12677/orf.2025.153138, PDF, HTML, XML,    国家社会科学基金支持
作者: 张 雨, 钱 颖:上海理工大学管理学院,上海
关键词: 文本挖掘网络舆情情感分析食品安全Text Mining Online Public Opinion Sentiment Analysis Food Safety
摘要: 近年来,随着社交媒体和移动互联网的普及,食品安全事件的网络舆情呈现爆发式传播态势。公众通过抖音、小红书平台等渠道实时发布、讨论食品安全问题,形成具有社会影响力的舆论场。本研究以“3.15某品牌黄焖鸡事件”为切入点,依据2025年3月13日18时02分抖音央视新闻发布国务院食安办向山东省食药安办、河南省食安办发出挂牌督办通知书的视频为事件时间区分点,运用文本挖掘技术对抖音平台官方媒体与娱乐个人媒体发布的视频评论文本进行系统性分析。通过词云可视化、词频统计和LDA主题模型揭示两类媒体的话语建构差异,结合情感分析模型量化受众情感极化程度。结果发现,(1) 央视发声前后舆情阶段分化特征显著。(2) 官方媒体与娱乐个人媒体在舆情传播中形成二元分化结构。(3) 央视发声前后情感倾向呈现显著变化。(4) LDA主题模型显示两类媒体用户关注点存在时空错位。
Abstract: In recent years, with the popularization of social media and mobile Internet, online public opinion on food safety incidents has shown explosive propagation. The public has been posting and discussing food safety issues in real time through channels such as TikTok and rednote platforms, forming a public opinion field with social influence. This study takes the “3.15 incident of a brand of cassoulet” as the entry point, and based on the video released by TikTok CCTV News at 18:02 on March 13, 2025, in which the State Council’s Food Safety Office issued a registered supervisory notification to the Food and Drug Safety Office of Shandong Province and the Food Safety Office of Henan Province, the time point of the incident was differentiated, and the video released by official media and entertainment personal media on the TikTok platform was analyzed by using the text mining technology. The text mining technology is used to systematically analyze the video comment texts released by the media and entertainment personal media. The differences in discourse construction between the two types of media are revealed through word cloud visualization, word frequency statistics and LDA topic model, and the degree of audience sentiment polarization is quantified by combining with sentiment analysis model. The results found that (1) the stage differentiation of public opinion before and after CCTV’s voice is characterized significantly. (2) The official media and entertainment personal media formed a binary polarization structure in the dissemination of public opinion. (3) Emotional tendencies showed significant changes before and after CCTV’s voice. (4) The LDA topic model shows that there is a temporal and spatial mismatch in the focus of users of the two types of media.
文章引用:张雨, 钱颖. 基于文本挖掘的食品安全网络舆情研究——以“3.15某品牌黄焖鸡事件”为例[J]. 运筹与模糊学, 2025, 15(3): 41-53. https://doi.org/10.12677/orf.2025.153138

1. 引言

食品安全问题作为关系国计民生的重大社会议题,始终牵动着公众敏感的神经。在社交媒体深度融入生活的今天,短视频平台凭借其信息传播的即时性、视觉化与互动性,逐渐成为食品安全网络舆情发酵与扩散的核心场域。此类舆情不仅关乎企业品牌形象,更可能引发公众信任危机甚至社会稳定性问题[1]。例如2025年“3.15某品牌黄焖鸡加盟店后厨乱象”事件中,隔夜食材回收、员工无证上岗等问题通过暗访视频曝光后,迅速登上热搜并引发国务院食安办挂牌督办,显示出食品安全舆情的巨大破坏力[2]

近年来,学者们对食品安全网络舆情的关注度显著提升[3]-[5],但现有研究多聚焦于微博[6]、微信等传统社交媒体,对短视频平台的传播特性与情感特征缺乏探讨。2024年石锦钰使用网络舆情研究方法从微博平台获得数据,得到食品安全网络舆情的五个高风险时期[7]。2024年陈镜贤在微博平台爬取数据,从主题关联视角出发,结合舆情生命周期理论,应用基于LDA主题模型的主题演化分析方法,构建融入舆情情感分析的舆情主题与情感演化框架[8]。2024年胡志超以海天酱油“双标”事件为例,结合舆情传播生命周期模型,通过问卷调查、内容分析法等,梳理食品安全网络舆情演化的基本规律,进一步探析食品添加剂引发食品安全网络舆情的主体影响因素,并提出建构多元协同治理体系及具体路径[9]。2019年Xu等人通过构建一个综合性的扩展情感词典,显著提升了情感分析的精准度和适用性[10]。2020年,Chen等基于BP神经网络模型构建食品安全舆情预测模型[11]。2021年,Lang等提出包含政府作用的巴斯扩散模型,并给出了相应的解析解,通过具体案例证实政府管理是抑制网络舆情的关键[12]

相较于文字主导的平台,抖音等短视频平台通过画面叙事、音乐渲染、弹幕互动等多模态符号系统构建情感共振场域,使得舆情传播呈现出“情绪先于事实”“情感裹挟理性”的显著特征[13]。尤其在官方媒体(以机构认证账号为代表)与娱乐个人媒体(以娱乐公司、草根用户为主体)的二元传播结构中,信息生产逻辑的差异可能导致舆情走向的显著分化:前者倾向于遵循风险沟通框架,强调事实核查与权威解读;而后者往往采用情感驱动策略,通过戏剧化叙事、情绪化表达争夺流量关注。这种话语权力的碰撞如何影响公众风险感知与情感倾向,成为亟待破解的学术命题[14]

2. 研究方法及工具

2.1. 文本预处理

在自然语言处理领域,文本被视作是由单词、短语或段落所构成的组合。针对大部分未处理的文本数据不能直接使用的问题,通过文本预处理的方式可以将数据从结构化转换为结构化,从而使计算机更容易有效地处理它们[15]

本文评价文本信息是一种非结构化的数据,采用Power BI进行文本预处理,具体如下所示:

(1) 去除非文本数据。使用去除在爬取文本数据过程中存在无用的符号(包括网络标签、URL地址、表情符号等)。

(2) 去停用词。去停用词的优势在于语义特征可充分与机器运算拟合,从而进一步提高计算机处理速度。

(3) 中文分词。中文与英文有着极大不同。中文词语比较复杂,常常蕴含着一词多义的情况,分词能极大提升数据分析的效率。

2.2. TF-IDF

TF-IDF的中心思想之一是,如果单词在文档中或单词本身出现的频率高于在另一个文档中出现的频率,那么这个单词出现的次数越少,被赋予的分量就越大,这表明它有很高的能力与众不同[16]。TF在TF-IDF中表示词频,IDF则表示逆向文档频率。TF是项ti在文档d当中出现的频率。ti的区分能力越好,它的IDF值就越大,所包含某个项ti的文档数就越少。TF-IDF公式为:

TF-IDF i,j = TF i,j × IDF i (1)

TF i,j = n i,j k n k,j (2)

IDF i =log | D | | { j: t i d j } | (3)

其中TFi,j是词频,IDFi是逆向文档频率, | D | 是语料库中的文档总数, | { j: t i d j } | 是包含某项ti的文档数目。

2.3. LDA主题模型及困惑度

LDA主题模型(Latent Dirichlet Allocation,潜在狄利克雷分配)是一种基于概率生成的无监督学习算法,用于从文档集合中自动提取隐含主题结构[17]。其核心思想是将文档视为多个主题的概率混合,每个主题则表现为词汇的概率分布,从而实现对大规模文本的语义分析和知识发现。其核心原理与特点在于:

1) 生成过程假设

LDA假设文档的生成遵循以下步骤:

① 每篇文档从狄利克雷分布中采样生成一个主题分布

② 每个词从主题分布中选择一个主题

③ 从该主题对应的词汇分布中采样生成具体的词语

数学上,文档的联合分布可表示为(其中,θ为文档–主题分布,ϕ为主题–词汇分布):

P( w,z,θ,ϕ )= i=1 M P( θ i ) j=1 N P( z i,j | θ i )P( w i,j | z i,j ,ϕ ) (4)

2) 词袋模型假设

LDA忽略词语顺序,将文档视为词语的集合,简化建模复杂度。

3) 参数估计方法

通过变分贝叶斯推断或马尔可夫链蒙特卡罗(如吉布斯采样)算法求解模型参数,最终输出文档–主题分布和主题–词汇分布。

困惑度(Perplexity)是一种用来评估模型预测能力的指标,它通常用于衡量LDA模型对数据的拟合程度[18]。困惑度的计算基于似然函数,通过衡量模型对未见过的文档预测准确性来确定模型的表现。其数学表达式如下:

Perplexity( D )=exp( d=1 | D | logP( w d ) d=1 | D | N d ) (5)

其中:D表示整个文档集, w d 是文档d中的所有词汇,P( w d )是基于模型计算的词汇出现概率, N d 是文档d中的词汇数量。困惑度值越小,说明模型对文档的预测越精确。它反映了模型的泛化能力,即模型在新数据上的表现。

2.4. 情感分析

情感分析(Sentiment Analysis)是自然语言处理(NLP)领域中一项至关重要的任务。它通过分析文本的情绪倾向,来判断文本所表达的态度或情绪,通常分为正面、负面和中性三种。情感分析的方法主要有基于深度学习的方法、基于传统机器学习的方法和基于情感词典的方法[19]。本文采用基于朴素贝叶斯分类算法的SnowNLP库对文本数据进行情感分析[20]

3. 实验分析

3.1. 事件热度演变

本文选择最近3.15消费者权益日食品安全网络舆情事件——“某品牌黄焖鸡事件”[2]

2025年3月,记者暗访了多家某品牌黄焖鸡加盟店,发现不少食品安全问题:使用存放多天的发酸食材,顾客食用后的剩菜回收再加工售卖,隔夜发黑的牛肉加色素后冒充新鲜牛肉。记者调查中还发现,多家门店招聘时不需要员工提供健康证,大量无证店员直接上岗。

2025年3月12日中午,该品牌发布致歉信表示,对于近期旗下涉事加盟门店出现的食品安全问题,公司向广大消费者致以最深切的歉意。此次事件暴露出公司在涉事加盟门店的加盟管理、监督执行上的重大漏洞,公司承担全部责任。同日,河南省某县市场监督管理局通报:媒体报道“某品牌黄焖鸡后厨乱象”涉及我县某品牌黄焖鸡加盟店相关问题,县市场监管局执法人员第一时间赶赴现场,已对涉事门店查封,对食材封存检验,全面展开调查。下一步,将根据调查结果依法作出严肃处理。3月13日,国务院食安办向山东省食药安办、河南省食安办发出挂牌督办通知书,对两地核查处置工作实行挂牌督办;同日,郑州市市场监管局称,将排查某品牌黄焖鸡全市所有门店,对存在问题的餐厅进行查处。3月21日,针对“某品牌黄焖鸡后厨乱象”事件,国务院食安办、市场监管总局约谈山东省济南市及河南省郑州市、商丘市人民政府副市长(见表1)。

Table 1. Event key nodes

1. 事件关键节点

关键时间

关键事件

2025年3月初

记者暗访多家加盟店,曝光食品安全问题

2025年3月12日中午

某品牌总部发布致歉信

2025年3月12日当天

河南省某县市场监管局行动

2025年3月13日当天

国务院食安办发出挂牌督办通知、郑州市市场监管局回应

2025年3月21日当天

国务院食安办、市场监管总局约谈地方政府

本文根据百度指数、微博指数等网络舆情平台监测(见图1图2),发现“3.15某品牌黄焖鸡事件”网络舆情事件演变符合舆情传播正态分布,其中3月13日舆情热点达到顶峰而后下降,在3月21日后舆情指数有上涨趋势。据此,以2025年3月13日18时02分抖音央视新闻发布国务院食安办向山东省食药安办、河南省食安办发出挂牌督办通知书,对两地核查处置工作实行挂牌督办为界,将事件分为央视发声前和央视发声后。

Figure 1. Baidu index for a brand of cassoulet incident

1. 某品牌黄焖鸡事件百度指数

Figure 2. Weibo index for a brand of cassoulet incident

2. 某品牌黄焖鸡事件微博指数

3.2. 数据采集与处理

本文数据采用网络爬虫软件抓取抖音“3.15某品牌黄焖鸡事件”,按照发布媒体类型、热度、评论数、点赞数、发布时间等将视频进行分类排序,最终选择央视新闻、人民日报、新京报等6个官方媒体[20],凤凰网、鑫中有娱等4个娱乐个人媒体所发布的视频,共计42,878多条文本数据作为数据源(见表2)。其中文本数据主要包括昵称、日期、地区、用户ID、评价内容、评价点赞数等,利用Power BI进行数据清洗及预处理操作,删除过短以及无意义的评论[21],最终得到35,032条评论数据。

Table 2. Media for data collection

2. 采集数据媒体

发布媒体

媒体类型

粉丝量

发布时间

发布链接

点赞量/万

新京报

官方

2576.9万

2025.3.12 11:09

https://v.douyin.com/i5ny29q6/

22.3

大象新闻

官方

3259.8万

2025.3.12 15:49

https://v.douyin.com/spiPH8ZKiVw/

6.3

鑫中有娱

娱乐个人

24.2万

2025.3.12 19:03

https://v.douyin.com/t_N0qo1FBgE/

10.7

焖鸡正弘

娱乐个人

1115

2025.3.12 19:03

https://v.douyin.com/i5nUmSAd/

1.5

央视新闻

官方

1.7亿

2025.3.13 18:02

https://v.douyin.com/i5nUXfY8/

147.7

人民日报

官方

1.8亿

2025.3.13 20:29

https://v.douyin.com/i5WXtSpP/

118.2

96女狮子

娱乐个人

1271

2025.3.14 11:21

https://v.douyin.com/i5nXE2dv/

4.8

凤凰网

娱乐个人

1806万

2025.3.14 13:36

https://v.douyin.com/i5nXwyX3/

2.1

央视网快看

官方

3783.2万

2025.3.21 19:38

https://v.douyin.com/Xs3u5s3HU3s/

2.6

央视财经

官方

1629万

2025.3.22 10:37

https://v.douyin.com/y1ZZbHkCdbI/

2.3

3.3. 舆情热点分析

通过对“3.15某品牌黄焖鸡事件”央视发声前后官方媒体和娱乐个人媒体的评论信息可视化,生成相应词频统计表(见表3表4)及词云图(见图3),充分挖掘出信息潜在的价值,提高数据处理的效率。

Table 3. Keywords before the CCTV voice (partial)

3. 央视发声前关键词(部分)

央视发声前–官方媒体

央视发声前–娱乐个人媒体

关键词

TF-IDF

关键词

TF-IDF

外卖

0.024461664

品牌

0.017197821

微笑

0.023122192

干净

0.015344466

泪奔

0.01224285

不吃

0.014634074

没有

0.012221425

外卖

0.014031028

食品安全

0.01220835

鸡肉

0.012667305

问题

0.011756595

卫生

0.012578243

餐饮

0.011141552

厨房

0.0119906051

判刑

0.0059119168

泣不成声

0.0088086626

严查

0.004995991

预制

0.0061174749

治理

0.0003702349

僵尸

0.0035857057

Table 4. Keywords after the CCTV voice (partial)

4. 央视发声后关键词(部分)

央视发声后–官方媒体

央视发声后–娱乐个人媒体

关键词

TF-IDF

关键词

TF-IDF

食品安全

0.030633044

外卖

0.032335216

爱心

0.023152583

流泪

0.018892569

外卖

0.021832814

不吃

0.014915622

流泪

0.018670375

泪奔

0.010847247

感谢

0.017948366

还好

0.010794744

食品

0.017175984

鸡肉

0.010752157

鼓掌

0.017118569

感谢

0.0101637667

米饭

0.0158938323

预制

0.0081767886

严查

0.0143190072

严查

0.0030991761

督办

0.0080796204

责任

0.0008644563

(a) 央视发声前–官方媒体 (b) 央视发声前–娱乐及个人媒体

(c) 央视发声后–官方媒体 (d) 央视发声后–娱乐及个人媒体

Figure 3. Word cloud diagram

3. 词云图

在官方媒体和娱乐个人媒体中,“问题”、“治理”等词汇是官方媒体区别于娱乐个人媒体的关键特征词,而且在央视发声后官方媒体关于“食品安全”的相关词汇比例权重处于上升趋势。“流泪”、“外卖”、“食品”、“品牌”等词汇同时出现在官方媒体和娱乐个人媒体,表明了公众群体都对食品安全健康的关注及对“3.15某品牌黄焖鸡事件”的气愤。综合来看,官方媒体下的评论用户更加理性、更加关注社会层面及个人层面对食品安全问题事件的应对,娱乐个人媒体用户多表示自己的情绪及下一步自身的应对方式,呈现出“情绪先于事实”“情感裹挟理性”的显著特征。

在央视发声前,“外卖”、“品牌”等词汇出现频率较高,“食品安全”,“卫生”等关注食品健康词汇较少,表明了前期公众对食品安全事件的关注、存在质疑的心理。在央视发声后,“食品安全”、“感谢”、“鼓掌”等词汇比例加大,表明了公众对食品安全的重视关心和对国家治理食品安全事件的认同。说明了在食品安全网络舆情事件发生时,国家及权威机构的及时处理对此类舆情事件起重要影响。

3.4. 主题分析

本文采用困惑度为评估参数,利用LDA模型进行主题分类,最终确定央视发声前官方媒体及娱乐个人媒体主题分类数为5,央视发声后官方媒体及娱乐个人的主题分类为4。

通过央视发声前主题分类及主要关键词(见表5)、央视发声后主题分类及主要关键词(见表6)发现官方媒体和娱乐个人媒体都有“鸡肉问题”主题和“商家管理”主题。在“鸡肉问题”主题中,两者主要关键词都有“鸡肉”、“卫生”、“僵尸”等,表明了公众对鸡肉产业链中的担忧,如“僵尸肉”(冷冻过期肉)、“科技肉”(添加剂滥用)及大肠杆菌污染等。其中,“白眼”、“怪不得”、“黑脸”、“恶心”等词表明了消费者对鸡肉连锁店品质的负面情绪化表达。

Table 5. Classification of topics before the CCTV voice

5. 央视发声前主题分类

央视发声前–官方媒体

央视发声前–娱乐个人媒体

主题分类

占比

关键词(部分)

主题分类

占比

关键词(部分)

餐饮行业

21.39%

餐饮、全国、连锁、变质、关门、 黑心、乱象、环境、隔夜饭、凭良心

厨房卫生

16.78%

厨房、香菇、直播、顾客、牛肉、监控、冰箱、小哥、平台、员工

鸡肉问题

20.81%

鸡肉、土豆、卫生、大肠、味道、 白眼、挂不得、僵尸、科技、重灾区

鸡肉问题

20.27%

鸡肉、卫生、黑脸、恶心、味道、鸡腿、僵尸、成本、激素、厨师

媒体曝光

19.87%

曝光、记者、市场、总部、监督、 员工、门店、厨房、检查、消费者

品牌信任

23.93%

品牌、问题、餐饮、关门、门店、加盟、个别、影响、良心、消费

商家管理

17.82%

老板、郑州、加盟店、连锁、医院、某品牌、拉肚子、利润、责任、健康证

商家管理

19.36%

老板、商家、曝光、剩菜、没人、黑心、饭店、全国、环境、食品

食品监督

20.11%

食品安全、问题、品牌、商家、食品、河南、食材、罚款、餐饮行业、监管

卫生漏洞

19.66%

食材、视频、加盟店、公司、总部、老鼠屎、垃圾、管理、记者、镜头

Table 6. Classification of topics after the CCTV voice

6. 央视发声后主题分类

央视发声后–官方媒体

央视发声后–娱乐个人媒体

主题分类

占比

关键词(部分)

主题分类

占比

关键词(部分)

食品监督

21.39%

食品安全、问题、国家、食品、人民、力度、关注、整治、乱象、饮食

食品监督

21.37%

食品安全、问题、餐饮、曝光、时间、影响、平台、垃圾、罚款、管理

鸡肉问题

20.81%

米饭、鸡肉、牌子、良品铺子、山东、味道、拉肚子、垃圾、恶心、科技

鸡肉问题

29.95%

鸡肉、味道、香菇、恶心、僵尸、快餐、肚子、科技、老鼠、饭菜

商家管理

19.87%

餐饮、品牌、商家、卫生、重罚、事件、行业、监管、小哥、彻查、食材

商家管理

23.44%

商家、品牌、小哥、店里、河南、加盟店、总部、关门、黑心、剩菜

政策支持

17.82%

爱心、饭店、监督、老板、厨房、直播、顾客、餐饮业、监控、约谈

厨房卫生

25.24%

厨房、直播、饭店、老板、食材、卫生、摄像头、骑手、价格、流量

在商家管理主题上,央视发声前官方媒体主要关键词为“加盟店”、“医院”、“拉肚子”、“利润”、“责任”、“健康证”等,一方面反应了食品安全事故对消费者健康的危害,另一方面表现了连锁加盟模式的弊端,如郑州、济南等地加盟店因利润压缩导致的食品安全问题(如健康证造假、食材以次充好)。高频词“某品牌”暗指某知名火锅品牌曾因“老鼠门”事件被整改,通过此知名品牌案例警示食品行业。央视发声后官方媒体主要关键词为“品牌”、“商家”、“卫生”、“行业”、“监管”、“彻查”等,表现了公众对政府高压监管餐饮商家的支持,其中关键词“彻查”、“重罚”对应2025年市场监管总局“春雷行动”,重点打击卫生不合格、食材造假等行为。央视发声前后娱乐个人媒体主要关键词为“商家”、“剩菜”、“黑心”、“全国”、“关门”等,表明了公众对商家“黑心”、“剩菜回收”、“环境脏乱”等具体案例的愤怒,同时全国、市场等词暗示问题普遍性,如多地小餐馆重复使用废弃油脂。

央视发声前后的官方媒体和央视发声后的娱乐个人媒体都存在“食品监督”主题,而央视发声前娱乐个人媒体对应主题为“卫生漏洞”。在卫生漏洞主题中,主要关键词有“食材”、“视频”、“加盟店”、“老鼠屎”、“垃圾”、“管理”、“快餐”、“记者”、“镜头”。在“食品监督”主题中,官方媒体主要关键词有“食品安全”、“问题”、“品牌”、“商家”等,而娱乐个人媒体主要关键词有“食品安全”、“问题”、“餐饮”、“曝光”、“垃圾”、“罚款”。表明了公众对食品安全工作的重视,另一方面表明了官方媒体的用户偏理性问责,娱乐个人媒体在用户主要偏直观情绪化表达,官方及权威媒体的及时回应对娱乐个人媒体用户网络言论起积极作用。

在央视发声前官方媒体餐饮行业主题中,主要关键词“全国”、“变质”、“关门”、“黑心”、“凭良心”等词,表明了公众以“3.15某品牌黄焖鸡事件”为例,对全国连锁餐饮品牌的系统性风险,如食材变质、隔夜饭售卖、门店环境脏乱等问题的担忧。同时,反映了消费者对“凭良心经营”承诺的失望。在“媒体曝光”主题中,主要关键词为“记者”、“监督”、“市场”、“总部”、“员工”、“厨房”等,表示了通过记者暗访、市场抽查等方式揭露违规行为,强调政府监管部门介入、公众参与监督与行政执法联动的必要性。同时总部、门店等词暗示品牌方对加盟店管理的失控,如总部监管流于形式。在央视发声后官方媒体“政策支持”主题中,主要关键词为“爱心”、“监督”、“厨房”、“直播”、“监控”、“约谈”,表明了公众对国家相关部门整治食品行业和“监管–企业–消费者”协同治理模式的支持。

央视发声前后娱乐个人媒体都存在“厨房卫生”主题,并且在央视发声后,“厨房卫生”主题占比从16.78%上升至25.24%,增幅超50%。一方面在于央视的权威报道引发公众对食品安全和卫生问题的集中关注,自媒体为响应热点迅速跟进。另一方面说明食品安全是民生刚需,公众对餐饮行业透明度的需求被激活,推动话题持续发酵。央视发声前厨房卫生主题主要关键词有 “厨房”、“冰箱”、“监控”、“员工”、“小哥”,说明了自媒体早期通过曝光后厨具体乱象吸引流量。央视发声后厨房卫生主题关键词为“厨房”、“老板”、“饭店”、“卫生”、“摄像头”、“直播”、“流量”,关键词从“员工”、“小哥”转向“老板”、“饭店”,矛头指向管理者责任与商业模式。同时“直播”、“摄像头”、“流量”对应着部分餐饮企业借直播厨房实况进行危机公关,同时暗示公众对“明厨亮灶”等数字化监管的呼吁。

3.5. 情感分析

利用基于朴素贝叶斯分类算法的SnowNLP库对抖音采集的所有文本数据进行情感分析。使用 SnowNLP( ). sentiments方法进行情感打分,规定0 ≤ sentiments score 为“消极文本”、0.4 ≤ sentiments score ≤ 0.6为“中性文本”、0.6 < sentiments score ≤ 1为“积极文本”。为直观清晰展示文本数据情感(见表7),统一将消极文本定义为−1,中性文本为0,积极文本为1。

Table 7. Sentiment analysis results of selected text data

7. 部分文本数据情感分析结果

抖音文本数据

情感标签

从来不吃外面的黄焖鸡 家里自己烧也很快

1

官方出手就是赞,食品安全必须严处。

1

是哪些人长期点外卖的!

0

我也是做餐饮,要做到我们自己能吃的,客人也能吃

0

黄焖鸡真不便宜,还是僵尸肉

−1

罚款加直接关门吧,这辈子不能再进去食品行业

−1

据此得到,网络评论情感分析的计算结果(见图4),央视发声前官方媒体正面情感占比19.12%,负面情感占比39.87%,中性情感占比41.01%。央视发声前娱乐个人媒体正面情感占比21.21%,负面情感占比43.73%,中性情感占比35.0%。央视发声后官方媒体正面情感占比28.3%,负面情感占比33.08%,中性情感占比38.62%。央视发声后娱乐个人媒体正面情感占比24.3%,负面情感占比40.74%,中性情感占比34.96%。

Figure 4. A graphic comparison of emotions before and after the CCTV voice

4. 央视发声前后情感对比图

总体而言,与官方媒体相比,娱乐个人媒体的负面态度占比更高,说明了娱乐个人媒体更注重话题性和关注度。事件中的争议点更容易吸引用户其关注并进行负面评论,同时其报道的客观性和专业性相对较弱,更加倾向于情绪化表达。央视发声前后,官方媒体和娱乐媒体的态度倾向均发生了一定程度的变化,官方媒体在央视发声后正面态度上升、负面态度下降,说明央视的发声对舆论导向起积极调整作用,在一定程度上缓解了事件中的争议和质疑,体现了用户对央视等官方权威媒体的认可。娱乐个人媒体虽然也受到央视发声的影响,但调整幅度相对较小,仍保留较高的负面态度比例,反映了其与官方媒体在报道风格和价值取向方面的差异。这种差异与媒体属性和定位有关,也受到群体需求和市场竞争等因素影响。

4. 结论与启示

4.1. 研究总结

本研究基于“3.15某品牌黄焖鸡事件”的抖音视频数据,以国务院食安办挂牌督办通知发布为时间节点(2025年3月13日18时02分),区分官方媒体和娱乐个人媒体,从文本内容特征、主题聚类分析、情感变化三个维度揭示了食品安全网络舆情的传播机制。研究发现:

(1) 央视发声前后舆情阶段分化特征显著。央视发声前:娱乐个人媒体主导传播,高频词出现“泣不成声”、“预制”、“僵尸”等具象化风险描述,词云呈现情绪化、碎片化特征;官方媒体出现以“判刑”、“严查”等程序性词汇,但信息密度较低。央视发声后:官方媒体高频词“鼓掌”、“严查”、“督办”等政策执行类术语比重提高,词云结构呈现系统性;娱乐个人媒体则新增“严查”、“责任”等监督性词汇,但仍有部分账号使用“黑心商家”、“老鼠屎”等标签化语言。

(2) 官方媒体与娱乐个人媒体在舆情传播中形成二元分化结构。官方媒体聚焦食品安全监管和政策支持,“国务院”、“挂牌督办”、“彻查”、“约谈”等关键词表明官方媒体用户对国家制度的信任及支持。娱乐个人媒体用户侧重卫生漏洞和情感宣泄,“恶心”、“黑心”等情绪化词汇出现频率达普通文本的2.3倍。

(3) 央视发声前后情感倾向呈现显著变化。官方媒体负面情感下降6.79% (39.87%→33.08%),娱乐个人媒体负面情感降幅仅3.0% (43.73%→40.74%),表明官方及权威媒体介入能有效缓解公众焦虑,但对娱乐草根用户的情绪调节存在滞后性。

(4) LDA主题模型显示两类媒体用户关注点存在时空错位。官方媒体在事件后期新增“政策支持”主题(占比17.82%),包含“约谈”、“春雷行动”等政策关键词。娱乐媒体持续强化“厨房卫生”主题(后期占比25.24%),包括“摄像头”、“直播”等可视化关键词。

4.2. 启示

在食品安全网络舆情事件传播过程中,央视等主流媒体的发声具有重要的引导作用,能够影响其他媒体的态度和报道方向。官方媒体的报道更加理性和客观,娱乐个人媒体由于其自身的商业属性和受众需求,在舆论传播中表现出较强的自主性和话题性。未来,应进一步加强主流媒体的舆论引导能力,同时规范娱乐个人媒体的传播行为,营造健康、理性的舆论环境。

(1) 政府部门可建立“黄金6小时”响应机制,利用BERT模型实时监测舆情情感拐点,创建制度信任–情感共鸣的螺旋传导机制。制度信任:通过将“挂牌督办”等政策转化为进度条可视化系统,每周发布企业整改、被约谈商户整改轨迹等信息。情感共鸣:开设专栏,用AI技术将监管报告转译成表情符号,设置“恶心→放心”情绪转化进度条,实时展示卫生改善数据。螺旋传导:建立舆情熔断机制,当娱乐媒体负面情绪化词汇密度超标时,自动触发联系监管部门。

(2) 媒体平台可增设情感监测系统,对负面情感超过阈值的视频实施分级推送限制,设立“专家辟谣”弹幕通道,在争议视频中增设食安检测报告的可视化入口。

基金项目

国家社会基金一般项目:新冠疫情中“信息疫情”的形成机理及应对策略研究(22BGL240)。

参考文献

[1] 洪巍, 虞珂, 林强, 等. 食品安全网络舆情信息传播风险影响因素研究[J]. 情报杂志, 2024, 43(6): 167-176.
[2] 新华社. 国务院食安办挂牌督办“杨铭宇黄焖鸡米饭后厨乱象”[EB/OL].
https://baijiahao.baidu.com/s?id=1826472325575024950&wfr=spider&for=pc, 2025-03-13.
[3] 余惠琴, 吕伟, 王东波. 基于文本挖掘的我国食品安全事件特征分析[J]. 武汉理工大学学报(信息与管理工程版), 2022, 44(5): 839-844.
[4] 唐诗妍, 张芷芸. 突发公共卫生事件下公众食品安全信息需求分析[J]. 中国公共卫生管理, 2023, 39(3): 301-304.
[5] 谢卫红, 杨超波, 朱郁筱. 食品安全网络舆情的重复感染SIR模型研究[J]. 系统工程学报, 2022, 37(2): 145-160.
[6] 张守勇. 微博中校园食品安全事件舆情风险管理研究[D]: [硕士学位论文]. 保定: 河北大学, 2024.
[7] 石锦钰. 基于文本挖掘和情感分析的食品安全网络舆情预警研究——以“鼠头鸭脖”事件为例[C]//国防科技大学系统工程学院. 第六届体系工程学术会议论文集——体系工程与高质量发展. 2024: 600-607.
https://kns.cnki.net/kcms2/article/abstract?v=VQ0ntgfwFMQrWZh_ae5Bl2yexo-y__hPLw1WHTswVpbBv5jtrOhVcGMcbJXLISVhVCuUay9H3ODOOKHc_RLBHtQml_FFI583t_OJwSB86Hw8wizQ04YGW_ipaVln978z74NGC_1pdls1MOdU4gcxYvTQZbMRyLxkRbd0DQ9yfKOcngBxmoEJwUh8h4jC8Kg-pIZWYG3QRNt3z5RdB0Dvww==&uniplatform=NZKPT
[8] 陈镜贤. 主题关联视角下食品安全网络舆情主题与情感演化研究[D]: [硕士学位论文]. 哈尔滨: 哈尔滨工业大学, 2024.
[9] 胡志超. 基于食品添加剂引发食品安全网络舆情协同治理研究[J]. 河北北方学院学报(自然科学版), 2024, 40(3): 50-56.
[10] Xu, G., Yu, Z., Yao, H., Li, F., Meng, Y. and Wu, X. (2019) Chinese Text Sentiment Analysis Based on Extended Sentiment Dictionary. IEEE Access, 7, 43749-43762.
https://doi.org/10.1109/access.2019.2907772
[11] Zheng, C., Song, Y. and Ma, Y. (2020) Public Opinion Prediction Model of Food Safety Events Network Based on BP Neural Network. IOP Conference Series: Materials Science and Engineering, 719, Article 012078.
https://doi.org/10.1088/1757-899x/719/1/012078
[12] Liang, L. (2021) Quantitative Analysis of Diffusion of Public Opinion by the Modified Bass Model for the Dyeing Steamed Bread Incident in China. Saudi Journal of Business and Management Studies, 6, 24-27.
https://doi.org/10.36348/sjbms.2021.v06i01.004
[13] 孟述芬. 全媒体时代市场监管系统舆情特点及应对[J]. 全媒体探索, 2024(2): 62-63.
[14] 韩世鹤, 赵程铭, 杨洋, 等. 公众参与的网络舆情分析——以2022年食品安全“你点我检”活动为例[J]. 食品工业, 2024, 45(10): 341-346.
[15] 燕道成, 沈鼎洲. “日本排放核污水”事件中央视新闻微博用户评论的文本情感分析[J]. 传媒, 2024(16): 88-90.
[16] 杜宇灏, 李环宇, 林晓霞. 基于TF-IDF算法的舆情分析研究——以日本排放核废水事件为例[J]. 现代计算机, 2024, 30(23): 108-112.
[17] 史沁阳. 食品安全网络舆情演化分析与影响机理研究[D]: [硕士学位论文]. 无锡: 江南大学, 2024.
[18] 杨雪锋, 张佳. 化工园区公众邻避风险感知的网络情感分析——以人民网“领导留言板”为例[J]. 中国应急管理科学, 2025(2): 41-52.
[19] Mehmood, Y. and Balakrishnan, V. (2020) An Enhanced Lexicon-Based Approach for Sentiment Analysis: A Case Study on Illegal Immigration. Online Information Review, 44, 1097-1117.
https://doi.org/10.1108/oir-10-2018-0295
[20] 孙永健. 延迟退休政策网络舆情的演化规律、生发机理及治理策略——基于NLP的网络大数据分析[J]. 河海大学学报(哲学社会科学版), 2025, 27(1): 77-89.
[21] 徐博. 基于NLPIR框架的食品安全网络舆情管理指标体系建构[J]. 食品科学技术学报, 2023, 41(5): 165-174.