1. 引言
民以食为天,食品安全一直是民众关注的焦点。近年来,食品安全事件频发,在互联网、媒体等的高速发展下,形成了牵动民众敏感神经的食品安全网络舆情。食品安全事件有别于一般突发公共事件,是涉及范围最广、影响公众生命健康最直接的一种公共危机。食品安全网络舆情具有低燃点性、高扩散性、久持续性等特点,如果没有及时正确地进行控制与引导,在舆情主题和情绪的相互作用下,用户的关注程度会不断增长,人们讨论的内容也会随之扩散,情感波动也会加剧。在话题、情绪与用户行为的相互作用下,舆情发酵的过程中可能会出现虚假信息、群体极化和恶意炒作等不良现象,如果不加以有效监督管理,民众对于舆论的关注和讨论甚至可能会超越事件本身,脱离真相,使食品安全失去公信力,甚至影响社会稳定。
舆情产生及发酵的必要要素包括传播媒介、主体(用户)、客体(信息)等,了解各要素之间的作用关系,是研究舆情发酵过程的前提与基础,也可使得舆情监管更具针对性。相对于普通传播媒介而言,网络社交媒体平台凭借其、用户流量大、操作方便、精准推送等特点,其舆情发酵更为明显、复杂、迅速。微博作为网络社交媒体平台,是公众获取信息、表达观点和传播舆情的主要渠道。微博舆情中文本主题、情绪、用户信息行为对舆情发酵有着重要的影响作用,文本主题与情绪作为舆情发酵过程中重要的发酵菌株,二者相互影响,刺激发酵母体产生大量行为,这些行为也会对发酵菌株产生反作用,是新一轮舆情发酵的触发器。微博在食品安全网络舆情发酵过程中所产生的主题演化、情绪波动和用户行为相互影响,促进着食品安全网络舆情的发酵演化。因此,本文将融知发酵理论引入食品安全网络舆情的相关研究中,聚焦发酵菌株之间、发酵菌株与发酵母体行为之间的作用关系,探究在食品安全网络舆情中主题演化、情感波动与用户行为的动态影响机理,把握食品安全事件下舆情发酵的特点和规律,进而对食品安全网络舆情进行有效地管理。
2. 文献综述
2.1. 网络舆情中有关主题演化研究
王家辉等(2020) [1] 基于句法规则和社会网络聚类构建舆情生命周期内不同阶段的加权无向关系网络,从宏观和微观两个角度对主题的演化规律进行量化分析;丁晟春等(2021) [2] 提出将TF-IDF算法融合评论影响力选择主题特征词,在此基础上,通过计算主题强度与相似度提出了6种主题演化形式;郭宇等(2022) [3] 利用隐含狄利克雷分布主题模型,构建动态主题演化模型,挖掘社交媒体突发事件中的阶段划分与话题,并归纳出舆情危机的构成要素;张敬和朱相丽(2023) [4] 利用多维样本有序聚类方法结合改进的词袋构建方法,提升LDA模型主题识别效果,并借助Louvain社区发现算法在主题层进行多源数据的融合,分析领域主题演化路径;曾子明和陈思语(2023) [5] 结合博文数量的时序特征和生命周期理论进行周期划分,利用LDA模型和BERT模型构建研究框架,探究不同周期的舆情主题演化规律。
2.2. 网络舆情中情感分析研究
谭旭等(2020) [6] 针对复杂语境下的网络舆情评论,通过构建情感值测度算法并将其融入到改进后的LDA-ARMA模型中,对事件舆情情感波动进行动态化分析;阳长征(2021) [7] 使用突发事件微博数据,采用VAR模型对情感扩散、信息差序级联和舆论偏差之间的影响关系进行分析。Jin等(2022) [8] 运用百度云AI机器学习模型进行疫情微博舆情文本的情感和群体差异分析,发现男女群体在突发公共事件中情感变化发展的差异;黄仕靖等(2022) [9] 基于SnowNLP模型对数据文本进行情感分析,使用TF-IDF及LDA主题模型进行建模,研究分析了不同网民群体的情感变化倾向、影响网民群体情感波动的因素以及网络舆情的时空演化规律;Talaat (2023) [10] 提出了四种基于BERT与双向长短期记忆网络和双向门控循环单元算法的组合深度学习模型,提高了情感分析的精确程度。林伟(2023) [11] 提出了一种基于BERT、BiLSTM和Attention机理的多特征融合的网络舆情情感变化识别模型,以新冠疫情期间网民微博评论为数据集验证模型的可行性和优越性。
2.3. 网络舆情中用户行为研究
廖海涵等(2016) [12] 分析了网络舆情文本中所蕴含的用户行为特征,从文本信息的博文评论、转发和点赞等行为信息特征入手,使用回归分析等方法研究用户行为之间的规律;王微等(2019) [13] 运用计划行为理论为基础,基于信息生态视角,构建移动短视频UGC网络舆情传播行为影响因素模型,对相关影响因素进行分析;赵琼和魏夏(2020) [14] 对微博用户行为特征进行统计,结合机器学习中的朴素贝叶斯分类器对舆情文本数据进行情感分析,对微博用户行为的影响力进行实证研究;张继东和蒋丽萍(2021) [15] 对SEIR模型进行改进,增加用户行为规模等影响因素,探究了移动社交网络中用户群体行为对用户个体的影响方式与效果;张敏和沈嘉裕(2023) [16] 基于政务话语框架和BERTopic模型对政务短视频标题进行主题挖掘,并结合话题与用户行为数据进行关联分析。
2.4. 融知发酵理论
融知发酵理论最早由和金生教授 [17] 提出,他将知识增长过程与生物发酵过程进行类比,认为知识的发酵同样伴随着知识菌株的不断迭代更新,这一过程是在知识母体、知识菌株、知识酶等多种构成要素的共同作用下进行的 [18] 。该理论揭示了知识的内部增长与演化过程,对于知识管理的发展具有重要意义。目前,国内基于融知发酵理论的研究还较少,主要集中于知识情报管理、企业创新管理及信息资源共享等方面:胡峰等 [19] 基于生物发酵与情报生成相似性的类比逻辑,构建了面向重大疫情防控的应急情报发酵模型;黄蕊等 [20] 利基于融知发酵模型的静态指标和基于发酵反馈过程的动态评价指标,对企业技术创新能力进行了评价;李宇佳等 [21] 基于融知发酵理论剖析学术虚拟社区的知识增长过程,提取影响知识增长的因素;刘国亮等 [22] 解读了公共服务平台信息资源共享的发酵要素,结合SECI模型提出了实现信息共享的可行性路径。舆情的演化发酵从本质上看是一个信息增长与传播的过程,并且由于知识和信息是密不可分的两个概念,两者相辅相成,在一定条件下相互转化,因此可以将融知发酵的相关理论应用于网络舆情的信息发酵研究中,张蒙 [23] 通过解析突发公共卫生事件网络舆情发酵要素,研究了舆情发酵要素的作用机理和动态演化机理。
从现有的研究来看,国内外学者对食品安全网络舆情中的主题、情感和用户行为、网络舆情传播机理进行研究,对本文的研究具有重要的借鉴价值。然而,现有关于食品安全网络舆情的文献对主题演化、情感变化和用户行为之间动态影响关系进行研究分析的比较少见,而主题、情感和用户行为是推动食品安全网络舆情发展的重要要素,它们随着时间的推移相互作用,导致舆情不断发酵,产生社会风险。因此,本文以“鼠头鸭脖”事件为例,将主题演化、情感波动和用户行为置于融知发酵理论框架下,作为影响舆情演化的因素进行VAR模型建构,分析内生变量间的脉冲响应和方差贡献率,探究食品安全网络舆情中的主题演化、情感波动和行为之间的动态影响关系。
3. 模型建立与变量说明
3.1. 模型建立
向量自回归(Vector Autoregression, VAR)模型是由多元时间序列变量组成的,是向量自回归移动平均模型的简化。系统内每个方程都有包含有相同的内生变量的滞后期。当每个变量都既适合放在方程式的左边又适合放在方程式的右边时就可建立VAR模型,从而实现对变量间的相互影响进行分析。
本研究将主题演化(top)、情感波动(emo)及用户行为(beh)之间的关系纳入同一理论框架,建构各内生变量相互作用、相互影响的动态VAR模型:
(1)
其中,top为主题演化;emo为情感波动;beh为用户行为;k为变量滞后阶数;ε为随机误差项。
脉冲响应函数可以通过分析当一个误差项发生变化,或者模型受到某种冲击时对系统的动态影响。在此基础上,对VAR模型中的主题演化、情感波动及用户行为之间脉冲响应(Impulse Response, IR)进行分析,公式(1)可以写为:
(2)
公式(2)可以转化为一个无限价的移动平均过程:
(3)
其中,
则
,第i行第j列元素为:
(4)
公式(4)是脉冲响应函数,该函数描述了其他变量在任何时期都保持不变的情况下,
对
的一次冲击响应的过程。
方差分解(Variancede Composition)是通过分析每一个结构冲击对内生变量变化(通常用方差来度量)的贡献度,来评价不同结构冲击的重要性。因此,方差分解给出对VAR模型中的变量产生影响的每个随机扰动的相对重要性的信息 [24] 。为了比较主题演化、情感波动、用户行为之间相互扰动效应的大小,识别变量的相对重要程度,需在脉冲响应分析的基础上,分别对各因素的波动贡献率进行方差分解。相对方差贡献率算式为:
(5)
3.2. 变量说明
1) 网络舆情主题
在网络舆情发酵的过程中,往往会出现不同的主题,主题的演化分析可以揭示舆情事件中群众关注焦点的变化情况 [25] 。LDA模型是三层级的贝叶斯概率图模型,其组成包含文档、主题和词三个维度。LDA主题模型可挖掘出文档集或语料库中的潜在主题信息。本文使用LDA模型来计算识别舆情主题,并通过perplexity (困惑度)评价指标来确定文本中的最优主题个数,k困惑度的计算公式为:
(6)
根据主题分析的结果,以每小时内与事件报道微博主题标记相同的博文个数与该小时内总计博文条数的比值作为衡量主题演化的指标。
2) 网络舆情情感
情感分析主要通过计算情感倾向得分来实现。情感分析方法借鉴林伟 [11] 提出的基于BERT预训练语言模型与双向长短时记忆网络(BLSTM)及注意力机理(Attention)相结合的BERT多特征融合模型来计算,首先通过BERT预训练模型获取包含上下文情感语义信息的词向量,然后利用双向长短时记忆网络提取上下文相关特征进行计算,最后引入注意力机理对提取出的信息分配权重,突出重点信息,进行文本情感分类与得分的计算,得到每条博文介于0~1之间的情感强度值。
3) 网络舆情用户行为
网络群体内部用户间的互动是社交活动最重要的组成部分,也是信息能够得到快速、有效传播的关键。网络群体行为是指人们聚集在网络中,通过点赞、评论、转发等方式与网络其他成员进行互动的具体行为 [26] 。转发、评论、点赞的行为在食品安全网络舆情演化中发挥重要作用,影响着舆情传播态势。转发、点赞能够将原始的食品安全舆情信息传播到更广泛的受众中。随着信息不断在网络上被分享,其可见度和影响力会逐渐增加,从而引起更多人的关注和讨论。评论是公众表达观点和讨论舆情话题的主要途径之一,当一个食品安全问题引起公众广泛关注并引发热议时,有可能推动相关部门和企业采取更积极的措施回应问题,从而影响舆情演化的走向。本文通过计算每个小时的点赞、评论、转发数量的总和来衡量该时间段内的用户行为。
4. 实证研究
4.1. 案例选择及指标计算
4.1.1. 案例选择及数据获取
新浪微博目前用户覆盖率较高,是热点话题首要的舆论引爆场,具有较大的社会影响。6月1日,网络曝光一则视频,视频中一名江西某学院学生表示在食堂吃饭吃出异物,疑似老鼠头,视频曝光后起网友广泛关注。相关话题多次登上各大平台热搜,累计热搜时长高达820小时,成为舆论关注重点。具体的网民关注度变化情况如图1所示。

Figure 1. Baidu search index for “Rat Head Duck Neck” incident
图1.“鼠头鸭脖”百度搜索指数
由图1可知,6月17日至6月19日期间,在官方调查结果发布,判定学生在食堂吃出疑似为“鼠头”的异物为鼠头,事件再次冲上热搜并受到大量关注,相关信息随着用户的转发、评论、点赞等行为急速地传播,舆论持续发酵,舆情的主题不断发生演化,人们产生了担忧、恐慌、焦虑、烦躁等多重负面情感。
本文使用Python爬虫工具以“鼠头”、“鸭脖”为关键字,时间跨度设置为2023年6月17日12:00至6月19日12:00,按小时抓取总共48小时的微博文本信息,最终共获取到了20,758条博文。在对舆情文本数据进行预处理,过滤掉无关字符、空值、原创程度很低的数据以及去重后,得到15,782条有效数据,并将所有舆情数据按照发布时间排序并按小时分割,得到48个时间段的文本数据。
4.1.2. 指标计算
1) 舆情主题
首先通过困惑度确定最优主题数,如图2所示。随着主题数设置的增加,模型困惑度有明显下降,说明模型性能较好,能够有效地实现主题的判别。
当主题太多时,模型会出现过拟合的情况 [27] ,结合实际分类效果,最终考虑的主题个数为12个。主题分析结果如表1所示。
计算每小时内与原微博主题标记不同的博文个数与该小时内总计博文条数的比值,得出主题变化如图3所示。
2) 舆情情感
通过BERT多特征融合模型计算出每条微博的情感强度值。为了消除每小时有效博文量对结果的影响,按小时划分数据范围,计算每小时的平均情感强度,以此来衡量每小时的情感波动程度,得到的结果如图4所示。

Table 1. Results of LDA thematic analysis
表1. LDA主题分析结果
3) 用户行为
根据抓取数据的转发、评论和点赞的标签分类计算用户行为总和,由于不同评价指标往往具有不同的量纲单位,这样的情况会影响到数据分析结果,为了消除与舆情主题和舆情情感指标之间的量纲影响,对用户行为采取z-score标准化处理,得到的结果如图5所示。
在此基础上,形成包含舆情主题(top)、情感(emo)与用户行为(beh)三个变量的时间序列数据,每个时间序列的长度均为48。相关数据如表2 (部分)所示。
4.2. VAR模型的建立
4.2.1. 单位根检验
为防止“伪回归”现象对实证结果的影响,在VAR模型估计前,对各内生变量平稳性进行单位根检验,并对不平稳的变量采取一阶或者二阶差分的形式保证其平稳性。本文采用ADF检验方法验证变量平稳性,其检验结果如表3所示。
检验结果表明:序列top、emo和beh的ADF值均小于5%水平的值,P < 0.05,均可拒绝“存在单位根”的原假设,为平稳序列。具备直接建立VAR模型的条件。
4.2.2. VAR模型的建立
本文采用主题演化(top)、情感波动(emo)与用户行为(beh) 3个时间序列变量组成的系统建立VAR模型。模型滞后阶数P的确定采用多准则联合确定方法,VAR模型的最优滞后阶数要使得它们的值越小越好。通过LR,FPE,AIC,SC,HQ准则判断,VAR模型选择滞后阶数p = 3,结果如表4所示。

Table 4. Results of choosing the VAR lag order p
表4. VAR滞后阶数p的选择结果
根据最优准则,建立3阶VAR模型,参数估计结果如表5所示。

Table 5. VAR model estimation results
表5. VAR模型估计结果
在建立VAR模型之后,应检验被估计的VAR模型是否恰当,故本文采用AR根单位圆对VAR模型进行平稳性检验。检验结果如图6所示。
经检验,滞后期长度为3且有3个内生变量的VAR模型,特征根多项式有3 × 3 = 9个特征根。每个特征根倒数的模都在单位圆内,没有位于单位圆外的根,因此该VAR模型通过稳定性检验,认为模型是稳定的。
4.3. 脉冲响应分析
为了揭示舆情主题演化、情感波动及用户行为之间的动态扰动特征,在VAR模型估计基础上,分别对舆情主题演化、情感波动及用户行为进行脉冲响应分析。对应分析结果如图7所示。
首先,分析自身的冲击效应。主题演化、情感波动和用户行为三个变量在面对自身一个标准差冲击时,在第1期时就出现最大的正向反应,随后逐渐减弱至0,说明主题演化、情感波动和用户行为均表现为自我强化机制。
其次,分析舆情主题对情感波动和用户行为冲击效应。给定舆情主题的一个标准差冲击,可以发现情感强度在第1期就出现了微弱的正向反应,随后快速降低至负值且在第5期达到负向最大值−0.059,并保持负值直至逐渐收敛,而用户行为则是迅速产生正向反应,在第4期达到最大值0.47,并保持着显著的正向效应直至收敛。这是由于人们对食品安全的敏感性,当“鼠头鸭脖”事件发生后,新话题的出现会加剧人们对食品安全的恐慌心理,导致人们的负面情绪增多;同时新话题的出现也会吸引人们的进一步关注,刺激用户对该类新话题进行转发点赞以及评论的行为。
然后,分析情感波动对主题和用户行为的冲击效应。给定情感波动的一个标准差冲击,可以发现主题演化在第2期出现了微弱的负向反应,随后在第3期降低至负向最大值0.014,随后保持负向影响并逐渐降低直至收敛;而用户行为则是先产生微弱的负向反应,随后逐渐上升变为正向影响并在第4期达到正向最大值,随后逐渐降低直至收敛。这说明情绪的波动会使人们讨论话题的多样性减少,情感在社交媒体上可以得到强化。
最后,分析用户行为对主题演化和情感波动冲击效应。给定用户行为的一个标准差冲击,可以发现主题演化和情感波动一直保持着微弱的负向反应直至收敛,说明在舆情的传播中,来自用户行为的冲击对主题演化和情感波动没有显著的影响。
4.4. 方差分解
利用方差分解可以进一步分析主题演化、情感变化与用户行为间的互动关系,研究不同变量的正交化冲击对其他变量变化的解释比例 [28] ,方差分解结果如图8所示。

Figure 8. Variance decomposition results
图8. 方差分解结果
从图8可知,舆情演化、情感波动和用户行为的自身冲击对其变化发展都占据了非常重要的比例,这说明在食品安全网络舆情发展的过程中,引起舆情演化、情感波动和用户行为的变动因素,大部分都来自于舆情演化、情感波动和用户行为自身,但不同变量也存在明显的差异。
第一,主题演化的贡献度分解。由图8(a)和图8(b)的①可知,舆情演化在第1期来自自身的方差贡献率为100%,随后逐渐降低,到第20期降低至80%,来自情感波动和用户行为的方差贡献率逐渐上升,随后逐渐稳定在15%和5%的水平。说明在食品安全网络舆情中,舆情主题的演化主要由自身变化推动,而舆情情感的波动对舆情主题的演化也存在着明显的作用,会影响用户选择信息的倾向,使得某些信息得到强化传播。来自用户行为的方差贡献率较小,说明在食品安全网络舆情中,相比于话题和情感的刺激而言,用户行为更多是起到传播的作用,对于舆情变化起的作用较小。
第二,情感波动的贡献度分解。由图8(a)和图8(b)的②可知,情感波动在第1期来自自身的方差贡献率为99%,随后逐渐降低,到第20期降低至75%,来自主题演化和用户行为的方差贡献率逐渐上升,随后逐渐稳定在10%和15%的水平。情绪在社会交往中具有传染性,尤其在网络环境中更加显著。这种情绪传染会导致情绪波动加剧,形成情感扩散的社会传播效应;同时,用户经常分享个人经历可以引起共鸣,并引发情感投入;当用户在社交媒体上参与舆情话题讨论时,他们可能会通过与其他人互动和交流,逐渐调整和强化他们的情感状态,引起情绪的变化。
第三,用户行为的贡献度分解。由图8(a)和图8(b)的③可知,在用户行为的方差分解中,用户行为在第1期、第2期和第3期来自自身的方差贡献率接近100%,来自主题演化和用户行为的贡献率很低,但随后用户行为自身的影响力逐渐降低,直到稳定在55%左右的水平,来自主题演化和情感波动的方差贡献率逐渐上升,随后逐渐稳定在37%和8%的水平。说明在食品安全网络舆情中,舆情主题和情感的变化对用户行为的影响具有一定的滞后性。情绪是人类行为的重要驱动力之一,社交媒体平台也会根据用户的行为和兴趣推送相关内容,用户更容易接触到与其情绪一致的信息。当用户看到自己感兴趣的情绪内容时,更有可能参与互动。
5. 研究结论与对策建议
本文通过利用“鼠头鸭脖”食品安全事件的网络舆情数据,探索了主题演化、情感波动及用户行为之间动态影响机理,得出如下结论:
1) 在食品安全网络舆情中,舆情主题演化、情感波动和用户行为都表现为自我强化机制。一个话题的出现会刺激新话题的产生,使舆情话题的范围不断扩大;情感在社交媒体上具有传染性,当一些用户表现出强烈的情感时,其他用户也可能受到影响,并表现出类似的情感。此外,微博的推广机制会使得那些拥有很高转发、评论、点赞的博文进一步受到用户关注,从而吸引更多用户行为。
2) 人们讨论话题的多样性会随着情绪的波动而减少,人们倾向于关注与感情相符的观点,同时情绪会影响用户接受和表达信息的倾向,使得某些信息得到强化传播,而其他信息被忽视或抵制,从而引发话题的集中。夸大的信息往往比真实信息更具有吸引力,因为它们可能会迎合用户的情绪需求或加剧用户的担忧,从而更容易被传播和接受,导致舆情话题发生变化。用户行为对于话题演化的影响较小,用户行为主要发挥维持话题传播的作用。
3) 当食品安全事件发生后,有关食品安全新话题的出现会加剧人们对食品安全的恐慌心理,联想到身边食品安全的潜在隐患,从而导致人们的负面情绪增多,引发剧烈的情绪波动;在社交媒体平台上,用户参与舆情话题的讨论往往是一个动态和互动的过程。当用户开始参与讨论时,他们可能带有特定的情感或态度,但随着与其他参与者的互动,他们的情感状态可能会逐渐受到影响和调整。
4) 情感作为行为的重要驱动力,可以促进人们产生相应的行为。新话题通常会吸引更多的用户关注。当一个新的食品安全问题或事件发生时,用户可能会感到关切、担忧、恐慌,这种情感反应会推动他们积极参与,通过转发、评论和点赞来表达他们的兴趣和立场。
根据研究结论本文为舆情监管和引导提供如下管理对策参考。
1) 在舆情情绪引导方面,由于情绪具有强烈的传染性,所以当事件发生时,相关部门需要及时公布事件真实情况、调查结果和处理方式,提供透明的信息来源,并进行持续跟踪监管,安抚民众情绪,同时加强食品安全知识的宣传普及,提高公众对食品安全问题的科学认知,减少情绪的不理性和过度波动。
2) 在舆情主题演化方面:设置严格的信息审核机制,确保信息真实可靠,减少虚假信息的传播,及时澄清模糊信息。优化社交媒体平台信息推送机制,避免过度强调用户兴趣偏好,减少信息过滤效应,提供更多样化和客观的信息,并避免未经证实的言论持续受到用户的关注,误导用户行为。
3) 在用户行为管理方面:提高用户媒体素养,提升用户的信息甄别能力,鼓励用户对明显虚假信息进行监督举报,规范用户的舆情参与行为;社交媒体平台可以通过了解用户行为的趋势和模式来设计和优化用户界面,引导用户积极参与有益的讨论和互动,同时限制非官方用户发布高热度信息的推广次数。
6. 总结与展望
本文基于融知发酵理论,考虑食品安全网络舆情演化发酵过程中,舆情主题、情感和用户行为之间的相互影响关系,以典型食品安全事件微博舆情作为案例,选取主题演化、情感波动和用户行为变化作为指标,并结合LDA模型、BERT模型等方法对指标进行分析与计算,在此基础上构建向量自回归模型,运用脉冲响应分析和方差分解探究食品安全网络舆情的演化发酵机制,具有一定的创新性。
另外本文在研究中存在一定的局限性:仅选取单一舆情事件进行实证研究,在今后的研究中需要选取更广泛的事件和数据来源,进一步提高研究结论的普适性;此外,未来需要进一步优化完善舆情内容的分析模型,更加系统、科学地研究食品安全网络舆情的发酵演化机理。