1. 引言
随着互联网技术的发展,各种社交平台不断涌现,以互动、开放为标志的网络空间已经成为舆情产生和发酵的重要载体和平台,公众对特定事件表达情感和立场,形成具有一定情感倾向的网络舆情。当非常规突发事件形成社会热点关注时,网络舆情会随时间传播及演化。其网络舆情具有突发多发、热点转换迅速、信息传播失真等特征,它的形成与传播演化也往往受到多种因素的共同影响,是一个复杂的网络系统。研究掌握网络信息传播及演化的方式、途径、周期和特征等规律,对非常规突发事件网络舆情的传播及演化采取一系列的有效措施,从而达到对其进行干预和管控的目的。
2. 研究网络舆情传播的步骤
2.1. 对相关数据进行抓取
在对非常规突发事件网络舆情传播的特征和影响因素进行描述性统计分析、探索性数据分析时,根据从各平台的大量数据中,找到一些相关因素,通过相关因素来对数据进行分析与探究。
基于所选定的网络舆情事件“长沙居民自建房倒塌事故”,将数据统计平台锁定为新浪微博、知乎、百度和头条,并确定点赞、评论和转发三个影响因素。再对数据进行预处理,通过“长沙自建房倒塌53人遇难”这一关键词,分别针对在新浪微博、知乎、百度和头条四个平台对其点赞、评论和转发的数据,用Python来进行抓取。
利用公式和MATLAB对这些相关数据进行描述性统计分析,利用初步分析的结果,发现针对这一网络舆情事件,其讨论的热度远强于此事件传播的力度。最后,采用SPSS对数据和具体的日期进行探索性数据分析,使数据和分析结果更加清晰、准确 [1] 。
2.2. 建立网络舆情的传播网络
在这节需要构建一个非常规突发事件网络舆情的传播网络。通过网络舆情的传播网络,可以确定网络舆情的传播路径,也可以确定其中影响力用户的传播作用。
本节挑选一个数据平台进行分析。在舆情发展趋势中,该事件全网声量最高峰出现在2022年5月1日,共产生38,608条舆情信息,其中微博平台最为突出,最高达到31,728条传播量,成为该事件的主要传播媒体。因此,我们挑选“新浪微博”这一平台,在平台中搜索关键词“长沙居民自建房倒塌事故”。
在热门榜单中,对点赞及评论数最高的十名ID进行综合分析,并选中4个ID作为意见领袖并对其进行数据处理及分析。对数据进行预处理,处理以后的数据通过复杂网络分析软件Gephi进行数据可视化分析,绘制网络舆情传播拓扑结构图。通过这一网络舆情传播拓扑结构图,可以清晰看到该事件网络舆情的传播路径及人物发展关系 [2] [3] 。
根据“长沙居民自建房倒塌事故”网络舆情拓扑结构图,选取其中最具有代表性的一些社区单元,对其进行二级层面的ID影响用户分析,并提取目标主题下的高影响力用户,可以更加直观地看到影响力用户对于舆情传播的作用。
2.3. 网络舆情的情绪转化趋势
在构建融合情绪下的非常规突发事件网络舆情结构框架下,用Python对平台数据进行抓取,并对抓取的数据进行情绪演化分析,以及情绪的转变分析。
首先,先从平台上阅读了大量的文本数据,发现基于网络舆情事件“长沙居民自建房倒塌事故”下,有着大量“愤怒”、“生气”、“难过”和“悲伤”等情绪词汇。因此,我们确定“愤怒”、“生气”、“难过”和“悲伤”作为情绪数据的抓取关键词。
利用Python在新浪微博、头条和百度三个平台在“长沙居民自建房倒塌事故”这一话题下,对于相关的数据进行抓取。由于在知乎中,对相关数据比较缺乏,所以舍弃对知乎进行抓取的数据。
在抓取了相关的具体日期下的情绪的数据以后,由于需要利用情绪数据进行相关趋势的观察与分析,所以选用MATLAB对其进行情绪趋势分析。在情绪分析时,我们分别绘制了相关的情绪趋势线和情绪饼状图。在情绪趋势线和情绪饼状图的分析下,可以更加深入地了解到大家的情绪演变及情绪趋势,也可以对舆情的主题演化有更加直观的认识。
3. 网络舆情传播的分析
3.1. 关于舆情传播的数据
3.1.1. 对数据进行预处理
基于所选定的网络舆情事件“长沙居民自建房倒塌事故”,将数据统计平台锁定为新浪微博、知乎、百度和头条,并确定点赞、评论和转发为三个影响因素。其次对数据进行预处理。通过关键词“长沙自建房倒塌53人遇难”,分别在新浪微博、知乎、百度和头条四个平台用Python对点赞量、评论量和转发量相关数据进行抓取。
通过抓取结果发现,在新浪微博、知乎和头条三个平台,分别抓取的数据量为195条、200条、123条,但是在百度平台上抓取的228条相关数据,由于其缺乏影响因素的具体数据,因此将其舍弃。最后,我们选择了新浪微博、知乎和头条这三个平台的数据进行描述性数据分析和探索性数据分析。
3.1.2. 对数据进行描述性分析
通过对各平台点赞量、评论量和转发量的原始数据运用MATLAB进行描述性分析,得出表1。

Table 1. Descriptive analysis data of influencing factors of each platform
表1. 各平台影响因素描述性分析数据
根据上表的结果,可以发现,数据的评论数和点赞数远远大于转发的数量。并且,数据的值间变异度均比较高,其中点赞的数据值间变异最小,评论数据值间变异最大。还可以看出,数据的峰度和偏度也比较大。这也说明该组数据的正态分布程度较大且较正偏态。因此在对具体时间日期进行数据分析之前,应该排除掉影响强度高又不具有参考价值的数据,分别是5月14日,5月16日~5月21日,5月27日的数据。
为了对整个舆情传播时间曲线有更清楚的认识,我们通过“百度指数”搜索“长沙居民自建房倒塌事故”这一关键词,研究的时间段设定为4月29日~5月8日,获得此次非常规突发事件网络舆情的传播时间曲线,如图1所示。

Figure 1. Internet public opinion communication trend of “the collapse accident of Changsha residents’ self-built houses”
图1. “长沙居民自建房倒塌事故”网络舆情传播趋势
3.1.3. 对数据进行探索性分析
从上表可以初步分析出,针对这一网络舆情事件“长沙居民自建房倒塌事故”,其讨论的热度远强于传播的力度。再采用SPSS对数据和具体的时间日期进行探索性分析 [4] 。
通过图2、图3可以发现,网络舆情事件“长沙居民自建房倒塌事故”的扩散在5月1日和5月6日达到了高峰期。而对于该事件的讨论热度爆发期在5月6日。正好与图1百度平台指数相吻合,验证了我们数据的准确性。

Figure 2. Summary data comment box diagram of each platform
图2. 各平台汇总数据评论箱图

Figure 3. Summary data like box diagram of each platform
图3. 各平台汇总数据点赞箱图
可以分析出,这个事件发生于2022年4月29日,正处于法定小长假五一前。但在该事件发生后的两天,即4月29日~4月30日,却并没有引起大众的注意。猜想其原因可能是当时大众还未了解该事件爆发的具体原因,对伤亡情况还没有认知。并且,该事件发生在五一小长假的前期,大众对于假期的期待和节假日游玩的安排比其他事情更具有关注度。
通过点赞的数据可以得出,在5月1日当天,事件逐渐开始引起社会大众的关注。由于大众处于休息时间,所以对于社会新闻的关注度增加。事件发生的原因是因为违法的自建房倒塌引起曝光,它是人为造成的。对于这种违章违建非常容易引起大众内心的愤怒与不满,需要在生活中进行严厉打击。它的发生可能存在相关部门的一系列违规操作,从而引起了社会的关注 [5] [6] 。
从5月2日~5月5日期间,事件的热度和讨论度再次下降。大众这个时候开始进行错峰的五一出行,其注意力再次转到关注假期。在该时间段,事件具体的伤亡情况和伤亡人员的身份还没有曝光。在5月6日时,该事件达到了舆情的爆发点。此时假期结束,人们的关注点再次从假期转回,社会新闻的被关注度再次提高。搜救情况也已经全面结束,并且其伤亡的情况极为惨重。经调查发现,其伤亡者大多为医学院的学生。由于医学院的学生本来就是担当着救死扶伤的社会责任,也一直向社会所付出。所以伤亡人数和医学生,这两个方面的话题重叠在一起,使得这一事件的舆情更加具有讨论的热度。从而,对于完整的这一事件,产生了情绪的爆发点。
3.2. 网络舆情的传播网络
用Python对数据进行第一轮的爬取。通过“长沙居民自建房倒塌事故”这一关键词进行搜素。我们发现,排名前4名的ID名称分别为,“央视新闻”、“人民日报”、“董藩”和“看度新闻”。继续对数据进行第二轮的爬取。以第一轮爬取的ID:“央视新闻”、“人民日报”、“董藩”和“看度新闻”为初始节点,爬取其话题下评论的ID,其二级ID数量分别为200、200、34和10条。同样,根据其评论的点赞量和回复量,相对随机选取其中具有代表性的微博用户ID [7] 。
计算用户ID的权重,这样可以更直观准确地体现出点赞量对整体数据的影响。对四组数据下面的二级用户ID分别进行权重分析,根据其发表言论的点赞量为基础计算权重。
对抓取的数据进行分析
利用复杂网络分析软件Gephi,对抓取的数据进行可视化分析。以“央视新闻”、“人民日报”、“董藩”和“看度新闻”为初始节点,以二级用户ID为指向节点,边属性代表二者之间的评论和点赞关系。根据数据的可视化分析,选取其中两个具有代表性的社区单元“央视新闻”和“人民日报”,对其进行二级ID影响用户分析。然后,提取目标主题下的高影响力用户,如图4、图5所示。

Figure 4. High-impact users of CCTV News
图4. “央视新闻”的高影响力用户

Figure 5. High-impact users of People’s Daily
图5. “人民日报”的高影响力用户
在可视化分析中,“央视新闻”、“人民日报”、“董藩”和“看度新闻”这4个节点是点度中心性最高的节点,他们是此次“长沙居民自建房倒塌事故”网络舆情传播的核心,由此得出,该4个节点影响力和交互性能极高,在获取信息方面更具优势,在网络舆情传播过程中的权力声望更高,意味着其不易受其他媒体传播者的控制。因此他们是此次网络舆情事件的意见领袖。
其中“央视新闻”是最大的社区,“看度新闻”是最小的社区,由此结果可得,“央视新闻”是此次网络密度最高,传播数量最广的最大意见领袖。但值得注意的是,以自媒体为代表的用户ID“董藩”,其传播能力甚至不在官方媒体之下,反而大于大部分官方媒体。由此可得,自媒体事业随着时代的潮流不断壮大,与官方媒体相辅相成,促进网络信息传播事业的发展 [8] 。
对“央视新闻”、“人民日报”进行二级层面的影响力用户ID分析,提取目标主题下的高影响力用户,如图4、图5所示。他们分别为“无khb”、“鬼璽”、“戳爷的火醬”、“龏奭嚻艸”和“波猪i”这5个用户ID。我们发现他们在“央视新闻”、“人民日报”评论中都有参与讨论,表明这5个用户对“央视新闻”和“人民日报”这两个传播媒体的信息依赖程度很高,并且点赞量均排名靠前,权重占比很高,表明这些传播者易控制其他传播者,且获取信息方面也比其他传播者更具优势,权力声望也较高。
综合分析得出,“无khb”和“鬼璽”在“央视新闻”、“人民日报”中的点赞量高,并且权重占比较大。因此,用户ID为“无khb”和“鬼璽”,为此次网络舆情事件的影响力用户。
3.3. 网络舆情中情绪的演化
3.3.1. 情绪演化的趋势线
通过情绪演化的趋势线可以分析得出大众对于该“长沙居民自建房倒塌事故”的情绪爆发点主要集中在5月1日与5月6日这两天,同时吻合了官方数据平台数据(图1)。在4月30日~5月5日这一时间段,可以看出在大众的情绪中,愤怒是远远高于悲伤的。分析其原因可能是在4月30日的时候曝光了事故发生的原因,揭示了这个事件是人祸而并不是天灾。即事故发生的本身是可以避免的,而这段时间的伤亡情况还没有最终的结论,因此人们的情绪更多在于对于事故原因的愤怒。
在5月6日这一天,大众的愤怒和悲伤的情绪也均达到了最高的爆发点。这是由于此时最终伤亡人数已经确定,该事件属于特大事故。同时伤亡人员的具体身份也得到报道,其中大部分为医学院学生,还有忙于生计的夫妻等。这引起了大众的同理心,所以,此时悲伤的情绪远远大于愤怒。后期舆论聚焦在关注最新救援情况、讨论楼房倒塌背后的自建房违建乱象、各地网民反映当地自建房及楼房加盖乱象上。
3.3.2. 情绪演化的饼状图

Figure 6. Pie chart of emotional evolution
图6. 情绪演化的饼状图
在情绪饼状图中(图6),蓝色代表悲伤的情绪,红色代表愤怒的情绪。可以直观地看出在事件发生后的整个时期中,悲伤的情绪占比64%。分析其原因有以下几点:1) 由于事故造成的惨痛结果属于特大事件,所以其伤亡情况惨重。2) 事故属于可以避免的“人祸”,社会大众会更加难以接受此事故的发生。3) 伤亡人员大多为医学生和忙于生计的务工人员。未来本来应该可以治病救人的医学上却不能自救,这让大众是非常寒心的。4) 对于忙于生计的务工人员来说,他们可能是家庭里面的顶梁柱。他们的丧命,对于本就不富裕的家庭,带来的打击是毁灭性的。这两种特殊的社会身份对悲伤情绪有渲染和促进作用。因此,在事件发生的整个时期中,悲伤的情绪则为大众的主要情绪。
4. 结语
综上,对于非常规突发事件网络舆情的相应预警建议或干预措施有以下几点:
4.1. 优化网络舆情传播预警机制
舆情引导,常用于预防并处置冲突与风险。通过全面、系统、深入剖析本突发事件舆情的困境,构建舆情传播能力体系,制定传播与舆情引导策略具有重要的意义。
4.2. 规范互联网上的信息
对外传播渠道基本上是官方组织或单向传播,其他民间、中间等传播主体未经过专业训练。信息传递与沟通渠道局限导致公众的感知力偏低。互联网及社交空间成为大家了解真相,寻求安全感及舆情宣泄的重要渠道。这种情况下,互联网上的信息需要及时地进行规范 [9] [10] 。
4.3. 掌握舆情的传播规律
加强对传播理论研讨与舆情监测业务系统化训练,掌握舆情的传播规律。该项工作应该运用科学的理论去指导,制订并实施对相关能力的提升计划。总结以往的经验,面对未来的挑战。