1. 引言
在当今数字化时代,电子商务作为数字经济的重要组成部分,发展迅猛,深刻改变了全球经济格局。然而,虚假信息在数字市场的传播对消费者权益和市场公平造成了严重损害。尤其是在微博等社交媒体平台上,发布的内容和用户评价对市场交易具有重要影响。其中,虚假信息可能误导消费者,影响其购买决策[1]。
数字生态的复杂性使得虚假信息的传播变得更加迅速和隐蔽。在数字生态系统中,信息通过复杂的网络结构和多样的传播渠道扩散。尤其是在物流危机等突发事件期间,消费者的行为和需求会随着事件发展发生显著变化,数字市场也随之波动[2]。此时,微博等社交媒体平台上的舆论和信息传播速度加快,虚假信息可能迅速扩散并影响电商交易。因此,在突发事件背景下研究虚假信息传播及关键节点识别,对于维护电商市场稳定和消费者权益具有重要意义。
传统方法在应对电商虚假信息传播时存在局限性[3],难以从源头上有效遏制其扩散。社会网络分析提供了一种新的视角,通过分析网络中节点的连接关系,识别关键传播节点,从而为虚假信息治理提供新思路。
本文提出一种基于多指标融合的关键节点识别模型,通过整合度中心性、中介中心性、特征向量中心性与PageRank算法,结合突发事件中网络结构的变化规律,实现权重自适应优化。该模型不仅能够精准定位虚假信息传播的“超级节点”,还可为平台提供实时监测与干预的决策依据,从而在源头遏制虚假信息的裂变式扩散。后文将围绕模型构建、实验验证与治理策略展开论述,以期为数字生态治理提供兼具理论深度与实践价值的研究范式。
2. 数字生态视域下信息传播研究论述
2.1. 虚假信息传播机理研究进展
早期研究聚焦于虚假信息的内容特征。近年研究开始关注传播网络的关键节点的识别与分析;传统虚假信息检测,社交媒体上的虚假信息可以从多个方面来选取特征作为证据。通常侧重于文本分析、用户响应和来源可信度[4]。C. Castillo等[5]评估Twitter上的新闻可信程度,所提取的68个特征涵盖消息基本特征、用户特征、话题特征以及传播特征。在突发事件场景下,范敏等[6]的实证研究表明,发现微博平台是主要传播渠道,负面舆情占比高,信息传播有生命周期特征,情感变化推动主题演化。尚丽维等[7]通过分析用户的基本属性,如注册时间、粉丝数量、发布内容的数量和质量等,来判断用户的影响力。具有较长注册时间、大量粉丝、高质量内容输出的用户更有可能成为关键节点。该发现为本研究关键节点的情感特征、用户信息分析提供了理论支撑。
2.2. 社会网络分析方法论演进
社会网络分析(SNA)为信息传播研究提供了量化工具。Sathik等[8]使用社交网络分析中的中心性度量来识别在线博客中的关键参与者利用度中心性、LeaderRank和介数中心性的多指标方法可以有效识别社会网络中的关键节点[9]。Luo等[10]开发了一种结合接近度和特征向量中心性的全局中介度熵算法来识别关键节点。Hong等[11]介绍了一种基于PageRank的算法来评估考虑影响力和网络结构的节点重要性。这些方法在实际应用中被证明能够较好地揭示网络中信息扩散的结构性特征,但它们在面对复杂多变的虚假信息传播时,往往仅依赖于单一或者较少网络结构。现有治理策略呈现从单一监管向智能识别转型的趋势。南婷[12]探讨了虚假信息治理的新挑战及应对策略,其中提到利用智能技术进行信息识别和监测。
这些研究表明,结合网络结构多特征分析与先进技术已成为治理实践的主流方向,但如何平衡识别精度与计算效率仍是亟待突破的瓶颈。本文提出的多指标融合模型,正是针对上述问题进行的理论拓展与方法创新。
3. 网络中关键传播节点识别
3.1. 关键节点识别模型
如图1,通过获取数据集,然后构建社交网络图,整合社会网络分析(SNA)方法,以实现虚假信息传播网络中关键节点的精准识别。该架构可以分为四个主要部分:数据集的获取、社交网络的构建、网络中心性指标计算、关键节点识别。
Figure 1. Key node identification model
图1. 关键节点识别模型
3.2. 基于社会传染的网络传播分析
3.2.1. 传播网络构建方法
在虚假信息的传播过程中,社交媒体平台成为了信息流动和扩散的重要渠道。为了更好地理解虚假信息是如何在网络中传播的,首先需要微博中爬取的数据构建传播网络。
按照图论中
的基本原理构建微博突发事件社交网络[13]。其中,
代表网络中节点的集合,即本研究所选取的10,928帖子所对应的用户,可表示为
;
代表网络中边的集合,由有序节点对
构成[14],即在本研究中,当用户
转了用户
的一条帖子,则认为存在一条从用户
指向用户
的一条有向边,记作
。
3.2.2. 中心性指标计算
为了识别信息传播过程中的关键节点,社会网络分析(SNA)提供了一系列中心性指标,帮助我们评估每个节点在传播过程中的重要性,如表1所示。以下详细介绍了所选的中心性指标,及其在虚假信息传播中的合理性说明:
(1) 度中心性(Degree Centrality):
度中心性表示一个节点直接连接的边的数量。在社交网络中,度中心性高的节点通常是信息传播的主要“中介”,它们能够迅速传播信息。在虚假信息传播的背景下,度中心性高的节点可能是信息的发源地或传播的枢纽节点,识别这些节点对于理解信息传播路径至关重要。表示为公式:
(1)
其中,
是节点
的度,表示与该节点直接相连的边的数量。
(2) 中介中心性(Betweenness Centrality):
中介中心性计算一个节点作为其他节点间传播信息的中介者的能力。它衡量一个节点在网络中作为信息传递中介的频率。中介中心性对于识别“超级传播者”至关重要。这些节点通常是信息传播的“桥梁”,在不同社群之间扮演关键角色。在虚假信息的传播过程中,某些用户充当了信息传递的中介,因此,它们可能对虚假信息的扩散起到加速作用。表示为:
(2)
其中,
是节点
到节点
的所有最短路径的数量;
是通过节点
的最短路径数量。
(3) 特征向量中心性(Eigenvector Centrality):
特征向量中心性不仅考虑一个节点的度数,还考虑与该节点连接的其他节点的中心性。换句话说,特征向量中心性高的节点是与其他重要节点连接的节点。该指标特别适用于识别那些不仅连接了许多节点,而且与其他高中心性节点连接的节点。在虚假信息的传播中,节点之间的连接密度和路径中介作用能够较好地反映节点的传播能力与影响力。表示为:
(3)
其中,
是节点
的特征向量中心性;
是与节点
相邻的节点集合;
是最大特征值。
(4) PageRank:
PageRank是一种基于链接分析的算法,最早用于网页排名。它衡量一个节点的“重要性”不仅仅基于度数,而是基于指向该节点的其他重要节点的数量。在虚假信息传播的背景下,PageRank能够有效识别那些在传播网络中拥有“权威”的节点,这些节点可能会成为虚假信息传播的“源头”或“加速器”。表示为:
(4)
其中,
是节点
的PageRank值;
是网络中的节点总数;
是阻尼因子(通常取值为0.85);
是节点
的邻居节点集合;
是节点
的度数。
Table 1. Calculation of central index
表1. 中心指标计算
指标 |
公式 |
传播意义 |
度中心性 |
|
直接影响力 |
中介中心性 |
|
信息桥梁作用 |
特征向量中心性 |
|
全局影响力 |
PageRank |
|
持续传播力 |
3.3. 关键节点识别算法
在社交媒体环境下,虚假信息的传播通常会在网络中的一些关键节点之间扩散。这些关键节点——通常是信息传播的枢纽节点或超级传播者——对虚假信息的传播有着重要影响。通过社会网络分析(SNA)的中心性指标得分,提供了一种综合的关键节点排名算法。这个算法的核心思想是:通过结合网络中心多指标得分结合,来识别那些在网络结构中占据关键位置的节点。
3.3.1. 网络中心性得分
SNA模块通过度中心性、中介中心性、特征向量中心性等指标,评估节点在传播网络中的影响力。这些指标经过归一化处理后,通过加权融合得到一个综合网络中心性得分,节点的中心性得分越高,意味着其在信息传播网络中可能具有更大的影响力,虚假信息的传播源或者关键传播点可能性越大。
3.3.2. 关键节点排序算法
该方法依托社交网络分析中常用的中心性指标,认为节点在传播网络中的结构地位决定了其信息扩散能力。本文选取了度中心性、中介中心性、特征向量中心性和PageRank四个指标,对各指标进行归一化处理后采用加权融合的方式得到节点综合得分。具体实现流程如下:首先,从构建好的传播网络中计算每个节点的各项中心性指标;然后,利用公式
(5)
其中,
是节点
的最终得分;
、
、
、
网络中心性的四个指标得分,利用准确率、精确率、召回率、F1-score评估关键节点节点准确率,网络搜索优化进行权重确定;识别关键节点。
虚假信息的传播尤其是突发事件下的信息传播通常依赖于一些关键节点,这些节点不仅是信息的传播源,而且在社交网络中占据着举足轻重的地位。通过SNA的网络中心性得分,能够识别出在虚假信息传播中扮演核心角色的节点。对这些节点进行治理(如信息屏蔽、账号限制、内容审查等)将极大地减少虚假信息的传播范围和速度。因此,关键节点治理策略能够有效遏制虚假信息的扩散,从源头上减少危害。
虚假信息的传播尤其是突发事件下的信息传播通常依赖于一些关键节点,这些节点不仅是信息的传播源,而且在社交网络中占据着举足轻重的地位。通过SNA的网络中心性得分,能够识别出在虚假信息传播中扮演核心角色的节点。对这些节点进行治理(如信息屏蔽、账号限制、内容审查等)将极大地减少虚假信息的传播范围和速度。因此,关键节点治理策略能够有效遏制虚假信息的扩散,从源头上减少危害。
4. 实验
4.1. 数据集可视图
运用Gephi软件将从微博中爬取关于“俄亥俄州列车脱轨”突发公共卫生事件2023年2月14日~2023年3月17日关于涉及供应链危机的事件的用户社交网络进行了可视化展示,数据中主要包括文本内容,和用户相关信息,文本内容是指用户发布的帖子;用户相关信息是指用户的粉丝数、发布帖子的总数、以及用户认证类型。如图2所示,从左至右下分别为所有用户之间的社交网络图、发布真实信息、发布虚假信息的社交网络图。(图2(c))呈现显著的无标度特性,少数核心节点承载了大多数的转发量,符合“超级传播者”主导的传播模式。真实信息网络(图2(b))结构更分散,核心节点影响力较弱。从而说明该数据集构建社交网络对识别虚假传播过程中的关键节点研究提供一个可行性渠道。
Figure 2. User social network diagram, (a) Social network graph of all users; (b) Social network graph of real news users; (c) Social network graph of fake news users
图2. 用户社交网络图,(a) 所有用户社交网络图;(b) 真实信息用户社交网络图;(c) 虚假信息用户社交网络图
4.2. 评估指标
选取准确率、精确率、召回率、F1-score作为评价指标。TP (True Positive)表示被模型正确识别为虚假信息的样本数,FN (False Negative)表示被模型误判为真新闻但实际上是虚假信息的样本数,FP (False Positive)表示被模型误判为虚假信息但实际上是真实新闻的样本数,TN (True Negative)表示被模型正确检测为真实新闻的真实新闻样本数。准确率、精确率、召回率、F1-score可通过以下公式计算:
(6)
(7)
(8)
(9)
4.3. 关键节点识别对比结果与关键节点特征深入分析
本小节介绍了识别模型比较实验结果,直接评估比较了模型与所有关键节点识别基线的性能。并深入分析了关键节点在传播虚假信息表现的特征。
4.3.1. 整体性能比较
结合真实的前50个传播虚假信息的关键节点,进行权重确定以及关键节点识别准确率的评估。这里的关键节点是指微博上发布该事件有较多转发用户的用户被称作为关键节点。
在实验验证中,网络搜索优化过程聚焦于社交网络权重调节四个指标权重调节,搜索出最优化的指标权重,结合评估指标评估前50的节点准确率。
实验结果表明,当只通过社交网络进行关键节点识别时,首先对权重均衡分配时:
,
,
,
,F1值为0.61,反映真实场景中单一方法局限性。根据社交网络四个指标的特性:度中心性在真实社交网络中大部分节点度数较低,少数中心节点突出的特性,权重分配[0.25~0.45];中介中心性生成更多中等值,反映桥梁节点的存在,权重分配[0.15~0.3];特征向量中心性模拟与邻居节点质量的平衡,权重分配[0.15~0.25];PageRank偏向低值,模拟网页排名中的长尾效应,权重分配[0.1~0.2],步长为0.05。通过熵权法得到权值如表2所示,
,
,
,
时,F1值0.78为最高。
Table 2. Comparison of weights and performance of four social network indicators
表2. 社交网络四个指标权重及性能比较
|
|
|
|
准确率 |
精确率 |
召回率 |
F1-score |
0.35 |
0.25 |
0.2 |
0.2 |
0.76 |
0.72 |
0.81 |
0.78 |
0.25 |
0.25 |
0.25 |
0.25 |
0.63 |
0.65 |
0.58 |
0.61 |
0.4 |
0.25 |
0.2 |
0.15 |
0.74 |
0.70 |
0.79 |
0.76 |
0.3 |
0.3 |
0.2 |
0.2 |
0.73 |
0.68 |
0.76 |
0.72 |
0.25 |
0.35 |
0.2 |
0.2 |
0.69 |
0.66 |
0.72 |
0.67 |
4.3.2. 关键节点影响力的特征分析
Figure 3. Emotional feature diagram of key nodes
图3. 关键节点情感特征图
在上一节中通过社交网络特征的计算值识别出传播虚假信息的关键节点。本节内容情感、用户信息以及社交网络结构多个方面对关键节点进一步分析。本节从情感、用户信息来进行分析,如图3展示了关键节点所发布的文本内容所具备的情感特征分布情况;从图3(a)中可以看出关键节点所发布的内容消极情绪化的特征:这些负面情绪(如恐慌、焦虑)都能迅速激发受众的情绪共鸣,成为推动信息扩散的重要驱动力。这也是虚假信息所具备重要特征,这样的情感特征表明,虚假信息往往借助煽动性言辞或情绪化内容来制造社会恐慌或不信任,从而放大其传播效应。
Figure 4. News feature diagram of key node user
图4. 关键节点用户信息特征图
其次,在用户认证情况的分析中,图3(b)中清晰地反映出认证用户与非认证用户在关键节点中的比例分布。认证用户且为个人认证的用户是虚假信息传播的主体,他们往往具备较好的信用,在社交网络中处于信息流动的枢纽位置。图中数据说明,这类用户在网络中占据较大比重,说明在虚假信息的传播过程中,个人认证和可信度成为影响信息扩散的重要因素。再者,通过图4中通过对粉丝数、关注数以及微博发布总量的统计分析,揭示了一个显著现象:那些拥有庞大粉丝基础且互动频次较高的关键节点,其发布的内容更容易引起广泛转发,从而在整个传播网络中形成较高的中心性。粉丝数分布图和微博总数对比图进一步佐证了这一点,即活跃度高和粉丝数量多的用户往往具备更强的信息辐射能力,他们不仅是信息的接收者,更是扩散者,在虚假信息治理中扮演“超级传播者”的角色。
4.3.3. 关键节点的传播路径分析
Figure 5. Distribution of key nodes in social networks
图5. 社交网络中关键节点分布情况
上一节对关键节点的内容情感、信息特征进行了分析,这类用户一般发布虚假信息具备情感偏向性来引起用户情感共鸣;同时他们在信用度和是否认证以及粉丝数和发布的微博总数等方面都具备很大的可信度,所以佐证了这些节点是传播过程中的关键节点。本节进一步从传播路径的角度对关键节点进行剖析。图5中(a)部分展示了虚假信息传播网络中关键节点的分布位置,这些节点多数位于网络的核心区域,起到了联结各个子网络的桥梁作用。
图5(b)中进一步通过网络结构分析显示,关键节点之间存在紧密的相互联系,这种联系不仅反映了关键节点之间存在高频互动,也揭示出信息在传播过程中会在这些节点间循环放大,形成明显的集群效应。换句话说,当虚假信息进入这些核心节点后,便会通过密集的节点间连接迅速在各个社交群体中扩散开来。最后,图5(c)部分的关键传播路径图则通过对网络中关键节点间的传播路径进行分析,精准定位了那些对整个网络信息流起到“瓶颈”作用的通道。这些通道往往是连接不同局部群体的关键节点所在,一旦被激活,能够使虚假信息在极短时间内突破地域和群体的界限,形成跨群体传播效应。
本节从网络结构和传播路径角度对关键节点进行深度剖析。此部分展示了关键节点在整个社交网络中所处的核心位置及其相互之间的紧密连接情况,揭示了信息在网络中通过这些节点多路径、多层次地扩散的特点。具体来说,关键节点之间频繁的信息交换和高连接强度表明,虚假信息一旦进入这些核心区域,就能通过连续的再激活机制迅速扩散,形成明显的集群效应;而通过对关键节点的主要传播路径识别,进一步定位出那些充当“桥梁”作用的核心传播通道,这为后续精准干预提供了数据支撑。
5. 结论
在数字经济时代,社交媒体的虚假信息传播对消费者决策、市场竞争和平台信誉产生深远影响。本文构建了一种基于多指标融合的关键节点识别模型,精准定位虚假信息的关键传播者,并揭示其情感特征、用户属性及传播规律。研究发现,虚假信息主要通过高粉丝量、高活跃度的“超级传播者”扩散,并在夜间及事件发生初期集中传播,误导消费者决策,扰乱市场公平竞争。
针对这些问题,本文提出以下治理建议:利用度中心性、中介中心性、特征向量中心性和PageRank算法,结合熵权法动态优化权重,精准识别虚假信息传播的关键节点(超级传播者)。通过算法调控降低虚假内容的曝光率。鼓励用户举报虚假信息,对举报者给予信用加分或实物奖励。开发便捷的举报入口和反馈系统,确保用户举报能在24小时内得到处理,并向举报者反馈处理结果。
本研究不仅为平台的虚假信息治理提供了理论支持,也为优化消费者体验、维护市场公平提出了实践建议。未来可进一步探索跨平台虚假信息传播规律,借助AI技术构建更完善的信息治理体系,以促进数字经济环境的健康发展。