1. 引言
传染病是一种由各种病原体引发的疾病,它能通过人与人或者人与动物进行传播感染。有些病毒除了直接传播,还可以借助各种媒介进行传播,也就是间接传播:接触传播,体液传播,气体传播,食物传播等。纵观人类历史,传染病一直存在,如何处理传染病问题一直都是重点关注的问题之一。
传染病模型是一种用于描述和预测传染病在人群中传播规律的数学模型,旨在通过数学方法分析疾病的传播机制、评估防控措施效果,并为公共卫生决策提供科学依据。通过分析传染病模型得出的数据,可以有效地对该传染病有一定的认知,更合理地分析该传染病的危害程度,以及它的未来发展变化,便于我们对此进行理性预测和做出更加迅速、有效的应对措施。
本文主要介绍了几类经典的传染病数学模型,并对模型的传播动力学进行分析。同时,将复杂网络的知识运用到经典传染病数学模型当中,在复杂网络应用下,对SIS模型进行研究,求出其传播临界值,并对其进行分析。
2. 几类经典传染病模型及其传播动力学
2.1. SI模型
SI模型[1]只有易感染状态(S)和确诊状态(I)两种状态。在此模型中,只存在S变为I的过程,即这是模拟一些无法恢复治愈的传染病的模型,如SARS病毒。SI模型的状态转变如下:
其中
是指感染率,即SI模型中,易感染状态下的个体S在没有任何保护措施情况下接触到传染病病毒,会以感染率
被转化为确诊状态。我们假设SI模型为封闭模型,即总人数不变,总人数:
和
是在
时间下的易感染人数和确诊人数,则SI模型的动力学方程如下:
可得:
由此可见,这个SI模型会一直传染下去,并随着时间所有易感染个体都会被感染确诊,即最终
。
2.2. SIS模型
在SIS模型情况下,确诊状态不再是不可治愈的,确诊状态下可在自然恢复和药物医学治疗情况下再次转化为易感染状态。SIS模型的状态转化如下:
其中
为康复率,即在SIS模型中,确诊状态下的个体会以
的概率转化为易感染状态。同样的,在人数不变的情况下,SIS模型的传染动力学方程如下所示:
我们不妨定义:
可以得到
其中
是基本再生数(basic reproduction number),它指在传染病初期,所有人都是易感染状态且在没有任何抗体和保护措施情况下,一个确诊患者在平均患病期能传染的人数。平均患者康复时间为
,也可以称为平均移出时间或者平均患病期。由上述公式可知:
可解得
如果R0 < 1
如果R0 > 1
因此可以得出,如果一个SIS模型的基本再生数
,也就是一个确诊患者在平均患病期传染的人数少于一个人,那么这个传染病会随着时间而衰亡。如果
,也就是说一个确诊患者在平均患病期能传染的人数超过一个人,那么这个传染病就会在人群里流行下去。这也是流行病产生的原因。
2.3. SIR模型
SIR模型最早是由苏格兰科学家Kermack与McKendrick在1927年提出,促进了传染动力学的发展,也逐渐成为最经典,也是最成功的传染病模型之一。目前,各国的健康卫生机构也依旧会在SIR模型的基础上,为各类新型传染病构建进阶版的SIR模型,更加符合新型传染病的特征,以便于各国组织及时有效地预防和控制新型传染病。SIR模型分为三个部分:易感染者(S),感染者(I),以及处于免疫或者死亡状态的移出者(R)。SIR模型的转化如下:
此模型对应的微分方程为:
我们可以定义
那么
其中
可得
解得:
可见,
是一个临界值。当
时,
,v会逐渐减少。当
时,v会逐渐增大,但由于u会因此减少,当减少到
时,v达到最大值,然后又会逐渐减少。显然SIR模型也是
时,传染病衰亡;
时,传染病流行。
对u求导,并令导数为0:
求得极值点:
的最大值为:
从上面关系式可以看出u − v随
变化关系,见图1。
显而易见的,曲线的峰值随着R0的增大而增大。这表明一个传染病模型的基本再生数越大,疫情传播的就越快,感染人数也会越多。
经历SARS非典型肺炎、COVID-19新冠肺炎等影响全球的疫情,现阶段对传染病的模型研究有非常大的进展。“多阶段动力学模型”将传染病传播过程划分为多个阶段,考虑不同阶段的传播动态,能够提供更具时间相关性的预测和预警信息,可以深入理解疫情的发展态势和影响因素,并评价干预措施对疫情控制的影响。“元种群模型”通过细化空间特征和人口流动模式,能够全面分析疾病传播路径,更准确地模拟疫情传播的空间分布和变化规律,特别适用于研究地理隔离和人群流动限制对疫情传播的影响。“机器学习模型”通过处理来自不同数据源的多维度数据,能够发现和利用数据中的复杂关系和模式,从而提高预测的准确性和泛化能力,在疫情爆发的早期预警和趋势预测中具有重要应用。
Figure 1. Plot of u − v vs. R0
图1. u − v随R0变化示意图
3. 复杂网络
一个复杂网络是由多个节点和节点之间连接的边所构成的,其中每一个节点都表示不同的个体,节点之间的连边表示节点之间的连接情况。网络的内部结构可以用邻接矩阵表示,邻接矩阵A中的元素为
,
表示节点i和节点j之间有一条边,
表示其他。
3.1. 复杂网络的基本概念
(1) 平均路径长度
在复杂网络中任取两节点i和j,它们之间最短的路径中存在的连边的数量称为两者之间的距离,表示为
。我们设平均路径长度为L,则有:
其中N为系统中个体的总数,也就是节点的总个数。
(2) 节点的度
度的概念需要分无向网络和有向网络两种不同的网络分析。在无向网络中,网络节点的度指与该节点直接相连的连边数量,记为
。它与邻接矩阵的关系如下:
而在有向网络下,节点的度分为出度和入度两种。如果在网络中,有n条有向边从节点i点出发,那么n称为节点i的出度;如果有m条有向边是以节点i为终点的,那么m称为节点i的入度。那么在有向网络下,节点i的度就是入度m和出度n的总和。
(3) 度分布
网络中节点的度分布指的是网络中度为k的节点占网络中总节点的比例,记为
,它是从网络的整体角度出发来评估网络的全局性质,其表达式如下:
而在有向网络中,由于度被分为出度和入度,其度分布也被分为出度分布和入度分布,分别记为
和
。
度分布的m阶矩阵公式如下:
网络中所有节点的平均值称为网络的平均度
,其表达式如下:
网络的平均度就是度分布的一阶矩,当m = 2时,则表示节点度分布的震荡情况。网络上的信息传播过程也会受到二阶矩
的敛散性的影响。一般根据度分布的不同,我们会将网络分为均匀网络和非均匀网络。均匀网络指的是网络的度值非常均匀,像规则网络,它的任一节点的度值都完全一致。又或者像完全随机网络,它的绝大多数节点的度值都是它的平均度
,这种绝大多数都是平均度,只有极少数节点不同外的网络,也是均匀网络的一种。反之,对于网络节点的度值分布不均匀的网络称为非均匀网络。现实生活中的网络有很大一部份都是非均匀网络。
(4) 聚类系数
聚类系数反映的是节点的密集程度,记为C。网络中聚类系数
的值是实际存在的边数与节点i的度ki的所有可能的边数之比,其表达式如下:
其中
为实际存在的边数。如蓝色节点具有三个邻居,他们之间最多有三个连边。三条连边都存在,它的聚类系数为1;只有一条实际的连边,它的聚类系数只有1/3。如节点的邻居之间没有任何的连边,则它的聚类系数为0。
网络中的节点平均聚类系数表达式为:
3.2. 复杂网络中的经典网络模型
在科学家们对复杂网络长期的探究下,已经有很多的网络模型问世。每一个网络模型都有它的具体实际意义,下面介绍几个经典的网络模型。
(1) 规则网络
规则网络是均匀网络的一种,它也是复杂网络领域第一个具有实际现实应用意义的网络模型。规则网络的任意节点的度值都是完全相同的,它的连边也都遵循固定的规则。三种规则网络示意见图2。
Figure 2. Schematic diagrams of three types of regular networks
图2. 三种规则网络示意图
全局耦合网络中任意两个节点都有连边,这种网络的平均路径长度最小而聚类系数最大。最近邻耦合网络[2]中的每个节点仅与其两边最近的几个节点相连,这种网络的平均路径长度大小会随着网络中节点数的增加而增加,其聚类系数也很高。星形耦合网络中只有一个中心节点,其余节点都与中心节点相连且彼此之间没有连边。
(2) ER随机网络
ER随机网络是指由若干的节点组成,它们任意两个节点之间会以概率p进行随机连接而形成网络。由此可见,ER随机网络中,任意节点之间有连边是概率为p的随机事件。随机网络生成实例见图3。
Figure 3. Generation examples of random networks
图3. 随机网络的生成实例
(3) 小世界网络
WS小世界网络模型最早是在1998年,由Watts和Strogatz [3]基于六度分离理论提出的一个模型。WS模型是通过一个概率p移除规则网络中原有的连边,并随机连接一个新的节点,且两个不同的节点之间至多只有一条不重合的连边,以此获得一个新的网络模型,即WS模型。随着概率p的增大,原本的规则网络会逐渐变为随机网络,直到p = 1,完全变为随机网络。最近邻耦合网络示例见图4。
图中p = 0时为规则网络,p = 1时为随机网络。也不能看出,WS网络模型的平均路径长度较小且聚类系数很大。
Figure 4. Schematic diagram of the WS model
图4. WS模型示意图
(4) BA无标度网络
BA无标度网络是由Barabasi和Albert [4] [5]在1999年提出的,网络的命名就是取用两人的首字母。BA网络的构建是在一个规模为N的网络中(所有节点都相连),不断加入新的节点,新节点会与网络中已经存在的节点相连且优先和网络中度最大的节点相连,直到网络总节点数达到指定规模。此模型的规模非常大,但是其聚类系数却非常小。
(5) 社区结构网络
社区结构(Community Structure)指网络中存在紧密连接的子群,子群内部连接密度高于子群之间。其传播特征:社团内部感染率高,但跨社团传播受限;临界值与社团间连接强度成反比。社区网络典型的模型主要有3种。基于分裂的社区网络模型:通过将网络中的节点不断分裂成不同的社区来构建社区网络,如Kernighan-Lin算法、谱平分法等。基于凝聚的社区网络模型:通过将网络中的节点不断凝聚成不同的社区来构建社区网络,如Newman快速算法、堆结构的贪婪算法等。基于派系的社区网络模型:将网络中的社区看作是一些互相连通的“小的全耦合网络”的集合,这些“全耦合网络”成为“派系”。
4. 复杂网络上的传染病模型
由于现实中,传染病病毒的传播并不是基于均匀混合理论的,所以探究在不同复杂网络模型的传播动力学才能更加贴合实际,更好地预防控制传染病的传播。
4.1. 均匀网络下SIS模型的传播临界值
对于均匀网络,我们可以假设
为t时刻下感染状态的节点所占网络总节点的比值。忽略新增节点,在SIS模型下,所有的感染状态下的节点在一定时间后都会转化为易感染状态,再基于SIS模型的动力学方程,引入均匀网络,可以到以下方程:
其中,
是指网络中感染状态的节点转化为易感染节点的速率,
是指单位时间内一个感染状态的节点转化的易感染状态的节点占总节点数的比例。可以求出其处于稳态下的感染节点密度:
其中
就是传播临界值,且
不难看出,当传染率
小于临界值时,网络中感染状态的节点就会减少,并逐渐消亡,代表着病毒消失。当
接近临界值
时,感染节点密度
对
的变化非常敏感,感染节点密度会迅速减少。而当传染率大于临界值时,感染状态的节点数就会增加,并达到一个稳定的数值,从而一直存在于网络中,代表着传染病病毒会一直流行下去。若
略大于
,感染节点密度会迅速增加。
平均度
越大,临界值
越小,网络对传染病的抵抗力越强。因为较大的平均度意味着每个节点有更多的邻居,从而使得传染病更容易传播,但同时也意味着需要更高的传染率才能使传染病持续存在。
4.2. 非均匀网络下SIS模型的传播临界值
与均匀网络相比,非均匀网络的区别就在于其节点的度分布不均匀,导致它的每个节点的传染能力不同。因此,在非均匀网络的前提下研究SIS模型,我们需要对不同度值的节点进行分析研究。我们不妨设
,它是指在t时刻下,度值为k的感染状态的节点占网络总节点数的比值,我们可以得出以下非均匀网络下SIS模型的方程:
其中,
是网络中度值为k且感染状态的节点转化为易感染节点的速率,
是指在网络中度值为k的易感染状态的节点占网络总节点数的比值,
是指网络上度值为k的节点的邻居是感染状态的节点数占网络总节点数的比值。可以求出其处于稳态下的感染节点密度:
不难看出易感状态的节点感染病毒的概率受其度值的影响,度值越大,就越容易被感染。
当网络的度不相关时,由于网络是非均匀网络,它的度分布不均匀,有:
有一个解为0,而当网络中的有效传播率
大于传播阈值
时,可以解出方程的另一个非零解为:
由此可以得出在非均匀网络下的SIS模型的传播阈值为:
与均匀网络类似,当
接近临界值
时,感染节点密度对
的变化非常敏感。但非均匀网络中,由于节点度分布的不均匀性,高度节点对传染病的传播起着更重要的作用。
传播阈值
与平均度
和度分布方差
有关。具体来说,
与
成正比,与
成反比。这意味着,网络的异质性越大(即
越大),传播阈值
越小,网络对传染病的抵抗力越弱。例如,在无标度网络中,由于存在少量高度节点,使得
非常大,导致传播阈值
很小,传染病很容易在这样的网络中传播。
5. 小结
本文通过SIS模型在均匀和非均匀网络下的传播动力学的研究,求得不同网络模型下的传播阈值。不同于病毒扩散式的简单传播,传播阈值是指只有当一个节点相邻的所有节点的感染率达到阈值标准,该节点才会被感染。因此,在网络模型下,并不是只要与感染节点相连就会被感染。如何控制病毒在网络中的传播,最主要的是提高整个模型的传播阈值。在SIS模型中,最直接的提高阈值的方法就是减少与感染节点的连接,对应于现实生活,就是减少与感染患者的接触。对于高度节点的防控,即是要进行隔离和社交限制,以减少高风险人群对疫情传播的影响。提高治愈率γ及间接提高传播阈值的方法也是有效的防控手段,可以通过医疗干预、增强免疫、健康宣传和信息传播等方法。