1. 引言
登革热(Dengue Fever, DF)是由登革1、2、3和4型病毒引起的传染病,主要通过伊蚊传播,广泛流行于全球热带和亚热带的100多个国家和地区,尤其是东南亚地区流行较为严重 [1] 。1949年到1977年,登革热在中国鲜有发生,仅在云南省与北京市有过登革热病例的报道。此后,在1978年,广东省佛山市发生了登革4型引起的登革热流行,1979年中山市出现了登革1型引发的登革热流行。21世纪以来,广东省几乎每年均有登革热病例的发生,并且病例数量呈现明显上升趋势 [2] 。2014年,广东省广州市爆发了十年来最重的登革热疫情,累计报告病例36,934例。
研究登革热疫情的发生、扩散,发现其时空扩散趋势是控制疫情的有效方法,也是目前登革热疫情控制研究研究重点和热点。国内外有关登革热疫情时空扩散趋势研究的方法,主要从病理学、流行病学、统计分析等角度出发进行探索。如国外Cory W. Morin [3] 等通过统计学方法分析气候对登革热病毒生态学的主要影响,并且确定气候与登革热传播之间的关联关系;国内方面张海林 [4] 等对登革热病原学、血清学和蚊媒资料进行整理分析,研究登革热的流行病学特征;而王怡东 [5] 等则从统计学角度出发,在一部分假设条件的前提下,运用偏微分方程理论对登革热的传染病模型进行研究。
本研究以2014年广州市登革热疫情发生、扩散、控制、消亡阶段的时空疫情数据为基础,采用趋势拟合方法,确定广州市中心各区县的登革热时空扩散趋势,并且采用一阶导数、二阶导数方法,确定登革热变化趋势中的变化最剧烈时间点(突变点)、爆发转折点(爆发阶段与疫情消亡阶段的交界点)。分析影响登革热发展变化的因素及登革热发展的各个阶段之间的相关关系。
2. 研究区域与数据
2.1. 研究区域概况
广州市位于22˚26'~23˚56'N,112˚57'~114˚03'E,属典型的南亚热带季风气候,温暖多雨、温差较小,年平均气温为22.8℃,平均年降水量在1800毫米左右;地势东北高、西南低,北部和东北部是山区,南部是珠三角冲击平原,是广东省政治、经济和文化中心[6] 。
研究区位于东经113˚8'42~113˚35'50,北纬23˚1'52~23˚26'6,包含了白云区、海珠区、越秀区、荔湾区、天河区、黄埔区、萝岗区共7个区县(以下简称主城区)。2014年,广东省爆发了感染登革热病例的疫情,此次疫情广州市受灾最为严重。截至2014年11月,广州市累计报告登革热病例达36,934例,其中主城区7个区县累计报告病例31,981例,占全广州市的86.6%。因此取白云区等7个区县作为分析登革热时空扩散趋势的研究对象(见图1)。
2.2. 研究数据
2.2.1. 研究区人口数据
研究区人口数据来源于广州市2014年统计年鉴,人口数据统计表如表1所示。
2.2.2. 研究区病例数据
登革热病例数据为广东省疾病预防控制中心所提供的2014年全广州市登革热病例数据,时间从2014年1月1日到2014年11月11日。从登革热数据中可以发现,广州市登革热病例主要集中在人口密度高商业发达的主城区,包括白云区、海珠区、越秀区、荔湾区、天河区、黄埔区、萝岗区等7个区县。主城区累计报告的病例占全广州市的86.6%。因此选取白云区等7个区县作为研究对象,对登革热疫情的发展变化趋势及其影响因子进行分析研究,疫情统计数据表如表2所示,将登革热病例数据进行空间化处理,生成登革热疫情分布图(见图2)。
从登革热变化趋势图中(图3)可以发现,登革热的发展变化趋势共经历了4个阶段,分别是:从1月到6月的偶然出现阶段:在该阶段中登革热病例具有出现次数稀少,相邻两个病例出现的时间间隔长,病例具有随机分布的特点;6月到7月的初期发展阶段:该阶段中每天新增登革热病例数有限,整体呈现缓慢增长趋势;7月到10月的疫情爆发阶段:该阶段中新增登革热病例开始急剧增加,疫情全面爆发;10月到12月的疫情消亡阶段:该阶段在人工的干预下,每天新增病例呈现减少,总体呈现消亡趋势。
1) 偶然出现阶段
偶然出现阶段,在指登革热病例出现次数稀少,相邻两个病例出现的时间间隔长,病例具有随机分布的特点的阶段。
2) 初期发展阶段及其开始时刻
一般认为,登革热的潜伏期为5~7天,因此本文以7天(即一周)为临界线,对登革热初期发展阶段给出如下定义:登革热初期发展阶段是指在同一区县内,在小于或者等于7天的时间内,开始连续出现登革热病例的阶段。按照该定义,对主城区等7个区县数据进行整理,可以确定登革热初期发展阶段的开始时间表及其与该区县登革热总量之间的关系(表3)。
从图4中可以发现,各区县登革热初始发展阶段的开始时间与登革热病例总量呈现明显的负相关关系,即初始发展阶段的开始时间越早,登革热爆发的严重程度越高。

Figure 2. Distribution map of DF cases
图2. 登革热疫情分布图

Figure 4. The relationship between start time of dengue development stage and DF case numbers
图4. 登革热病例总量与初期发展阶段开始时间关系图

Table 1. Population statistical table
表1. 人口统计数据表

Table 2. DF cases statistical table
表2. 疫情统计数据表

Table 3. The start time of DF development stage
表3. 登革热初期发展阶段开始时间表
3) 疫情爆发阶段及其突变时刻
登革热全面爆发阶段是指在无人工干预的前提下,受温度与降雨等气候条件的影响,登革热病例呈现快速增长的阶段。以白云区为例,从图5中可以看出,在2014年7月31号到2014年9月30号之间登革热呈现出明显的增长趋势,且在全面爆发阶段的后半阶段,病例发展变化趋势显著。
登革热发展变化的突变时刻,是指在整个登革热疫情爆发阶段中,登革热病例数量增长的加速度最大的时间节点。突变时刻,是表示登革热增长变化最为迅速的时刻。从突变时刻起,登革热疫情开始全面爆发。
4) 疫情消亡阶段及其转折点
疫情消亡阶段是指在人工干预及环境影响下,每天新增病例呈现减少,总体呈现消亡趋势的阶段。以白云区为例,从图6中可以看出,在2014年10月1号之后登革热呈现出明显的下降趋势。
转折点是指登革热疫情全面爆发阶段与疫情消亡阶段的接触时间点,表明登革热病例开始逐步减少。
3. 研究方法
3.1. 研究方法流程图
研究方法流程图,如图7所示。
3.2. 趋势拟合
拟合是逼近数据的基本方法,其中最常用的是最小二乘法拟合。最小二乘法的基本思想是对一组给定的数据
,设计和确定一个函数模型,即
,使得函数
在某种误差函数标准下与左右数据点
之间的距离最近,即寻求一个最佳拟合函数。最小误差原则保证了
和
之间距离的平方和最小 [7] 。
登革热的变化趋势是非线性,因此本文利用最小二乘法,采用多项式拟合来确定登革热的变化趋势。随着拟合多项式次数的增大,
会迅速减小,当多项式次数减小到第
次时,
的变化量趋于稳定,则此时确定
次多项式为登革热的最佳拟合曲线,如图8所示。
3.3. 一阶导数
一阶导数,是表征函数变化率的数学量。在几何上,可以用来表示一条连续变化的曲线在某一点上切线的斜率。
设函数
在点
的某个邻域内有定义,当自变量
在
处取得增量
(点
仍在该邻域内)时,相应的函数取得增量
;如果
与
之比当
时的极限存在,则称函数
在点
处可导,并称这个极限为函数
在点
处的导数,记为
[8] ,即

3.4. 二阶导数
二阶导数,是原函数导数的导数,即对原函数进行二次求导,它描述的是切线斜率变化的速度,表示一阶导数的变化率 [9] 。
在物理学上,速度
是位置函数
表示对时间
的一阶导数,即
或
;
则加速度可表示为:
或
;

Figure 5. Trend chart of epidemic stage
图5. 疫情爆发阶段趋势图
3.5. Spearman相关检验
Spearman相关从两个变量之间的同步性来检验变量之间的相关性,对于
对观察数据
,按照每个变量的
个数据的大小次数,分别由小到大编上等级(秩),对于重复数据则取平均等级,再检验两个变量的等级或秩之间的相关性。其结果在
之间,相关系数
为正,则表示正相关;
为负,则表示负相关;
为零,则表示零相关。其公式定义如下 [10] [11] :

上式中:
为相关系数,
为样本量,
为变量
的秩次,
为变量
的秩次。
4. 结果
利用趋势拟合方法确定白云区等7个区县的登革热变化趋势变化曲线,并采用一阶导数、二阶导数方法,确定登革热疫情变化的临界点,分析整理结果如登革热疫情变化时间点所示(见表4)。
对登革热变化趋势中的各个重要临界点的登革热病例数量进行整理,结果如趋势节点病例总量表所示(见表5)。
令初期发展阶段的开始时刻的时间为1,对突变时刻及转折时刻的日期作数量化(如:白云区的初始阶段开始时刻为2014/7/9,则白云区疫情爆发阶段突变时刻经过数量化后为:2014/9/12~2014/7/9 + 1 = 66。即白云区从初始发展阶段开始时刻起,到达疫情爆发阶段突变时刻,共需经历66天)。分析登革热病例总量与变化趋势结点以及影响因素的关系(见表6)。
为进一步探究登革热发展趋势中的重要临界点之间的关系以及人口因素对登革热发展变化的影响,采用Spearman相关性分析方法进行研究,确定它们之间的相关关系,分析结果如Spearman相关关系表所示(见表7)。
为确定登革热发展变化的各个重要临界点及其数量之间的关系,以及人口因素对登革热发展变化趋势的影响,采用折线图方法,对结果进行直观展示。结果如趋势节点及其数量相关关系图(见图9)、人口与趋势节点及其数量关系图(见图10)所示。
5. 讨论
5.1. 登革热生命周期规律
研究结果表明,白云区等7个区县的登革热发展共经历了4个阶段,分别是:1~6月的偶然出现阶
表4. 登革热疫情变化时间点

Table 5. Total case of trend node time
表5. 各个时间点的病例总量

Table 6. The relationship between DF cases and critical factors
表6. 登革热病例总量与各影响因子之间的关系
段;6~7月的初期发展阶段;7~10月的疫情爆发阶段;10月以后的疫情消亡阶段。该结论与毛祥华 [2] 对广东省登革热病例流行区间三间分布的划分一致。
广州市属于亚热带季风气候,平均年降水量在1800毫米左右,年平均气温在21.5℃~22.2℃之间。夏季高温多雨,闷热潮湿 [12] ,这给登革热的传播媒介(伊蚊)提供了良好的孽生环境,直接影响伊蚊生长繁殖及病毒在蚊体内的复制 [13] [14] 。有研究表明,在夏季气温高降雨多时,蚊虫密度会随孽生地数量增加而急剧上升,促使流行区病发率直线上升 [13] 。因此,在夏季应及时清理周边环境的中积聚的雨水,防止伊蚊的滋生。

Table 7. Spearman correlation table
表7. Spearman相关关系表

Figure 9. The relationship between DF trend node and case number
图9. 各时间节点及其数量相关关系图
5.2. 登革热的区域传播规律
研究结果表明,白云区等7个区县的登革热突变时刻均处于9月上旬,登革热疫情的转折时刻基本处在10月上旬。这与毛祥华 [2] 等广东省登革热爆发的高峰期处于8~10月保持一致。因此表明登革热的流行与爆发存在着区域效应,登革热疫情会受到周边地区登革热疫情的影响,所以在加强对登革热的防控时,应该随时考虑周边城区对本地的影响。
5.3. 登革热时空扩散规律
研究表明,登革热病例总量与传播趋势中各关键时间节点以及该节点的登革热病例数量呈现明显的正相关关系。从表5、表6以及图9中可以发现,登革热病例总量与初期发展阶段开始时刻数量、突变

Figure 10.The relationship between population and DF trend nodes
图10.人口与各时间节点及其数量关系图
时刻、突变时刻数量、转折时刻以及转折时刻数量均呈现出明显的正相关关系,并且其显著性均小于0.05,具备统计学意义。
由此可见,登革热的初期发展阶段开始时刻数量越大,登革热发展到达突变时刻以及转折时刻所需经历的时间就越长,但是同时登革热发展到达突变时刻以及转折时刻(峰值)时的严重程度也就越强,爆发的严重程度越大。因此在针对登革热疫情进行防控时,应该重视登革热变化趋势的前期阶段,对每个出现的登革热病例进行有效隔离,控制登革热的蔓延传播趋势。
5.4. 登革热爆发扩散影响因素
研究表明,人口总量对登革热的发展趋势具有显著的影响。从表7与图10中可以发现,地区登革热初期发展阶段的开始时刻出现的时间节点与当地的人口总量呈现明显的负相关关系,即:地区人口总量越大,则登革热初期发展阶段开始时刻会越早。
另一方面,人口数量也与登革热发展趋势中的突变时刻、转折时刻、开始时刻数量、突变时刻数量、转折时刻数量呈现大体相同的趋势。
登革热病例总量与人口的相关程度高达0.893,且具备统计学意义。表明人口密度的大小对登革热传播具备显著影响。人口密度越高,易感者也愈多,既增加了传播机会,又增加带病毒者,因此发病率也愈高[12] [15] ,因此在登革热防控过程中应当重点监控人员密集地区。
6. 结论
1) 登革热的流行发展趋势具有明显的季节性,夏季高温多雨,容易引发登革热的流行爆发;
2) 登革热的流行趋势具备明显的区域性,不同时间出现登革热病例的地区,受相邻区域的影响,会在大致相同的时间段内进入爆发高峰期;
3) 登革热的扩散规律如下:地区进入初期发展阶段的时间越早,则突变时刻以及转折时刻所需经历的时间越长,爆发的严重程度越大。
人口密度对登革热传播具有显著的影响。
*通讯作者。