1. 引言
随着全球命运共同体的构建,世界各国在享受着经济发展、交通通讯等带来便利的同时,也共同面临着日渐严峻的生存挑战。除水资源短缺、粮食安全和气候变暖等问题之外,传染病也对人类的生命安全和社会发展构成严重的威胁。2019年12月底,湖北省武汉市爆发了新型冠状病毒肺炎(简称“新冠肺炎”,由世界卫生组织命名为Corona virus disease 2019, COVID-19)疫情 [1]。当时正值春运时期,大规模的人口流动使该病毒在短时期内迅速蔓延至我国其他省份和周边国家 [2],在世界范围内形成了多点爆发、快速传播的态势。由于新冠肺炎具有潜伏期较长、传染性极强以及人群普遍易感的特点 [3],世界卫生组织于2020年3月11日正式将其确认为全球大流行。当新发传染病的爆发初期,由于没有及时有效的疫苗或确切的治愈手段来治疗和预防该疾病,只能通过采取干预措施来进行防控。为及时遏制疫情的蔓延,中国在全国范围内采取了积极的防控措施,疫情得到良好控制,但在其他欧洲、美洲国家情况仍然不容乐观,且由于新冬季的到来疫情传播有新一轮复发的风险。因此,探索影响COVID-19传播的潜在因素,了解其传播规律,从而制定具有针对性的防控措施是目前急需解决的问题。
新冠肺炎是由最新发现的新型冠状病毒(由国际病毒分类委员会命名为Severe acute respiratory syndrome coronavirus-2, SARS-CoV-2) [4] 感染引起的急性呼吸道疾病,该病毒是一种β属的冠状病毒,感染后常见的临床症状表现为发热、干咳、疲劳、生痰、气短等急性呼吸道疾病症状 [5] [6],严重时会在肺炎的基础上快速发展成呼吸衰竭、多器官功能衰竭等病症 [7],其潜伏期大多数估计为1~14天,最常见的是5~6天 [8]。与其他冠状病毒相比,如严重急性呼吸综合征冠状病毒(SARS-CoV)和中东呼吸综合征冠状病毒(MERS-CoV),其具有更强的传染性 [9]。根据世界卫生组织(WHO)的报告,SARS-CoV-2主要传播途径是飞沫传播和密切接触传播,以及气溶胶传播,与SARS-CoV的传播途径基本相同。既往研究表明,冠状病毒的传播可能受到多种因素的影响 [10],包括气候条件、人口密度和医疗质量 [11],其中气候条件可能是影响病毒活性和传播的有效因素 [12] [13]。
大量学者针对气候条件对COVID-19传播的影响进行了研究。气温、湿度和风速等气象因素被认为是影响COVID-19传播的关键因素。Zhu和Xie (2020) [14] 分析了中国气温与COVID-19感染的相关性,认为气温低于3℃时,平均气温与COVID-19病例数呈线性正相关。Tosepu等(2020) [15] 研究了天气与印尼COVID-19大流行之间的关联,发现平均气温(℃)与COVID-19大流行存在相关性。Goswami等(2020) [16] 研究表明气象因素对COVID-19的影响主要表现为日均气温和相对湿度对COVID-19发病的交互作用。Chen等(2020) [17] 分析了气象参数与COVID-19在全球范围内传播严重程度的相关性,认为风速、气温和相对湿度是有效因素。Wang等(2020) [18] 分析了气温对COVID-19传播的影响,认为气温对COVID-19的传播有显著影响。Zhu和Liu等(2020) [19] 采用Spearman相关分析,研究南美4个国家8个重灾区气象因素与日确诊病例和日有效繁殖数之间的相关关系。Ma和Zhao等(2020) [20] 应用广义可加性模型探讨中国武汉气温、湿度和气温日变化范围对COVID-19日死亡人数的影响。Wang和Jiang等(2020) [21] 利用限制三次样条函数和广义线性混合模型分析了累计确诊病例数与气温之间的关系。此外,有研究表明空气污染也会影响冠状病毒的传播,空气中细微颗粒的增加会使病毒在空气中停留的时间更长、传播的距离更远,同时Xu和Yan等(2020) [22] 利用泊松回归模型估计了空气质量指数(AQI)与确诊病例的相关性,并分析了温度和湿度与AQI交互效应对确诊病例相关性的影响。
基于以上研究,本文截取中国12个重点疫情城市2020年1月24~2月29日每日确诊病例和同期气象、空气质量数据,将降水、气压、风速等气象因素和空气质量指数(AQI)作为混杂因素,采用分布滞后非线性模型(distributed lag non-linear models, DLNM)分析气温对COVID-19疫情传播的影响。研究结果对新到来的冬季制定防控措施具有一定的指导意义。
2. 数据与方法
2.1. 研究区域
本文主要在中国4个省级直辖市和15个副省级市中选取重点疫情城市作为研究对象。直辖市是直接由中央政府所管辖的省级城市,副省级市则是基本由计划单列市和省会城市组成的省辖市,日常居住人口较多,且在全国的政治、经济和文化等各方面上具有重要地位,这类城市具有一定的研究意义。根据各城市截至2020年2月29日的累计确诊人数,选取了12个重点疫情城市(累计确诊病例超过100例),各城市的累计确诊病例及地理分布如图1所示。同时,为方便后续讨论,我们按照中国地理区域划分将12个城市划分为7大区域,划分如表1所示。

Figure 1. Geographical distribution of cumulative confirmed COVID-19 cases in 19 provincial and sub provincial cities in China
图1. 中国19个省级、副省级城市COVID-19累计确诊病例的地理分布

Table 1. Geographical division of 12 cities
表1. 12个城市的地理区域划分
2.2. 数据来源
2.2.1. 疫情数据
主要来自于中国国家卫生委员会(CNHC,http://www.nhc.gov.cn/)和Wu, Hu等(2020)在R中开发的nCoV2019包 [23]。由于从2020年1月23日开始,中国政府开始采取严格的防控措施,武汉市开始“封城”,其他各省市也相继启动突发公共卫生事件I级应急响应,全国基本处于相同的防控力度下。直至3月初,该阶段疫情基本得到控制,确诊病例增幅基本停止,企业和学校开始复工复学,人员流动开始增大。因此,本研究截取北京、天津、上海等12个城市2020年1月24日~2月29日新冠肺炎每日累计、新增确诊病例的时间序列数据。
2.2.2. 气象数据
主要从中国气象数据服务中心(http://data.cma.cn/en)和气象数据网站(https://www.aqistudy.cn/)中获取。其中包含各个城市2020年1月24日~2月29日期间每日均气温、最高气温、最低气温、气压、风速、降水,空气质量指数(AQI)等气象指标的时间序列数据。
2.3. 研究方法
本文首先利用spearman相关分析方法对所有气象因素和空气质量指标之间的相关性进行检验,同时为避免共线性,对气象因素和空气质量指标进行筛选;其次考虑气温对COVID-19传播的影响具有非线性与滞后性,采用DLNM模型来拟合气温与每日新增确诊病例的关系。
相对于各城市的总人口来说,COVID-19每日新增确诊病例被定义为一个小概率事件,其分布可以近似服从广义泊松分布,同时为了避免数据的过度离散问题,本研究采用泊松函数作为连接函数,以广义加性模型(GAM)为核心模型,应用分布滞后非线性模型(DLNM)对时间序列数据进行分析,估计气温对COVID-19传播的影响及其滞后效应。因此,本文构建模型如下:
(1)
其中
是COVID-19第t日新增确诊人数,
是截距项,
为气温,
为DLNM模型产生的二维交叉基矩阵的函数,拟合气温的非线性与滞后关系,
为样条函数,df为自由度参数,
为其他混杂气象因素和AQI,
用以控制其他气象因素的混杂影响,
用以控制每日新增确诊人数的长期趋势。同时考虑到COVID-19的传染性,在模型中引入了前一天日新增确诊人数的对数变量
,
为其系数参数。
采用修正的赤池信息量准则(Modified akaike information criteria, Q-AIC)对模型进行敏感性分析,选择交叉基中的样条函数和混杂因素的自由度,确定样条函数为三次样条函数,时间趋势的自由度为7/年,降水的自由度为1,气压、风速和AQI的自由度均为3。基于COVID-19的潜伏期平均约为5天,本文将最大值滞后期设置为潜伏期的中位数5天。本文主要采用R软件提供的“dlnm”和“mgcv”软件包进行统计分析。
3. 结果
3.1. 描述性分析
截至2020年2月29日,12个城市COVID-19的累计确诊病例为51,569例(未排除减少核算病例),其中武汉市确诊48557例(94.16%),情况最为严重,是本次疫情的“震中”地区。从图1中,可以看出其余11个城市的累计确诊病例依次为:重庆市(576例),深圳市(417例),北京市(413例),广州市(346例),上海市(337例),哈尔滨市(198例),杭州市(169例),宁波市(157例),成都市(143例),天津市(136例),西安市(120例),且其地理分布主要集中在东北、华东、华南等东部地区。
对COVID-19日确诊病例、气象因素和空气质量进行时间序列分析表明,2020年1月26日至2月21日期间,所有城市均处于确诊病例数持续增长的阶段,其中武汉、深圳、重庆的波动较为明显,而2月21日之后,除武汉和北京外,其他城市基本停止增长,疫情得到了良好的缓解。在研究期间,各城市温度、气压、风速的波动情况呈现相似的趋势,极值间具有一定对应关系,但南北城市间的温度值相差较大,各城市的风速(除宁波市外)主要集中在0~20 m/s之间,气压值则无明显差异,均在1010~1040 hpa之间波动。各城市的降水量普遍较少,仅有广州、宁波等个别城市的少数几天出现少量降水,这完全符合我国冬季寒冷少雨,高温期与多雨期一致的季风气候特征。各城市空气质量指数的时空分布情况也充分体现了各城市间的地理异质性,天津、北京、哈尔滨等需要集中供暖的北方城市的空气质量指数极高,南方城市则保持较低。更加详细的情况如图2所示。


Figure 2. Temporal distribution of daily confirmed cases, meteorological factors and air quality in different cities
图2. 各城市日确诊病例、气象因素和空气质量的时序分布
3.2. 气象因素和空气质量间的相关分析
利用Spearman相关分析法检验研究期间6个气象因素和空气质量之间的相关性,相关系数矩阵如表2所示。日平均温度与其他气象因素均具有相关性,其中与日最高温度和最低温度两两之间呈现强正相关(
),与降水呈显著正相关,与气压和风速呈负相关。空气质量指数则与6个气象变量均呈负相关。为避免高度共线性,本文将日最高温度和最低温度剔除,主要采用日均气温研究气温与COVID-19日确诊病例数之间的关系,同时将其他气象因素和AQI以混杂因素纳入DLNM模型中考虑。

Table 2. Spearman correlation coefficient between meteorological factors and air quality
表2. 气象因素和空气质量间Spearman相关系数
注:*p < 0.0.5。
3.3. 分布滞后非线性模型结果分析
3.3.1. 气温对新冠肺炎疫情传播的影响
基于既往研究,气温是影响传染病流行和传播的关键因素之一,因此本文主要研究气温对COVID-19疫情传播的影响。以各城市COVID-19的日确诊病例数为因变量,日均气温以交叉基的形式纳入模型,选取降水、气压、风速以及AQI作为混杂因素,同时考虑长期趋势和序列相关性,构建DLNM模型并对数据进行拟合。以日均气温的中位数为参考值计算其余各点的相对危险度(RR),定量分析日均气温与COVID-19日确诊病例间的关系。各城市的日均温度在不同滞后期(0~5天)对COVID-19日确诊病例整体暴露–响应关系的三维图如图3所示,从整体上来看,各城市气温和COVID-19日确诊病例的关系均是非线性的。同时,结合图4可以更具体的分析不同的地区具有的特征。
在东北地区,日均气温和COVID-19日确诊病例之间的曲线呈“V型”,其相对风险较高的情况主要集中在日均气温处于极端值时。哈尔滨市在日均气温为−22.5℃且滞后为5天时相对风险最高(RR = 2.40, 95% CI: [0.34, 16.94]),当日均温度处于−15℃~−10℃间时,日均气温与COVID-19日确诊病例无明显关联。

Figure 3. A three-dimensional map of the relationship between the average daily temperature and the confirmed cases of COVID-19 in different cities
图3. 各城市日均气温与COVID-19日确诊病例关系的三维图

Figure 4. Contour map of the relationship between the daily mean temperature and the confirmed cases of COVID-19 in different cities
图4. 各城市日均气温与COVID-19日确诊病例关系的等高线图
在华北地区,日均气温和COVID-19日确诊病例之间的曲线呈“U型”,高温时表现为短期即时效应,随滞后时间的变化波动较大,低温时则表现出较为明显的持续性滞后效应。北京市在日均气温为5.5℃且滞后为5天时相对风险最高(RR = 2.02, 95% CI: [0.68, 6.00]),天津市在日均气温为7.5℃且滞后为0天时相对风险最高(RR = 3.63, 95% CI: [0.21, 61.76])。
在华东、华南和西南地区,日均气温和COVID-19日确诊病例之间的曲线主要呈“J型”,除成都市以外其余城市均表现出在高温时具有危害效应,在低温时则具有一定的保护效应,而成都市则相反,这可能是因为相较于其他沿海城市其气温波动范围较小且较低。华东地区相对危险度较高的日均气温主要集中在16℃~19℃间,华南地区相对危险度较高的日均气温主要集中在22~24℃间,重庆市在日均气温为15.5℃且滞后为2天时相对风险最高(RR = 1.85, 95% CI: [0.60, 5.75]),成都市在日均气温为5.5℃且滞后为0天时相对风险最高(RR = 4.63, 95% CI: [0.17, 78.4])。
在西北、华中地区,日均气温和COVID-19日确诊病例之间的曲线主要呈“倒U型”,当日均气温处于中间值且滞后时间为极值时其相对风险较高,当日均气温为极值时相对危险值均小于1。武汉市日均温度为11℃且滞后5时相对风险达到最高(RR = 1.28, 95% CI: [1.06, 1.54]),西安市在8.5℃且滞后为5天时相对风险最高(RR = 1.53, 95% CI: [0.03, 80.75])。
3.3.2. 极端效应对新冠肺炎疫情传播的影响
为了更好的讨论气温对COVID-19疫情传播的极端冷、热效应,我们选择各城市日均气温的第10百分位数和第90百分位数作为极端低温和高温。限于文章篇幅,仅在各地区选取一个城市展示结果,如表3所示。各城市在极端低温和高温对COVID-19传播的影响不同。
在极端低温条件下,华北、华中和西北、西南地区相对风险随着滞后天数的增加而先增加后下降,北京市在滞后0~4天内对COVID-19传播具有危害效应,并滞后2天时达到峰值(RR = 1.10, 95% CI: [0.86, 1.41]),武汉市和西安市仅在滞后2天时对COVID-19传播具有危害效应,在该时间点相对危险均达到峰值(RR = 1.03, 95% CI: [0.93, 1.14]; RR = 1.03, 95% CI: [0.56, 1.91]),武汉市在滞后4、5天时具有显著的保护效应(RR = 0.84, 95% CI: [0.75, 0.95]; RR = 0.70, 95% CI: [0.57, 0.86]),重庆市则在滞后第3天后开始对COVID-19传播具有危害效应,在滞后4天时达到峰值(RR = 1.08, 95% CI: [0.82, 1.42],在当天具有显著保护效(RR = 0.60, 95% CI: [0.47, 0.78]);东北和华东地区相对风险随着滞后天数的增加而先下降后增加,哈尔滨市在滞后0~5天内对COVID-19传播具有持续的危害效应,并在滞后5天时达到最高(RR = 1.84, 95% CI: [0.46, 7.34]),上海市则在滞后0~4天内对COVID-19传播具有保护效应,并在滞后1~3天时显著;在华南地区相对风险随着滞后天数的增加而增加,深圳市在滞后0~5天内对COVID-19传播具有持续的保护效应,并在滞后1、2天时显著(RR = 0.38, 95% CI: [0.21, 0.67]; RR = 0.44, 95% CI: [0.21, 0.94])。
在极端高温条件下,东北、华南和西南地区相对风险随着滞后天数的增加而先增加后下降,哈尔滨市和重庆市在滞后1~5天内对COVID-19传播均具有危害效应,哈尔滨市在滞后5天相对危险均达到峰值(RR = 1.08, 95% CI: [0.36, 3.27]),重庆市在滞后2天相对危险均达到峰值(RR = 1.41, 95% CI: [0.77, 2.60]),深圳市在滞后1~3天内对COVID-19传播均具有显著危害效应,并在滞后1天达到峰值(RR = 2.50, 95% CI: [1.16, 5.39]);华北、西北和华中地区相对风险随着滞后天数的增加而先下降后增加,北京市在滞后0~5天内对COVID-19传播具有持续的危害效应,并在滞后5天相对危险均达到峰值(RR = 2.15, 95% CI: [0.70, 6.59]),武汉市在滞后0~3内天对COVID-19传播均具有保护效应,西安市在滞后0~4天内对COVID-19传播具有保护效应。在华东地区相对风险随着滞后天数的增加而下降,上海市在滞后0~3天内对COVID-19传播具有显著危害效应。

Table 3. Different lag effects of daily temperature on extreme daily mean temperature in different cities (RR, 95% CI)
表3. 各城市在极端日均气温的不同滞后日冷热效应(RR, 95% CI)
4. 结论
在本研究中,以12个重点疫情城市为研究对象,从省级、副省级城市为尺度研究气温对中国COVID-19疫情传播的影响。同时由于涉及地理位置范围较广,按照地理区域划分依据将12个城市划分为7大区域进行分析,总结在不同地区气温与COVID-19每日确诊病例的关系。研究结果表明,各地区日均气温和COVID-19日确诊病例的关系是呈非线性的,且具有明显的滞后效应。东北地区的城市日均气温和COVID-19日确诊病例之间的曲线呈“V型”,其相对风险较高的情况主要集中在日均气温处于极端值时;华北地区的城市日均气温和COVID-19日确诊病例之间的曲线呈“U型”,高温时表现为短期即时效应,低温时则表现出较为明显的持续性滞后效应;华东、华南和西南地区的城市日均气温和COVID-19日确诊病例之间的曲线主要呈“J型”,多数表现出在高温时具有危害效应,在低温时则具有一定的保护效应;在西北、华中地区日均气温和COVID-19日确诊病例之间的曲线主要呈“倒U型”,当日均气温处于中间值且滞后时间为极值时其相对风险较高,当日均气温为极值时相对危险值均小于1。此外,处于极端气温时,各地区城市表现出不同的效应。在极端低温和高温下,东北和华北地区的城市在潜伏期内对COVID-19传播均具有持续的危害效应,可能会对增加该地区COVID-19疫情传播的风险,而华中和西北地区的城市在潜伏期内主要对COVID-19传播表现出保护效应,可能会对该地区疫情传播有一定程度的抑制作用。在极端低温下,华东、华南和西南地区的城市在潜伏期前期具有显著的保护效应,而在极端高温下,三个地区的城市主要呈现具有较为持续的危害效应。
为证明本研究结果的可靠性,与以往的研究成果进行比较。Mehmet (2020) [24] 选取土耳其9个城市为例,基于spearman相关系数探讨了天气与COVID-19之间的相关性,研究表明当天的温度的相关性最高且呈负相关,即随着温度降低,病例数量增加,但Xie和Zhu (2020) [25] 采用广义加性模型研究发现中国122个城市(包括武汉)的平均温度与COVID-19病例数呈正线性关系。这些差异可能是由采用的研究方法的不同引起的,相较于spearman相关分析和广义加性回归模型等模型和方法,分布滞后非线性被广泛应用于研究气象因素与疟疾、肺结核和腮腺炎等传染病之间的关系中,可以同时考虑时间序列中潜在的非线性和滞后性,因此本研究采用分布滞后非线性模型分析气温对COVID-19疫情传播的影响,同时将风速、降水、气压等其他气象因素和AQI以混杂因素纳入模型中考虑,其更能反映出其间真实的关系。所得结果与Zhu等(2020) [26],Zhang等(2020) [27],Shi等(2020) [28] 具有相似的结论,气温对COVID-19疫情传播的影响是非线性的且具有明显的滞后性和持续性。
本文还存在一些局限性,首先本文采用的是气象站点的平均气温,与患者真实接触的温度还存在差异,这有可能会导致结果出现偏差;其次COVID-19的传播还可能受到其他环境因素的影响,例如:人口密度、医疗条件、经济水平等,在今后的研究中有待进一步纳入模型中考虑。
综上所述,气温对COVID-19传播具有显著影响,且由于中国地域广阔、气候复杂,在不同地区表现出不同的关系特征,其关系曲线主要呈“U型”,“V型”和“J型”等。当处于极端温度时,东北和东北地区在潜伏期内具有较高的传播风险,而华中和西北地区则风险较低,但当气温处于中间值时,其相对风险达到峰值。华东、华南和西南地区的城市则需要更加关注在极端高温的情况。因此,本文研究结果具有一定的实际意义,可以更好的指导政府为新到来的冬季制定更加因地制宜的防治措施,及时阻止新一轮疫情的复发。
基金项目
本文获得贵州省数据驱动建模学习与优化创新团队项目(黔科合平台人才[2020]5016)资助。