基于非线性多项式拟合函数的意大利新冠疫情新增病例的分析
Empirical Study on New Cases of COVID-19 in Italy Based on Nonlinear Polynomial Fitting Function
摘要: 基于非线性多项式拟合函数,以意大利为例,使用Python对数据进行非线性多项式拟合函数估计,对该国新冠疫情新增病例进行分析。利用2月23日至4月16日意大利的新冠疫情的历史数据,选取具有代表性的数据,通过对使用非线性多项式拟合函数进行之后十天的趋势分析,对比重合程度最高的模型,从而构建了对意大利新冠疫情新增病例预测的最佳函数,进而通过该函数对意大利未来5天的趋势进行分析。结果显示,幂函数的拟合程度最高,更加贴近于实际数值,故选其作为最终的预测结果,并结合意大利国家目前防疫工作的进度和国家情况,提出可行和科学的防疫措施和政策。
Abstract: Based on the ring nonlinear polynomial fitting function, taking Italy as an example, Python is used to estimate the nonlinear polynomial fitting function of the data and analyze the new cases of the COVID-19 in this country. Using the historical data of Italy’s COVID-19 from February 23 to April 16, this paper selects representative data, analyzes the trend of the next ten days by using the non-linear polynomial fitting function, and compares the model with the highest degree of coinci-dence, so as to build the best function for predicting the new cases of Italy’s COVID-19, and then uses the function to predict the trend of Italy’s next 5 days potential analysis. The results show that the power function has the highest fitting degree and is more close to the actual value, so it is selected as the final prediction result, and combined with the progress and national situation of the current epidemic prevention work in Italy, feasible and scientific epidemic prevention measures and poli-cies are proposed.
文章引用:王安娜, 唐子惠, 黄家兴, 阎虎勤. 基于非线性多项式拟合函数的意大利新冠疫情新增病例的分析[J]. 数据挖掘, 2020, 10(3): 183-191. https://doi.org/10.12677/HJDM.2020.103019

1. 引言及文献综述

多年来,传染病一直是世界各国医疗卫生系统面临的重大考验。目前世界主要传染病共有64种,涉及82个国家和地区。除人们熟知的流感外,麻疹和登革热涉及国家和地区均超过20个 [1]。2019年底爆发的被命名为COVID-19的新型冠状病毒肺炎在世界多国相继出现。随着新冠疫情的快速蔓延,各个国家的疫情都有不同程度的恶化,尽管各个国家都开始注重对于疫情的防护和治理,但其疫情还未得到有效的控制,各个国家的疑似病例,新增病例的增长趋势也逐步成为研究者讨论的热点。意大利位于欧洲,由于其前期防护并不十分有效,导致其成为欧洲疫情最严重的国家。对于未来疫情趋势的预测能够为国家是否加强防护或者增派更多的资源来弥补损失的决策提供十分关键的信息。因此,需要采取更多合理的方式来对意大利国家疫情的未来走势进行合理的预测。

在对于之前的非典疫情的研究中,陈奇志将随机房室模型应用于非典型肺炎的预测,对模型中的参数用两种方法进行估计,进而可得到新增确诊人数的预测,文章还对北京和香港两地参数变化进行了对比分析,为了解疫情的变化、评价干预措施的效果提供了有价值的参考 [2]。而此次疫情爆发以来,多项研究基于传染病动力学模型和相关数据对疫情发展进行分析,解读我国不同地区的疫情趋势并提出疫情防控的相关建议 [3] [4]。此外,Zhan等利用中国城市的COVID-19数据建立病毒传播谱,对意大利及韩国等城市疫情发展进行评估 [5]。还有Zheng等利用状态转移矩阵模型分析了韩国和意大利的疫情发展 [6]。

本文则是基于建立多种非线性多项式拟合模型,利用2月23日至4月16日意大利的新冠疫情的历史数据,对之后十天的疫情情况进行预测,对比选取重合程度最高的模型,构建对意大利新冠疫情新增病例预测的最佳函数。

2. 意大利新冠疫情现状

2.1. 新冠疫情病例数据统计

根据意大利民事保护部门公布的最新数据,截至当地时间4月16日18时,意大利现有新冠肺炎死亡病例22,170例,治愈40,164例,累计确诊病例168,941例,较4月15日18时意大利累计确诊病例增加3786例,死亡病例增加525例,治愈病例增加2072例。现有患者中,76,778人在居家隔离,26,893人在医院接受普通治疗,2936人在重症监护室接受治疗。

2.2. 意大利抗疫方法

刘波在意大利疫情数字的背后中提到首长负责制,意大利成立以总理为核心主体和决策中枢的危机管理权力机构。意大利一直比较重视对突发公共事件的应对工作。意大利在发现第一例病例之前,就已开始相关准备,政府成立了跨部门工作小组,统筹防疫措施。随着疫情蔓延发展,成立总理为核心的快速反应小组,逐步升级防控举措,从“封城”到“封国”。此外,意大利执法部门和军队人员也参与防控工作,主要负责人员流动管控。

采取封城举措。不同于中国武汉等城市“封城”的严格管理,意大利封城较为灵活,更多的目的是的减少聚集,减少大型活动,避免人员的区域性流动。公共交通、银行、邮局这样的基础公共服务还继续运营。米兰、威尼斯等地市民只要带上自己签名的承诺书,保证自己有充分理由出门在外,依然可以在城里自由活动。

向中国寻求帮助。意大利面临医疗物资和设备短缺的困难,希望中方帮助解决燃眉之急,中国向意大利紧急派出医疗小组协助抗疫,加大医疗物资的出口,同时中国同意大利的友好省市和一些企业也将向意方提供支持和帮助。

媒体和社会力量积极介入,协同建立社会公共安全联动工作机制。疫情暴发以来,整体上政府与媒体良性互动,信息公开透明。在疫情初期,意大利举行记者招待会,第一时间公开疫情情况,杜绝社会上的猜测和不良传闻。意大利国内主要媒体《晚邮报》、《共和报》等开辟专栏,及时报道疫情情况。同时,意大利的奢侈品牌也停止奢侈品生产线,全力加工口罩、消毒液、洗手液等抗疫物资,为抗击疫情提供强有力的后援力量。

2.3. 目前形势

意大利的疫情防控形势十分复杂,一线医护人员非常缺乏口罩等防护物资,医疗设备特别是ICU仪器,缺口也很大。为防止疫情进一步蔓延,意大利3月10日起进入全国“封城”状态,并从3月12日起关闭全国除食品店和药店以外的所有商铺,从3月21日起关闭所有公园和其他公共场所,但公共交通、物流、邮局、银行和食品生产行业维持正常营业和运转,以保证对公众的基本生活服务。但在庞大的感染基数下,意大利的新增感染人数仍在增加,意大利总理孔特表示将抗击疫情的封锁措施延长至5月3日。

老年人对新冠病毒的抵抗力弱于青年人,而意大利的老龄化程度在全球仅次于日本,是欧洲“最年老”的国家——超过23%的居民在65岁以上。截止到2月29日,意大利新冠病毒感染者中,50岁以上的老人占73.1%。这其中又有一半在70岁以上。老龄化的人口结构造成意大利感染人数持续攀升。

据中国红十字会专家杨汇川介绍,意大利基层卫生医疗体系比较健全,特别是家庭医生和家庭护理体系发展较为成熟,但由于目前对轻症病人以及密切接触者主要采取居家隔离的应对措施,导致大量病患得不到及时有效救治。然而在这样紧张的抗疫之下,仍有不少意大利人没有放弃社交,每天外出聚餐、运动,他们甚至不愿意佩戴口罩,因为在意大利,只有真正得病的人才佩戴口罩。

3. 数据来源及研究方法

3.1. 数据来源

文中所使用数据从2020年2月23日~4月16日世界卫生组织官网公布的新冠状病毒疫情相关报告查询获得。数据资料显示,自2020年2月23日起意大利新冠状病毒确诊病例数量和死亡病例数量都呈不断上升趋势,其中累计确诊病例数上升显著;每日新增病例数在3月21日前呈直线上升趋势,并于此日达到最大值,而后呈现波动状态,但是整体为下降趋势;每日新增死亡数在3月28日前呈波动上升趋势,并于此日达到最大值,而后与新增病例数的变化趋势类似,整体呈下降趋势(见表1)。

Table 1. Statistics of COVID19 in Italy from 23 February to 16 April 2020

表1. 2020年2.23~4.16意大利新冠疫情统计数据

3.2. 研究方法

本文基于随着时间变化,对意大利疫情发展情况进行基础的非线性关系研究,并作出预测。本文主要对每日新增病例数建立幂函数、指数函数、对数函数等曲线研究模型,其计量模型分别为:

ln Y = β 0 + β 1 ln x + β 2 ( ln x ) 2 + β 3 ( ln x ) 3 + β 4 ( ln x ) 4 + β 5 ( ln x ) 5 + β 6 ( ln x ) 6 + β 7 ( ln x ) 7 (1)

ln Y = β 0 + β 1 x + β 2 x 2 + β 3 x 3 (2)

Y = β 0 + β 1 ln x + β 2 ( ln x ) 2 + β 3 ( ln x ) 3 + β 4 ( ln x ) 4 + β 5 ( ln x ) 5 + β 6 ( ln x ) 6 + β 7 ( ln x ) 7 (3)

Y代表意大利每日新增病例数,x是统计数据的日期序列,β0、β1、β2、β3、β4、β5、β6、β7为函数的各项参数。

本文对累计确诊病例数建立增长函数研究模型,其计量模型为:

ln Y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + β 5 x 5 + β 6 x 6 + β 7 x 7 + β 8 x 8 + β 9 x 9 (4)

Y代表意大利累计确诊病例数,x是统计数据的日期序列,β0、β1、β2、β3、β4、β5、β6、β7、β8、β9为函数的各项参数。

利用Python软件中的Numpy库和Matplotlib库对意大利2020年2月23日~4月16日每日新增病例数、累计确诊病例数与病毒扩散天数进行了数据分析、预测并绘制关系曲线,可以更直观地分析和预测意大利新冠疫情发展趋势。

4. 拟合结果与曲线分析

意大利每日新增病例数与病毒扩散天数的幂函数、指数函数、对数函数等曲线模型结果如表2所示。

Table 2. Results of curve model fitting between the number of new cases per day and the number of days of virus spread in Italy

表2. 意大利每日新增病例数与病毒扩散天数的曲线模型拟合结果

4.1. 每日新增病例数与病毒扩散天数的拟合曲线

表2可以看出,在意大利每日新增病例数与病毒扩散天数的三种拟合方程中,幂函数曲线模型的R2值最大为0.9803,非常接近1,说明幂函数曲线模型在此次拟合中拟合结果比较理想。因此,将幂函数曲线模型定为此次意大利每日新增病例数与病毒扩散天数最终的回归方程:

ln Y = 4.214 + 1.235 ln x 8.065 ( ln x ) 2 + 13.93 ( ln x ) 3 10.34 ( ln x ) 4 + 3.883 ( ln x ) 5 0.7161 ( ln x ) 6 + 0.05122 ( ln x ) 7 (5)

从可决系数可以看出,拟合效果较好。幂函数拟合曲线图形如图1所示。现阶段已处在拐点右侧,说明随着意大利政府及人民的重视,累计确诊病例数虽然还在增加,但是增长速度已经在逐渐放缓中,每日新增病例数在未来很可能会持续下降。

Figure 1. The power function curve model of the number of new cases and the number of virus diffusion days in Italy

图1. 意大利每日新增病例数与病毒扩散天数的幂函数曲线模型拟合图形

4.2. 累计确诊病例数与病毒扩散天数的拟合曲线

意大利累计确诊病例数与病毒扩散天数的增长函数拟合方程中,R2值为0.9998,说明增长函数曲线模型在此次拟合中拟合结果很理想。此次意大利累计确诊病例数与病毒扩散天数最终的回归方程:

ln Y = 11.78 + 114 x 1 7662 x 2 + 1.43 e 5 x 3 1.372 e 6 x 4 + 7.583 e 6 x 5 2.437 e 7 x 6 + 4.629 e 7 x 7 4.5 e 7 x 8 + 1.71 e 7 x 9 (6)

从可决系数可以看出,拟合效果很好。增长函数拟合曲线图形如图2所示。累计确诊病例数将在近期仍持续增加,但是增长速度将逐渐放缓,与图1意大利每日新增病例数与病毒扩散天数的幂函数曲线模型拟合图形所显示的结果基本一致。

Figure 2. Figure of growth function curve model of cumulative confirmed cases and virus spread days in Italy

图2. 意大利累计确诊病例数与病毒扩散天数的增长函数曲线模型拟合图形

预测未来5天(即4月17日~4月21日)的意大利累计确诊新冠病毒病例的情况如下表3所示:

Table 3. Forecast results of the new crown outbreak in Italy from 10 April to 14 April

表3. 4.10~4.14意大利新冠疫情的预测结果

5. 结论及建议

根据几组曲线模型的拟合程度比较,意大利新冠疫情新增确诊病例与幂函数的拟合程度最高,更加贴近于实际数值,故选其作为最终的预测。结果表明,未来五天内,意大利新冠肺炎仍呈现总体上升的趋势,根据意大利目前现有的防疫措施和国家目前的情况,提出以下建议:

首先,意大利的疫情发展到现在的阶段与其前期的防控不到位有着密切的关系,尽管意大利为全球老龄化程度第二高的国家,但相比起老龄化程度相近的德国和日本,意大利的死亡率高得离奇。事实上,高死亡率显示出意大利医疗体系濒临崩溃的现实处境。一篇发表于纽约时报的文章中描述道:“医生被迫采取不可思议的方式分配护理资源,必须选择治疗谁、放弃谁。换言之,他们必须选择让谁死。”因此,意大利需要加强社会的管控,提高政府的执行力,另外还要加强物资的分配,合理地分配护理资源。

其次,五分之一的意大利人没有医疗保险,不断紧缩的资金导致意大利没有统一的医疗保险体系,这样使得医疗费成为庞大的负担,因此意大利应当为公共卫生增加资金支持与帮扶来增强治疗患者的能力。

参考文献

[1] 韩辉, 伍波, 宋亚京, 等. 2019年12月全球传染病疫情概要[J]. 疾病监测, 2020, 35(1): 3-5.
[2] 陈奇志. 随机模型在非典型肺炎预测及疫情分析中的应用[J]. 北京大学学报:医学版, 2003, 35(z1): 75-80.
[3] 李承倬, 武文韬, 潘振宇, 邓玉皎, 李筱, 代志军, 吕军. 基于SIR模型和基本再生数的浙江省新型冠状病毒肺炎防控效果分析[J]. 浙江医学, 2020, 42(4): 311-314.
[4] 杨雨琦, 孙琦, 王悦欣, 严雪凌, 乐涛. 重庆市新型冠状病毒肺炎(NCP)疫情分析与趋势预测[J]. 重庆师范大学学报(自然科学版), 2020, 37(1): 135-140.
[5] Zhan, C., Tse, C.K., et al. (2020) Prediction of COVID-19 Spreading Profiles in South Korea, Italy and Iran by Data-Driven Coding.
https://www.medrxiv.org/content/10.1101/2020.03.08.20032847v1
[6] Zheng, Z., Wu, K., Yao, Z., et al. (2020) The Prediction for Development of COVID-19 in Global Major Epidemic Areas through Epidemical Trends in China by Utilizing State Transition Matrix Model.
https://www.medrxiv.org/content/10.1101/2020.03.10.20033670v1