1. 引言
上海是全球最大的金融中心之一,有“东方巴黎”之称,常住人口高达2400多万,人口密度高度集中,一旦爆发大规模传染疾病,疫情防控难度较大,因此封控无疑是最有效的病毒切断措施之一,但上海作为中国的经济中心和消费中心,停摆将对中国经济造成严重影响,与此同时,在全球化时代,任何国家都不能独善其身,都将受到疫情的影响。从历史经验来看,人类周期性的受到传染病的挑战,其中大流行病是最严重的情况。“新型”冠状病毒是一种人类以前从未发现的新菌株,世界卫生组织于2020年3月12日宣布COVID-19 (新型冠状病毒肺炎)疫情形成全球大流行。2022年已是新冠肺炎疫情在全球跌宕蔓延的第三个年头,新冠疫情对人类的生产生活产生重大影响。尽管我国本土COVID-19疫情已得到较好控制并实践获得丰富的经验,但由于病毒变异快,导致本次病毒的隐秘性极强,上海在2022年3月1日再次爆发疫情,使得我国未来疫情防控仍然面临较大潜在风险。因此,有必要对上海新冠肺炎新增本土病例变化展开深入研究,通过数据来分析未来疫情动向,一方面,能够研判我国各级政府面对突发性重大公共卫生事件的响应防控能力,另一方面,可以为我国未来疫情防控提供决策参考依据。
2. Markov链概述
Markov链是由俄罗斯科学家马尔可夫提出,用来描述一类重要的随机动系统或过程的模型,在企业管理、经济预测、水文气象、疾病预测等领域广泛应用。
孙桂娥利用Markov链预测了物流企业的应收账款风险,通过对应收账款回收周期来进行状态划分,建立Markov链模型,对坏账率和应收账款回收率进行了预测 [1];何冰洁建立回收处理的Markov链模型。对产品回收状态划分为7个状态,利用软件分析考察回收的效率、时间和成本,为管理者提供改善流程工艺提供了指引 [2];高发玲基于马尔科夫链对城乡人口流动状态进行了预测,为我国城镇化建设提供了重要的经验数据 [3]。
此外,Markov链预测有一个显著特点在于无后效性,无后效性指下时期状态只取决于本期状态和转移概率 [4],即要预测未来的状态,只需要知道当前的状态和概率就足够了,而不需要知道以往的情况,所以,通过Markov链预测可以利用系统现状及其发展动向去预测该系统的未来状况。基于Markov链模型的诸多优良特性,本文也将继续延续此话题,建立上海市每日新增本土病例变化的数学模型,进行定量分析,希望能为上海疫情防控提供数据参考。
3. 马尔科夫链模型的建立
构建马尔科夫链模型的目标是为了体现上海市每日新增本土病例变化的特征,即在不同的时间序列阶段中会呈现出不同的新增数量的病例变化,利用Markov链模型就是为了预测不同的时间序列阶段新增数量的病例变化。首先,需要厘清上海市每日新增本土病例变化主要取决于何种因素以及在构建模型时上海市每日新增本土病例变化所处的状态,也即初始状态。把上海市每日新增本土病例变化的时间序列看作马尔科夫链,就可以根据当前的状态对未来的状态进行预测,通过数据分析之后,进而可以采取相应的策略,这就是利用马尔科夫链进行上海市每日新增本土病例分析的基本思想 [5]。通过获取上海单日新增本土病例人数的历史资料,得到连续两天内前天处在状态i区,第二天处在j区的比率
,构造出一步转移矩阵
,k步转移概率矩阵Pk为:
记向量
,其中Pi(t)表示在第天上海单日新增本土病例处于第(
)的绝对概率。E即:如果预测对象有Ei,有
个状态,某一状态出现的次数为Mi则Ei出现的频率Fi = Mi/N。Fi = Mi/N上海单日新增本土病例第t + k个时间段(
)的绝对概率向量:
因此,当我们知道当前的初始概率向量所处的状态后,就可以预测未来任意一个时间的状态此外,容易看出上海单日新增本土病例人数的马氏链具有遍历性,也就是说,在若干期后,上海单日新增本土病例人数最终在各个期间的概率分布都是一个平稳值。
4. 应用实例分析
现以上海市每日新增本土病例时间序列为例(见表1),应用马尔科夫链对每日新增本土病例分别进行中短期和长期预测分析,从而确定策略,将时间序列的单位以日记。

Table 1. Shanghai has daily new local cases from 2022.5.5 to 2022.5.25
表1. 上海市每日新增本土病例2022.5.5~2022.5.25资料
将这21日上海市每日新增本土病例划分为4个区间,得到区间状态为:1 (每日新增本土病例113以下),2 (每日新增本土病例113~182),3 (每日新增本土病例182~252),4 (每日新增本土病例252及以上)。综合这些资料得到这21天的海市每日新增本土病例状态转移情况如表2 [6]。

Table 2. Shanghai 2022.5.5~2022.5.25 daily new local case status transfer in 21 days
表2. 上海市2022.5.5~2022.5.25日21天内每日新增本土病例状态转移情况
由此计算出各状态之间的转移概率和转移概率矩阵:
根据表1显示,2022.5.25上海市每日新增本土病例人数的状态为1,可以认为初始状态向量
,可根据一步转移矩阵预测2022.5.26年上海市每日新增本土病例各个状态的概率:
得到2022.5.26上海市每日新增本土病例人数位于1状态的概率为1,位于2状态的概率为0,位于3状态的概率为0,位于4状态的概率为0。2022.5.26上海新增本土病例人数为45人,位于[0, 113),属于状态1,与实际情况相符。
得到2022.5.27海市每日新增本土病例位于1状态的概率为1,位于2状态的概率为0,位于3状态的概率为0,位于4状态的概率为0。2022.5.27上海新增本土病例人数为39人,位于[0, 113),属于状态1,与实际情况相符。
利用matlab进行计算,得出:
即2022.5.25之后上海市每日新增本土病例人数位于1状态的概率为1,但是若要在新增人数上达到平稳,要在90日后才能实现新增人数上的平稳,此时,每天新增人数为0。
上海市每日新增本土病例人数为齐次马尔科夫链,则
,且若它的状态空间E是有限的,使得
,马尔科夫链具有遍历性,且
,
的唯一解,即经过一段时间之后,马尔科夫链会达到平稳状态。又由上述分析可知:
基于此,联立方程组:
解得:
即为较长时间后上海市每日新增本土病例人数处于各区间的平稳分布,且又因为
,上海市每日新增本土病例人数又为均匀平稳分布。
5. 结论与启示
新冠肺炎作为全球性流行传染病给世界造成重大影响,严重危害人类生命健康安全,本文依据Markov链相关定义及定理,引入Markov链以建立相应的模型,对上海市每日新增本土病例变化状态进行了预测,得到如下结论:1) 不管2022年的上海市每日新增本土病例怎样变化,经过数月后都会趋于平稳;2) 2022.5.25之后90日才能实现新增人数上的平稳。与实际值对比发现,Markov链预测上海市每日新增本土病例的结果是比较满意的。值得注意的是,马尔科夫链的结果并不是为我们提供一个准确又具体的数值,而是基于其无后效性,根据最初的状态划分,对未来可能的状态趋势进行预测,其结果代表的只是一种状态趋势。在实际过程中,诸如新冠肺炎等大型传染病的传播往往受到许多因素的影响,因而对状态趋势的预测也并非一成不变,所谓的平稳也是动态平稳,未来仍可能受到其他因素的干扰而发生改变,比如说小区的执行力,居民的自觉性等 [7]。结合我国的出行习惯,虽然马尔科夫链的结果2022.5.25之后90日才实现新增人数上的平稳,但在每年9月份,全国的大、中、小学将面临开学,人口流动性将会大大提高,届时马尔科夫链的状态可能仍会发生转移。此外,上海每日新增本土病例并无定律,没有什么方法可以对每日新增本土病例进行准确预测。
不过,即便如此,Markov链预测疫情的传播仍然具有一定的借鉴作用,只要根据各地区的不同特点,进行具体分析,充分利用大数据进行检测,仍然可以得到与真实状态接近的结果。本文根据马尔科夫链的预测结果对上海市疫情防控提出以下建议:1) 在疫情爆发的高峰阶段,首先要摸清疫情源头,从根本上阻断疫情的传播,采取强有力的隔离措施,避免人群积聚,对密接人群要实行严格的隔离观察,防止二次传播;2) 及早做好疫情防控的风险评估工作,做好防控预案,加强群众心理建设,避免引起群众恐慌;3) 保证数据的真实性、完整性和准确性是做好疫情管控的重中之重,还要保证平台数据的同步性、及时性和透明性,避免误导民众,有助于及时调控资源和医疗基金。