1. 引言
病毒性肝炎主要由肝炎病毒诱发,其作用结果为肝细胞损伤,病毒性肝炎主要的特点是传播途径多、传染速度快、流行性强、患病负担高,正是基于这样的特点,结合我国人口基数大的现实条件,我们有必要对其进行分析研究。考虑到我国病毒性肝炎数据是从2011年开始收录的,病毒性肝炎自进行数据收录开始,一开始感染和死亡人数是逐年下降的,但在2015年后感染人数和死亡人数,随着时间的推移均呈现上涨趋势但上涨幅度差别较大且具有波动性。本研究针对我国2011~2019年病毒性肝炎感染人数和死亡人数为基础进行数据分析和预测,以便于对我国的病毒性肝炎防控提供科学的依据,也提醒广大的市民注意自身防护。
2. 研究现状
2.1. 发病率预测技术研究
当前我国所做的有关病毒性肝炎发病率的分析预测是十分有意义的,发病率的预测不仅能在很大程度上展示出该病毒的感染面,并且可以对未感染人群的行为产生一定的引导作用,因此很多专家及学者利用不同的预测模型对近年来我国病毒性肝炎发病率进行研究分析。吴小清等人利用季节指数分析不同类别的肝炎发病的季节性,并使用差分自回归移动平均模型(ARIMA)对2020年病毒性肝炎的发病率进行了预测 [1];邓炯采用SPSS软件对绵阳市涪城区病毒性肝炎的发病特征进行了x2检验、趋势x2检验,得出病毒性肝炎的发病率呈现下降趋势 [2];陈晓娥等人对各类型的病毒性肝炎发生率采用卡方检验的方法进行比较,最终得出结论甘肃省2010~2020年病毒性肝炎发病率呈现明显下降的趋势 [3],由上述的研究我们可以得出国内针对病毒性肝炎的预测大部分都是利用时间序列和检验的方式进行的,并且均得出发病率下降的结论,但没有研究从感染人数和死亡人数入手进行研究。
2.2. 人数预测技术研究
人数总量预测研究比较常用的方法是利用单一的预测模型对某一人口规模进行预测,但是考虑到单一的预测模型,其预测值与真实值之间的偏差较大,因此一部分的学者选用两种及两种以上的预测模型结合,依次来降低预测产生的误差。李金伟等人采用GM(1,1)预测模型对2020~2030年信阳市总人口数目和老龄化人口数目进行了预测,预测了老龄化占比的变化趋势 [4];徐丽丽等人考虑到单一的预测模型具有一定的局限性,于是利用灰色预测模型与径向量网络模型的组合对山东省人口总量进行了短期预测 [5];李自鹏等人利用灰色预测模型、曲线增长模型与线性回归模型分别对徐州市的常住人口和户籍人口数目做出预测,最后考虑到不同的预测模型对人口的预测存在不同程度的偏差,于是采用将三组预测结果进行平均的方法得出三种预测结果的平均值,作为最终的预测结果,以达到降低预测误差的目的 [6];钟恒恺采用灰色预测模型和回归预测模型,通过获取以往南京市的旅游人数,分别用以上两种预测模型未来中短期内南京市旅游人数和收入进行预测 [7];鉴于先前学者对于病毒性肝炎的发病率分析和预测,结合部分学者采用的两种及两种以上模型结合预测的方式,本文主要从病毒性肝炎感染人数和死亡人数入手,采用不同的预测模型对未来病毒性肝炎感染人数和死亡人数进行预测,考虑到不同的预测模型预测的精度不同,故为了将误差降低采用了将三种预测结果进行加权平均的方法,以此达到对未来几年内我国病毒性肝炎感染和死亡人数预测的目的。
3. 数据来源与描述性分析
本研究所使用的2011~2019年的病毒性肝炎感染人数和死亡人数数据,来源于国家统计局统计年鉴。
图1为病毒性肝炎感染人数条形图,由图可以看出我国病毒性肝炎感染人数在2011~2015年呈逐年减少趋势,但在2016年后突然猛增到128万,并在接下来的几年内感染人数持续稳定在128万左右。
Figure 1. Bar chart of viral hepatitis infection
图1. 病毒性肝炎感染人数柱状图
由图2可以看出2011~2015年病毒性肝炎死亡人数在不断的减少,由830万减少到了474万,在2015年病毒性肝炎死亡人数达到了最少,但在2015后,病毒性肝炎的死亡人数又出现了增长的趋势,但是具有波动。
Figure 2. Bar chart of deaths from viral hepatitis
图2. 病毒性肝炎死亡人数柱状图
4. 数据建模
4.1. 传统的GM(1,1)灰色预测模型
传统的GM(1,1)灰色预测模型是使用已有数据序列
,经过累加生成
,将原始数据的随机性降低,累加后的数据往往会出现相对较明显的规律。利用累加后的数据序列进行一阶微分方程构建,通过求解利用累加序列构建的一阶微分方程,再将求得的结果依次累减,经过还原得到的便是灰色预测的结果,从而利用其对未来的数据进行预测。具体的步骤如下:
步骤1:设
为GM(1,1)模型的原始序列,对其一次累加得公式:
其中,
,
。
令
为
的均值序列:
其中,
,
。
步骤2:建立GM(1,1)模型的灰微分方程:
相应的白化微分方程为:
步骤3:在对微分方程的参数进行估计时采用的方法为最小二乘法,得到发展系数
与灰色作用量u,如下所示:
其中:
,
步骤4:求解方程得:
步骤5:由于GM(1,1)模型得到的经过一次累加后的量,于是需要将所得到的结果进行相反的计算使得其还原,根据还原公式:
可对原始数列进行拟合和预测。
评估模型的指标有:
aae表示GM(1,1)模型的预测平均完全误差(表1)。
在对2020~2029年病毒性肝炎感染人数进行预测时,传统的GM(1,1)模型预测平均误差p值为0.034,显示该模型适合于对病毒性肝炎的感染人数进行预测。
利用传统的GM(1,1)模型对2020~2029年病毒性肝炎的死亡人数进行预测时,传统的GM(1,1)预测模型的预测平均误差p值为0.027 < 0.05,显示该模型可以用来对我国病毒性肝炎死亡人数进行预测。
在利用GM(1,1)模型进行感染和死亡人数预测时,利用aee (预测平均完全误差)来衡量预测的准确度,预测模型p值显示均小于0.05,表明此次预测可行。
4.2. BP神经网络预测模型
BP神经网络是以生物的神经网络为原型出发,包括输入层、隐藏层和输出层。
本文中采用的激活函数,具体形式如下:
在本次研究中共设定输入层存在3个神经元,隐含层神经元个数为10个,输出层有1个神经元。
输入变量:
隐含层输出变量:
输出层变量为:
依次对数据进行逐年预测,预测出2014~2029年病毒性肝炎感染人数和死亡人数的数据,利用2014~2019年的预测值与真实值之间的离差平方和作为该预测模型拟合好坏的评价标准。在对我国病毒性肝炎感染和死亡人数进行预测时,两次预测预测值与真实值之间的离差平方和均较小,显示可以用该模型对我国病毒性肝炎的感染人数和死亡人数进行预测。
4.3. 线性回归模型
1) 病毒性肝炎感染人数预测
利用2011~2019年我国病毒性肝炎感染人数为原始数据,应用matlab软件,可以得到其关于时间t1的一元线性回归预测模型
其中:y1表示相应年份的病毒性肝炎感染人数预测值;t1表示相应的年份序数,将不同的年份序数代入预测模型中,即可得到对应年份的病毒性肝炎感染人数预测值。
由F检验可知
说明回归方程在
水平上是高度显著的,表明可以建立线性回归模型。
2) 病毒性肝炎死亡人数预测
利用2011~2019年我国病毒性肝炎死亡人数为原始数据,应用matlab软件,可以得到其关于时间t2的一元线性回归预测模型
其中:y2表示相应年份的病毒性肝炎死亡人数预测值;t2表示相应的年份序数,将不同的年份序数代入预测模型中,即可得到对应年份的病毒性肝炎死亡人数预测值。
由F检验可知
说明回归方程在
水平上是高度显著的,表明可以建立线性回归模型。
5. 结论与建议
5.1. 结论
利用3种预测模型对我国病毒性肝炎感染人数进行预测,具体结果见表2。结果显示3种预测模型的预测误差都较小,根据3种预测模型预测得到的2020~2029年我国病毒性肝炎感染人数预测值可以看出,一元线性回归预测模型的预测结果相对较小,而BP神经网络预测模型的预测结果相对较大,相比之下GM(1,1)预测模型的预测结果较为居中,为了消除所使用模型本身产生的系统性误差,于是本研究利用预测平均完全误差为媒介,计算出三种预测模型的预测平方完全误差开二次方,利用预测平方完全误差二次方根占比为权重计算预测值加权算数平均值,以此加权平均值作为最终的预测值,进一步降低预测的误差,具体计算步骤与结果如下:
其中aae:预测平均完全误差;
为预测值;
为原始数据;n为个数。
Table 1. The average total error of the three prediction models
表1. 三种预测模型的预测平均完全误差数值
最终得到2020~2019年我国病毒性肝炎感染人数分别为:1,252,573、1,247,969、1,242,701、1,237,324、1,231,982、1,226,668、1,221,361、1,216,057、1,210,757、1,205,462人。
Table 2. Prediction results of viral hepatitis infection in different prediction models
表2. 不同预测模型病毒性肝炎感染人数预测结果
从3种预测模型对2020~2029年病毒性肝炎死亡人数预测的结果来看,3种模型的预测误差均较小,预测结果的精度也相对较高,使用3种不同的预测模型对我国2020~2029年因病毒性肝炎而死亡人数进行预测,预测的结果展示在表3中。由表3的预测结果可以看出传统的GM(1,1)模型预测值偏小,而一元线性回归模型预测值偏大,相比较而言BP神经网络预测模型的预测值居中,为了消除所使用模型本身产生的系统性误差,于是采用上述的加权平均算法将3种预测结果的加权均值作为最终的预测结果,最终得到2020~2019年我国病毒性肝炎死亡人数分别为:537、552、581、614、653、701、755、816、885、960人。
Table 3. Prediction results of viral hepatitis deaths in different prediction models
表3. 不同预测模型病毒性肝炎死亡人数预测结果
图3为病毒性肝炎感染人数未来10年预测值,由图3我们可以看出我国病毒性肝炎感染人数在未来10年将会不断地减少,并且呈现稳定的减少趋势,但是减少的幅度较小,预测结果可以看出到2029年我国仍然有1,205,462人感染病毒性肝炎,这就意味着我国应加大力度对病毒性肝炎进行预防,政府也应该出台相关的政策从源头上对其进行控制,使其感染人数减少幅度加大。
Figure 3. Estimated number of viral hepatitis infections over the next 10 years
图3. 病毒性肝炎感染人数未来10年预测值
图4为我国病毒性肝炎死亡人数未来10年预测值,由图4我们可以看出我国病毒性肝炎死亡人数在未来10年呈现出不断增长的趋势,并且呈现出增长速率增大的趋势,从预测结果可以看出,到2029年我国病毒性肝炎死亡人数达到960人,虽然从图3我们可以看出我国病毒性肝炎感染人数是不断减少的,但病毒性肝炎死亡人数的预测值显示死亡人数在不断地增加,因此我国应强化病毒性肝炎的治疗手段,争取能将我国病毒性肝炎的死亡率降到最低,为我国人民的健康做出更加坚实的保障。
Figure 4. Projected number of deaths from viral hepatitis over the next 10 years
图4. 病毒性肝炎死亡人数未来10年预测值
5.2. 建议
1) 病毒性肝炎的预防工作仍然要采取严格管控,政府应加大病毒性肝炎知识普及力度,加强教育宣传工作,提供病毒性肝炎防治学习资料和平台,提高病毒性肝炎疫苗接种率,尤其应该注意学生、医护人员、流动人口等重点人群的疫苗接种工作。
2) 涉及到病毒性肝炎传染方式多的特点,相关部门应注意严格对血液和输血设备进行管控,提倡高质量的义务献血,对于消毒政策应该严格执行。
3) 要防止病从口入,应加大监督力度、注意自我防护,去往人流量大或者有高风险传染的区域应佩戴口罩,少接触传染源,时刻做好消毒工作。加大力度宣传有关病毒性肝炎预防相关的知识,不断提高人民群众自身的防护意识,从源头上阻断病毒性肝炎的传播,有效保护人民的生命安全和身体健康。
NOTES
*通讯作者。