1. 引言
流行性感冒(简称流感)是一种由流感病毒引起的急性呼吸道传染病,主要通过飞沫传播,该疾病具有传播速度快、季节性强等特点[1]。据世界卫生组织统计,全球每年约有10亿例季节性流感病例,其中300万至500万例为重症,每年因流感所导致的死亡人数大约30~60万例[2]。
流感也是我国重要的公共卫生问题。一项基于82个内陆城市五年监测数据的分析显示,流感病例占同期呼吸道疾病总病例的72.7% [3]。全国每年因流感导致的超额死亡约9.6万~24万例[4]。重庆市作为中国西南地区的重要直辖市,其流感负担长期处于较高水平。2023年,全市流感发病率高达1560.38/10万[5]。国家法定传染病报告系统通过网络直报提高了传染病报告的及时性与完整性,增强了疫情早期处置能力[6]。然而,该系统主要反映疾病的趋势性变化,而社区和哨点医院调查数据更贴近实际情况,基于调查的发病率通常高于法定报告数据[4] [7]。传染病报告系统的发病率可能会导致对流感疫情的低估,从而影响医疗资源配置和公共卫生应对。
本研究基于重庆市秀山土家族苗族自治县(简称秀山县)流感报告数据,分析并探究该区域流感的分布特征,并构建了基于重庆市秀山县的SARIMAX-AttLSTM混合模型,该模型可结合流感发病率与气象数据,捕捉流感季节性规律及短期波动,实现流感的早期预警与趋势预测。此外,通过BEAST算法模型对流感发病率变化点进行分析,可辅助疾控部门识别流行特征转折点、明确高风险时段,为优化监测体系、制定防控策略提供科学依据,从而提升区域流感防控能力。
2. 资料与方法
2.1. 数据来源与处理
本研究所用数据主要来源于中国流感监测信息系统,包括重庆市秀山县2018年第1周至2024年第26周的流感报告卡数据,共计35,057例,该数据经秀山县疾病预防控制中心审核整理,确保数据准确性与完整性。
常住人口数据由秀山县统计局提供,涵盖2018年至2024年按年龄分组的人口分布情况。标准人口结构使用重庆市第七次全国人口普查数据。为了计算分年龄组的流感发病率,本研究将各年龄组各周的发病人数除以相应周的常住人口数,并进一步采用直接标化法对年龄结构差异进行调整,最终得到每周的标化流感发病率。具体公式如下:
其中,
为秀山县第i年龄别周流感病例数,
为该组别常住人口数,
为第i年龄别标准人口数。
本研究所使用的气象数据由重庆市气象局提供,包含2018年1月1日至2024年6月30日的秀山县国家气象观测站的日平均气温、日平均风速、日平均相对湿度及日累计降水量数据。气象站点监测范围覆盖全县区域,能较反映研究地区的整体气候状况。为保持与流感监测数据的时间粒度一致,将日气象数据按周聚合,采用算术平均法计算各变量的周均值,构建与流感数据时间分辨率匹配的周气象数据集(包括周均温度(WAT)、周均风速(WAW)、周累积降雨量(WCR)、周均相对湿度(WAH))。
2.2. 研究方法
本研究基于重庆市秀山县2018年第1周至2024年第26周流感报告卡数据进行基本特征描述,并使用BEAST算法模型对流感发病率时间序列进行变化点分析,识别季节性变化点与趋势性变化点。最后,结合流感的同期气象数据,在SARIMAX-LSTM混合模型的基础上引入注意力机制,构建SARIMAX-AttLSTM混合模型以提升预测模型的精度和泛化能力。本研究以9:1比例划分训练集与验证集,构建并比较了SARIMAX、AttentionLSTM、SARIMAX-AttLSTM混合模型。最后,采用平均绝对误差(Mean absolute error, MAE)、均方根误差(Root mean square error, RMSE)和决定系数(R2)作为评估模型预测性能指标。
本研究在Python (3.9.13)和R (4.3.2)环境下完成数据处理、建模与分析,主要的工具包如下:statsmodels (0.14.0)、pandas (1.5.3)、numpy (1.25.0)、scikit-learn (1.2.2)、tensorflow (1.13.0)、keras (2.13.0)、matplotlib (3.7.1)。其中,用于流感发病率变化点分析工具包为Rbeast (0.5.3)。
3. 结果
3.1. 2018~2024年秀山县流感发病的基本特征
3.1.1. 人群特征
2018年第1周~2024年第26周,秀山县共报告流感病例35,057例。其中,性别分布显示,男性18,473例,女性16,584例,男性和女性的构成比分别为52.7%和47.3%,比例为1.1:1。除2024年上半年外,其余年度的男性病例数均多于女性病例数,性别构成差异有统计学意义(χ2 = 53.8, P < 0.001) (详见表S1)。年龄分布显示,1~9岁年龄段的人群流感发病例数最高,占比52.9%,其次是10~19岁年龄组(占24.3%)。其中,患者最小年龄为4天,最大年龄为96岁。病例年龄组构成差异有统计学意义(χ2 = 2957.0, P < 0.001) (见表S1)。职业分布显示,居前三位的职业分别为学生(15319例,占比43.7%)、幼托儿童(7631例,占比21.8%)、散居儿童(5278例,占比15.1%)。除2020年和2022年散居儿童人群病例构成比居于首位外,其余年份职业为学生的病例占比位于首位,十年间的职业构成差异有统计学意义(χ2 = 4987.3, P < 0.001) (见表S1)。
3.1.2. 时间特征
2018年第1周~2024年第26周秀山县流感报告发病率总体呈上升趋势。其中,流感发病率在2018年至2019年逐渐上升,2020~2021年有所回落,2022年再次上升,2023年达到最高峰值(19,326例,发病率 = 3104.09/10万),且在2023年第11周达近6年流感峰值(696.96/10万)。从图1可以发现秀山县流感发病率高峰可能出现在每年冬季(第47周至次年第8周)至次年春季(第9周至第20周)。该地区的流感疫情具有明显季节性,除2022、2023年外,其余年份发病呈现典型冬季(第47周至次年第8周)高峰模式。2023年呈现“双峰”特征:流感流行全年呈现春季(第9周至第20周)主高峰,冬季(第47周至次年第8周)次高峰的特点;2022年则流感流行表现为夏秋季(第21周至第26周)高峰,流感流行高峰为6月,其余月份疫情趋于平稳,详见图1。
Figure 1. Temporal trend of influenza incidence in Xiushan County from 2018 to 2024
图1. 2018~2024年秀山县流感发病率时间趋势图
3.1.3. 地区特征
2018年第1周~2024年第26周,秀山县各乡镇街道流感平均发病率在282.86/10万至2000.95/10万之间,呈现显著地区差异(P < 0.001),反映县域内流感流行强度不均衡。发病率居前三位的乡镇分别为中和街道、清溪场街道和乌杨街道。详见表S2。
3.2. 使用BEAST算法模型的流感变化点检测
利用BEAST算法对秀山县流感发病率时间序列的变化点分析结果如图2所示。该方法将序列分解为季节性、趋势和误差分量,识别各成分变化点位置并量化分布概率大小。图2(a)为2018年第1周至2024年第26周秀山县周流感发病率时间序列图。该部分显示过去6.5年间,流感发病率实际波动情况。可以看出该地区2022、2023、2024年均有较为明显的流感发病率波动,其中2023年波动幅度最大。图2(b)、图2(c)分别显示了季节性成分及季节性成分中变化点的位置和概率。结果表明,季节成分有4个明显变化点,分别出现在2020年第4周、2022年第25周、2023年第14周、2024年第1周,对应的概率分别为0.298、0.513、0.527,0.809 (见表1)。这4个变化点将秀山县流感发病率序列的季节性因子划分为5个部分,即2018第1周至2020年第4周,该地区有轻微流感季节波动。2020年第5周至2022年第24周,无明显没季节波动。而2022第25周后以及2023年和2024年的季节性波动较为明显。图2(d)、2e表示趋势分量及趋势分量中变化点的位置和概率。该地区在2018年第1周至2024年第26周期间共出现了5个变化点(2018年第46周、2020年第1周、2022年第26周、2023年第11周和51周),每个趋势变化点的概率值分别为0.398、0.998、0.635、0.557、0.523 (见表1)。这5个趋势将序列划分为6个部分,其中,在2018~2020年期间,流感发病率呈轻微上升趋势。而在2020年第1周至2022年第25周期间,未观察到明显流感发病率趋势变化。从2022年第26周开始流感发病率有明显上升趋势,其中在2023年第11周趋势上升幅度最大,之后到2023年第52周趋势逐渐放缓。最后,图2(f)表示序列分解后的误差分量。
Figure 2. BEAST results of the influenza incidence time series in Xiushan County from 2018 to 2024
图2. 2018~2024年秀山县流感发病率时间序列BEAST结果
Table 1. Locations and probabilities of seasonal and trend change points
表1. 季节与趋势变化点位置及概率
Scp1 |
Time_Scp3 |
Pr_Scp4 |
Tcp2 |
Time_Tcp3 |
Pr_Tcp4 |
1 |
2020 (4 week) |
0.298 |
1 |
2018 (46 week) |
0.398 |
2 |
2022 (25 week) |
0.513 |
2 |
2020 (1 week) |
0.998 |
3 |
2023 (14 week) |
0.527 |
3 |
2022 (26 week) |
0.635 |
4 |
2024 (1 week) |
0.809 |
4 |
2023 (11 week) |
0.557 |
\ |
\ |
\ |
5 |
2023 (51 week) |
0.523 |
1 Scp是季节性成分的变化点数量;2 Tcp是趋势成分的变化点数量;3 Time_.表示各成分变化点位置;4 Pr_.表示各个成分变化点的位置概率。
3.3. SARIMAX-AttLSTM混合模型的流感预测
3.3.1. SARIMAX-AttLSTM混合模型构建与比较
在对时间序列进行建模前,首先对流感发病率序列进行了平稳性检验,根据单位根结果显示,该序列整体上具有良好的平稳性(ADF = −5.899, P < 0.05; KPSS = 0.233, P = 0.10),满足建模要求。随后,结合自相关函数(ACF)与偏自相关函数(PACF)图(见图3),并采用网格搜索法以最小赤池信息准则(AIC)为模型筛选标准(模型参数筛选结果见表S3),最终选定SARIMAX (2, 0, 2) (0, 1, 1) 52为最优模型(AIC = 399.794)。
Figure 3. ACF and PACF results of the SARIMAX model: non-seasonal autocorrelation function (A); non-seasonal partial autocorrelation function (B); seasonal autocorrelation function (C); seasonal partial autocorrelation function (D)
图3. SARIMAX模型ACF与PACF结果:非季节性自相关函数图(A);非季节性偏自相关函数图(B);季节性自相关函数图(C);季节性偏自相关函数图(D)
在构建嵌入注意力机制的LSTM模型及SARIMAX-AttLSTM混合模型中的神经网络部分,本文统一采用双层隐藏层结构。每层包含128个神经元,学习率设定为0.001,批量大小为8,最大训练轮数为300。损失函数采用均方误差,并引入Dropout机制以增强模型的泛化能力,防止过拟合,丢弃率设置为0.2。
本研究将SARIMAX模型的预测结果与Attention-LSTM模型对残差的拟合结果融合,构建SARIMAX-AttLSTM混合模型,其整体拟合效果见图4。对比三种模型的完整时间序列拟合趋势(图4(A)、图4(C)、图4(E))及验证集95%置信区间拟合趋势(图4(B)、图4(D)、图4(F)),发现混合模型在训练集拟合精度更优,验证集泛化能力更强,且能较准确捕捉发病率变化趋势(图4(F))。相较而言,SARIMAX模型与Attention-LSTM模型在部分波动区间存在偏差;而混合模型通过整合SARIMAX模型处理季节性与短期依赖特征的能力,及Attention-LSTM模型中注意力机制对不同时间滞后信息重要性的动态分配优势,能更全面捕捉流感发病率的时间变化关键特征,进而提升模型整体预测效果。
Figure 4. Comparison of the performance of SARIMAX, Attention-LSTM, and SARIMAX-AttLSTM models in fitting influenza incidence
图4. SARIMAX、Attention-LSTM与SARIMAX-AttLSTM模型在流感发病率拟合中的性能比较
3.3.2. 模型性能评估
通过对三种模型的预测性能进行量化评估(表2),发现SARIMAX-AttLSTM混合模型在预测流感发病率方面表现最优(MAE = 8.064, RMSE = 11.724, R2 = 0.922),该模型在误差控制与拟合精度方面具有显著优势。
此外,为评估气象因素对预测准确性的影响,本研究对比了各模型中不同气象因素组合的预测结果(见附表S4)。结果显示:温度单独作为外生变量时,SARIMAX模型与Attention-LSTM模型拟合效果更优;而温度与降雨量共同作为外生变量纳入时,混合模型拥有最佳预测性能。
Table 2. Comparison of evaluation metrics for the three models
表2. 三个模型的评估指标对比
模型 |
MAE |
RMSE |
R2 |
SARIMAX |
7.149 |
28.453 |
0.846 |
AttLSTM |
9.032 |
16.909 |
0.838 |
SARIMAX-AttLSTM |
8.063 |
11.723 |
0.922 |
3.3.3. SARIMAX-AttLSTM混合模型预测趋势
基于2018年第1周~2024年第26周的流感发病率及气象数据,本研究利用训练完成的SARIMAX-AttLSTM混合模型,对2024年第27周~2025年第52周(未来26周)的流感发病趋势进行预测。因该时段缺乏实测气象数据,研究采用季节性分解法模拟填补气温与降雨量,生成的预测数据作为外生变量输入模型。预测趋势见图5,由图中红线可知,未来26周流感发病率呈明显上升趋势,提示可能出现流感疫情峰值。虽该模型无法精准预测各时点具体发病率,但在识别中短期流行趋势上仍具有重要参考价值。
Figure 5. Forecast of influenza incidence for the next 26 weeks using the SARIMAX-AttLSTM hybrid model
图5. 使用SARIMAX-AttLSTM混合模型对未来26周流感发病率的预测结果
3.4. 预测模型在流感监测与预警中的应用
为实现模型成果的公共卫生转化,本研究探讨了如何将SARIMAX-AttLSTM混合预测模型嵌入到当地疾病监测与预警工作流程中。首先,可将模型纳入秀山县疾控中心的常规流感监测系统中,利用模型对每周流感发病率进行实时预测,并与监测系统中报告的实际发病数据进行动态对比。其次,可根据模型预测值设定分级预警阈值:当预测值接近或超过历史同期发病率均值的一个标准差时,可判定为“轻度预警”;超过两个标准差时为“中度预警”;超过三个标准差则为“重度预警”。该分级预警机制可帮助疾控部门在流感流行前期提前识别风险信号,及时启动针对性防控措施,如加强重点人群健康监测、储备防控物资及发布公众健康提示。此外,模型输出的趋势变化信息还可为上级卫生行政部门提供科学决策支持,从而构建“数据驱动–智能预测–主动干预”的流感监测预警体系。
4. 讨论
本研究基于2018年第1周至2024年第26周重庆市秀山县流感报告卡数据及同期气象数据,系统分析了流感的流行特征、时序变化点位置及概率,并基于注意力机制构建了流感发病率预测模型。结果显示,研究期间的流感发病率总体呈上升趋势,季节性特征明显,且存在显著的人群与地区差异。BEAST模型识别出多处变化点,与疫情防控策略调整及气象条件波动密切相关。构建的SARIMAX-AttLSTM混合模型在短期预测中表现优异,拟合精度显著高于单一模型。
在人群特征方面,本研究通过对不同性别的流感阳性例数对比,发现男女性别比为1.1:1,男性总阳性例数略高于女性,性别差异具有统计学意义,这与已有研究结果一致[8]。有研究表明,女性的免疫系统在某些方面更为活跃,考虑可能与雌激素对免疫细胞的调节作用相关,雄激素可能对免疫系统的调节作用较弱[9]。但该结果与上海市研究结果不一致[10],可能由流感毒株的差异导致,一般而言,甲型流感病毒在男性群体中比女性群体感染风险高,而乙型流感病毒在性别中无明显差异,而本研究主要患者感染甲型流感病毒为主[11]。与湖北省研究结果一致[12],本研究中1~9岁儿童为主要发病人群,其流感总阳性率高远高于成人群体,儿童免疫系统发育不全,对流感病毒抵抗力较弱可能是导致这一现象的主要原因之一[13]。同时学校、托幼机构的高聚集性也增加了传播风险[14]。提示校园和托幼机构是流感防控的重点场所,应加强疫苗接种与健康教育[15]。从时间分布来看,流感发病率在2020~2021年显著下降,可能与新冠疫情期间的口罩佩戴、社交距离及学校停课等综合防控措施有关[16];2022年后流感发病率迅速回升,并于2023年达到峰值,提示防控措施放松后人群易感性增加及病毒重新传播[17]。空间分布上,各个乡镇/街道流感发病率差异具有统计学意义,其中发病率前三的为中和街道、石耶镇以及清溪场街道,分析原因,可能与地区人口密度相关,中心地区人口聚集风险大,增加病毒传播风险[18],该结果为流感分区分层防控工作提供了依据。
通过BEAST算法模型分析发现,在2018年第1周至2024年第26周期间,秀山县流感发病率呈现出五个明显的趋势性突变以及四个季节性结构突变。具体来看,流感发病率在2020年第1周趋势表现为下降。本研究推测可能与新冠疫情防控措施的全面实施有关。为遏制疫情传播,各地积极采取减少人员流动的措施,同时大力推广戴口罩、勤洗手等健康防护举措,这些措施有效降低了病毒传播风险[16]。在2022年第26周,流感发病率呈现上升趋势。考虑是由于新冠疫情进入后期阶段,防控力度有所减弱,人群防护意识降低,导致病毒传播机会增加[17]。此外,在2022年第25周,秀山县出现夏季流感高发期。流感哨点医院监测数据显示,该时段内流感病毒主要优势毒株为甲型H3N2型。由于该毒株在近几年流行强度较低,人群免疫水平普遍偏低,因此导致秀山县在该时期出现了夏季流感流行季。
模型比较结果表明,SARIMAX-AttLSTM混合模型在拟合精度与预测能力方面均优于SARIMAX和Attention-LSTM单一模型,尤其在捕捉季节性波动方面表现更佳。混合模型通过引入时间维度的注意力机制,有效识别了不同滞后期对流感预测的相对重要性,其中t − 1时刻的发病率对当前预测影响最大,提示流感传播具有明显的时间依赖特征。模型分析还表明,秀山县流感具有明显的季节性规律,高发期集中于冬春季,与已有研究结果一致[19]。气象因素分析进一步发现,低温和少雨环境下流感发病风险显著升高,这可能与流感病毒在低温低湿环境中的存活延长及人群室内聚集增加有关[20],提示应基于气象条件优化流感预警与干预机制。最后,基于混合模型的未来26周预测结果拟合良好,显示出较高的实用价值。
然而,本研究仍存在一定局限。首先,受数据缺失的影响,本研究构建的模型未纳入空气质量、人群流动及疫苗接种率等关键影响因素,上述因素在流感传播中可能发挥着重要作用。例如,有研究表明,臭氧可能为流感的保护因素,而PM2.5与PM10则与流感传播风险的上升存在关联[21]。在节假日期间,集会、返乡、出游等人群流动可能会影响人群接触流感病毒的机会[22],本研究忽略了该因素可能会导致模型低估传播范围。另外,疫苗接种作为预防流感传播的重要公共卫生干预手段[23],在流感疫苗接种率较高的年份或地区,未纳入该因素可能会使模型高估流感发病率。上述这些情况都可能在一定程度上限制模型的解释力与外推性。其次,使用SARIMAX-AttLSTM混合模型对未来26周流感发病趋势进行预测时,因部分气象数据缺失而采用模拟值填补,可能会降低模型短期预测的精准性。最后,Attention-LSTM模型在超参数设定上仍依赖专业经验,模型稳定性与泛化能力有待进一步提升。未来研究可融合搜索指数和空气质量、人群流动、疫苗接种等多源数据,并引入集成学习与自适应调参策略,以进一步提高预测的精度与稳定性。
5. 结论
本研究系统揭示了重庆市秀山县流感的时空特征与流行规律,并验证了SARIMAX-Att LSTM混合模型在短期预测中的精度与稳定性。研究结果为地方流感防控策略提供了数据支持,也为多源数据驱动的传染病预测模型研究提供了方法学参考。未来应进一步融合多维动态数据,构建实时更新的智能化流感监测与预警体系,以实现更精准的公共卫生决策支持。
致 谢
本研究承蒙重庆市秀山土家族苗族自治县疾病预防控制中心的大力支持,特此向该中心工作人员在数据收集过程中所给予的宝贵帮助致以诚挚谢意。同时,感谢重庆市气象局提供的气象数据,为本研究顺利开展提供了重要保障。
附 录
Table S1. Annual distribution of influenza cases in Xiushan County, Chongqing (2018~2024) by year, sex, age group, and occupation
表S1. 2018年~2024年重庆市秀山县流感病例分年份、性别、年龄组职业分布统计
变量 |
2018 |
2019 |
2020 |
2021 |
2022 |
2023 |
2024 |
合计 |
χ2 |
P值 |
性别 |
|
|
|
|
|
|
|
|
53.8 |
<0.001 |
男 |
252 (58.1) |
2616 (55.0) |
424 (50.0) |
321 (57.3) |
2553 (52.1) |
10254 (53.1) |
2053 (48.5) |
18473 (52.7) |
|
|
女 |
182 (41.9) |
2142 (45.0) |
424 (50.0) |
239 (42.7) |
2345 (47.9) |
9072 (46.9) |
2180 (51.5) |
16584 (47.3) |
|
|
年龄(岁) |
|
|
|
|
|
|
|
|
2957.0 |
<0.001 |
<1 |
0 (0.0) |
152 (3.2) |
36 (4.2) |
12 (2.1) |
262 (5.3) |
404 (2.1) |
229 (5.4) |
1095 (3.1) |
|
|
1~9 |
100 (23.0) |
2588 (54.4) |
423 (49.9) |
297 (53.0) |
2660 (54.3) |
10549 (54.6) |
1929 (45.6) |
18546 (52.9) |
|
|
10~19 |
217 (50.0) |
1500 (31.5) |
111 (13.1) |
165 (29.5) |
527 (10.8) |
5477 (28.3) |
511 (12.1) |
8508 (24.3) |
|
|
20~29 |
26 (6.0) |
212 (4.5) |
122 (14.4) |
33 (5.9) |
437 (8.9) |
827 (4.3) |
487 (11.5) |
2144 (6.1) |
|
|
30~39 |
21 (4.8) |
145 (3.0) |
86 (10.1) |
23 (4.1) |
412 (8.4) |
815 (4.2) |
376 (8.9) |
1878 (5.4) |
|
|
40~49 |
19 (4.4) |
53 (1.1) |
24 (2.8) |
11 (2.0) |
171 (3.5) |
375 (1.9) |
171 (4.0) |
824 (2.4) |
|
|
50~59 |
25 (5.8) |
47 (1.0) |
14 (1.7) |
5 (0.9) |
179 (3.7) |
417 (2.2) |
208 (4.9) |
895 (2.6) |
|
|
60~69 |
16 (3.7) |
33 (0.7) |
15 (1.8) |
5 (0.9) |
82 (1.7) |
188 (1.0) |
131 (3.1) |
470 (1.3) |
|
|
70~79 |
8 (1.8) |
20 (0.4) |
11 (1.3) |
8 (1.4) |
116 (2.4) |
207 (1.1) |
137 (3.2) |
507 (1.4) |
|
|
≥80 |
2 (0.5) |
8 (0.2) |
6 (0.7) |
1 (0.2) |
52 (1.1) |
67 (0.3) |
54 (1.3) |
190 (0.5) |
|
|
职业 |
|
|
|
|
|
|
|
|
|
|
学生 |
3 (0.7) |
763 (16.0) |
157 (18.5) |
90 (16.1) |
1141 (23.3) |
4658 (24.1) |
819 (19.3) |
7631 (21.8) |
4987.3 |
<0.001 |
散居儿童 |
8 (1.8) |
632 (13.3) |
256 (30.2) |
71 (12.7) |
1367 (27.9) |
2060 (10.7) |
884 (20.9) |
5278 (15.1) |
|
|
幼托儿童 |
307 (70.7) |
2854 (60.0) |
151 (17.8) |
316 (56.4) |
948 (19.4) |
9780 (50.6) |
963 (22.7) |
15319 (43.7) |
|
|
农民 |
79 (18.2) |
301 (6.3) |
176 (20.8) |
50 (8.9) |
821 (16.8) |
1181 (6.1) |
845 (20.0) |
3453 (9.8) |
|
|
家务及待业 |
4 (0.9) |
12 (0.3) |
1 (0.1) |
4 (0.7) |
33 (0.7) |
86 (0.4) |
32 (0.8) |
172 (0.5) |
|
|
离退人员 |
7 (1.6) |
71 (1.5) |
11 (1.3) |
6 (1.1) |
74 (1.5) |
360 (1.9) |
71 (1.7) |
600 (1.7) |
|
|
干部职员 |
6 (1.4) |
21 (0.4) |
11 (1.3) |
0 (0.0) |
59 (1.2) |
104 (0.5) |
28 (0.7) |
229 (0.7) |
|
|
教师 |
15 (3.5) |
31 (0.7) |
19 (2.2) |
4 (0.7) |
114 (2.3) |
267 (1.4) |
97 (2.3) |
547 (1.6) |
|
|
工人 |
1 (0.2) |
46 (1.0) |
56 (6.6) |
9 (1.6) |
224 (4.6) |
538 (2.8) |
345 (8.2) |
1219 (3.5) |
|
|
医务人员 |
2 (0.5) |
7 (0.1) |
2 (0.2) |
1 (0.2) |
33 (0.7) |
63 (0.3) |
33 (0.8) |
141 (0.4) |
|
|
其他 |
2 (0.5) |
20 (0.4) |
8 (0.9) |
9 (1.6) |
84 (1.7) |
229 (1.2) |
116 (2.7) |
468 (1.3) |
|
|
Table S2. Influenza incidence in towns and subdistricts of Xiushan County, 2018~2024
表S2. 2018年~2024年秀山县各乡镇街道流感发病情况
地区 |
2018 |
2019 |
2020 |
2021 |
2022 |
2023 |
2024 |
总例数 |
年均发病率 (1/10万) |
中和街道 |
88 |
1943 |
272 |
156 |
1751 |
7351 |
1270 |
12831 |
2000.95 |
乌杨街道 |
37 |
449 |
73 |
33 |
461 |
2112 |
405 |
3570 |
1138.94 |
平凯街道 |
41 |
395 |
85 |
32 |
409 |
1908 |
390 |
3260 |
1084.58 |
清溪场街道 |
50 |
312 |
73 |
143 |
667 |
2280 |
541 |
4066 |
1404.66 |
溶溪镇 |
16 |
97 |
14 |
16 |
219 |
818 |
151 |
1331 |
774.45 |
官庄街道 |
30 |
174 |
43 |
6 |
78 |
272 |
107 |
710 |
631.35 |
龙池镇 |
13 |
250 |
31 |
11 |
232 |
707 |
108 |
1352 |
822.55 |
石堤镇 |
6 |
58 |
19 |
1 |
46 |
133 |
32 |
295 |
402.24 |
洪安镇 |
11 |
69 |
19 |
4 |
58 |
237 |
88 |
486 |
405.21 |
石耶镇 |
7 |
65 |
14 |
70 |
167 |
383 |
99 |
805 |
1416.22 |
梅江镇 |
13 |
136 |
39 |
5 |
115 |
495 |
148 |
951 |
432.59 |
峨溶镇 |
2 |
48 |
16 |
1 |
44 |
134 |
59 |
304 |
282.86 |
雅江镇 |
2 |
49 |
18 |
7 |
33 |
133 |
31 |
273 |
360.53 |
隘口镇 |
6 |
81 |
14 |
4 |
66 |
254 |
127 |
552 |
603.53 |
兰桥镇 |
37 |
45 |
15 |
6 |
34 |
199 |
46 |
382 |
460.91 |
钟灵镇 |
6 |
90 |
19 |
3 |
54 |
295 |
138 |
605 |
578.01 |
膏田镇 |
3 |
42 |
6 |
1 |
38 |
164 |
83 |
337 |
646.82 |
溪口镇 |
6 |
95 |
15 |
1 |
72 |
279 |
82 |
550 |
818.34 |
妙泉镇 |
5 |
62 |
9 |
3 |
41 |
113 |
33 |
266 |
696.48 |
宋农镇 |
15 |
28 |
5 |
3 |
42 |
110 |
26 |
229 |
695.06 |
里仁镇 |
4 |
39 |
5 |
9 |
70 |
138 |
51 |
316 |
588.06 |
涌洞镇 |
2 |
46 |
10 |
1 |
33 |
149 |
49 |
290 |
823.58 |
中平乡 |
2 |
26 |
6 |
20 |
30 |
233 |
29 |
346 |
903.62 |
岑溪乡 |
4 |
55 |
11 |
0 |
29 |
127 |
27 |
253 |
751.61 |
海洋乡 |
19 |
17 |
7 |
13 |
17 |
36 |
19 |
128 |
369.35 |
龙凤坝镇 |
0 |
0 |
0 |
0 |
53 |
209 |
81 |
343 |
421.61 |
大溪乡 |
4 |
31 |
3 |
1 |
10 |
39 |
7 |
95 |
320.39 |
Table S3. Selected parameter results for the SARIMAX model
表S3. SARIMAX模型部分参数筛选结果
参数 |
MAE |
RMSE |
AIC |
(1, 0, 0) (1, 0, 0)52 |
8.331 |
33.333 |
451.421 |
(1, 0, 1) (1, 0, 0)52 |
7.983 |
31.601 |
451.773 |
(1, 0, 1) (1, 0, 1)52 |
8.008 |
31.669 |
451.748 |
(2, 0, 0) (1, 0, 0)52 |
7.854 |
30.831 |
449.604 |
(2, 0, 0) (1, 0, 1)52 |
7.832 |
30.764 |
450.868 |
(2, 0, 1) (1, 0, 0)52 |
7.684 |
30.176 |
441.858 |
(2, 0, 1) (1, 0, 1)52 |
7.499 |
29.981 |
443.291 |
(2, 0, 1) (0, 0, 1)52 |
7.546 |
30.059 |
441.191 |
(2, 0, 2) (0, 0, 1)52 |
7.429 |
32.210 |
432.861 |
(2, 0, 2) (0, 1, 1)52 |
7.149 |
28.453 |
399.794 |
Table S4. Comparison of meteorological factors in the SARIMAX, Attention-LSTM and SARIMAX-AttLSTM models
表S4. SARIMAX、Attention-LSTM和SARIMAX-AttLSTM模型气象因素比较
模型 |
MAE |
RMSE |
SARIMAX (WAT) |
7.018 |
27.771 |
SARIMAX (WCR) |
7.213 |
28.428 |
SARIMAX (WAT, WCR) |
7.149 |
28.453 |
Attention-LSTM (WAT) |
8.576 |
15.939 |
Attention-LSTM (WCR) |
11.529 |
22.119 |
Attention-LSTM (WAT, WCR) |
9.032 |
16.909 |
SARIMAX-AttLSTM (WAT) |
11.205 |
16.547 |
SARIMAX-AttLSTM (WCR) |
10.778 |
17.245 |
SARIMAX-AttLSTM (WAT, WCR) |
8.063 |
11.723 |
NOTES
*共同通讯作者。其中,曾庆为第一通讯作者。