1. 引言
食源性疾病是指因摄入由细菌、病毒、寄生虫或化学物质污染的食物或水引起的疾病 [1] 。食源性疾病全球一大公共卫生问题,也是影响我国食品安全的主要因素,据世界卫生组织报告每年食源性疾病高达6亿例 [2] ,食源性疾病也是发达国家一大重要卫生问题,据估计仅在美国每年就有7600万例食源性疾病病例导致325,000人住院和5000人死亡 [3] 。而我国同样受到食源性疾病的困扰,国内食源性疾病的扩散性和突发性趋势更加明显 [4] 。
近年来,随着食源性疾病监测系统的完善,以及食源性疾病快速诊断能力的提高,食源性疾病致病因子复杂繁多,制定有效的公共卫生措施对食源性疾病的防控更加重要 [5] [6] [7] 。通过分析食源性疾病的空间特征,对防治控制食源性疾病的发展,制定相关措施有重要意义。
2. 资料与方法
数据来源和研究区域
2018~2021年期间食源性疾病报告情况数据来源于《中国卫生统计年鉴》。气象和卫生环境资料来源于《中国统计年鉴》。研究区域包含中国内地31个省份和直辖市。需要注意的是西藏数据存在缺失,故在研究中剔除。
研究方法
空间自相关分析:
空间自相关分析是研究空间单元的属性值是否与相邻空间单元的属性值相关,揭示研究区域属性值的空间分布类型的统计方法。它被分为全局它被分为全局空间自相关和局部空间自相关,前者用于探索整个区域的空间依赖性,后者用于进一步确定具有空间自相关的局部格局和地点。全局指数(范围:−1到1)用于全局空间自相关。当和时存在正空间自相关,当和时存在负空间自相关 [8] [9] 。在空间自相关聚集图的局域指标中,局域县区之间的空间关联模式可分为4类:高–高聚集、低–低聚集、低–高离群值和高–低离群值。值得注意的是,高–高聚集区是戊型肝炎传播和发生的重要“热点” [10] 。空间权重矩阵采用一阶QUEEN准则。
空间和时空聚类分析:
基于离散泊松概率模型,进行纯空间和时空扫描分析,以发现在区/县一级具有高比率的聚类。空间和时空扫描统计量分别由对应于地图上地理区域的圆形窗口和具有圆形地理基底且高度对应于时间的圆柱形窗口定义。将扫描窗口在空间和(或)时间上进行移动,得到无数个大小和形状不同的重叠窗口,共同覆盖整个研究区域。每个圆或圆柱都是一个可能的候选集群。最大地理圆大小设置为总人口的25%,和最大时间扫描周期设置为整个研究周期的50%。默认情况下,不会报告地理位置重叠的集群。对于每个扫描窗口,零假设是窗口内外的风险是相同的,备择假设是窗口内的风险升高。采用对数似然比(LLR)作为检验统计量,值采用999个重复的蒙特卡罗假设检验,得到最大的窗口作为最有可能的聚类,以及在其他窗口中具有统计学意义的为次要聚类。并按LLR值进行排序。当取最大值且时,可以认为该区域存在聚集特征 [11] [12] 。
逐步回归
在回归分析中,普通最小二乘法(OLS)是估计应变量与自变量之间线性回归的传统方法。简单OLS是对
和
两个变量之间的线性关系的估计,公式如下:
(1)
其中
表示因变量y的第i个观测值,即食源性疾病发病率。
表示自变量x的第i个观测值。我们通过收集相关省份的气象和卫生环境资料,剔除共线性较高的变量(VIF > 10)。研究影响食源性疾病病例数升高的因素(表1)。采用逐步回归的逐步选择策略,依次添加最有贡献的预测变量,从而选择出最优的线性回归模型。
Table 1. Summary statistics of meteorological factors and health environment in China, 2018~2021
表1. 2018~2021年全国气象因子和卫生环境基本汇总统计说明
地理加权回归
地理加权回归的模型的一般形式如下:
(2)
;
其中,
与
是因变量y与自变量
在
处的观测值,
为第i个采样点的坐标,
是第i个采样点上的第k个回归参数,点i被称为回归点。
,当
时,
[13] 。可以简便记为:
(3)
地理加权回归会得到出n个回归方程,对应每个回归点i,都会有一个回归方程,若
,则地理加权回归模型退化为普通线性回归模型。
统计软件:采用Geoda1.12进行全局空间自相关和局部空间自相关,SaTScan 10.1软件(Martin Kulldor, National Cancer Institute, Bethesda, MD, USA)进行时空聚类分析,R软件进行逐步回归,分析结果通过arcgis10.2.2 (ESRI公司,Redlands,CA,USA)进行地理加权回归(Geographic Weighted Regression, GWR)以及结果展示。
3. 结果
流行病学特征
2018~2021年中国内地共累计报告食源性疾病事件25,493起,发病150,335人。年均报告发病率2.75/10万人,发病率从3.24/10万人下降到2.28/10万人。发病率的空间分布间图如下图,发病率较高的省份主要集中在西南地区如贵州省、云南省、东部地区主要是山东省、北部内蒙古自治区食源性疾病发病率较高(图1)。
注:该图基于自然资源部标准底图服务网站下载的审图号为GS (2022) 1061号的标准地图制作,底图边界无修改。
Figure 1. Spatial distribution of foodborne disease incidence from 2018 to 2021
图1. 2018年至2021年食源性疾病发病率空间分布
全局空间自相关
分析结果显示2018~2021年期间,仅2020年食源性疾病发病率在空间上具有全局自相关性(表2)。因此,2020年存在一个正的空间自相关,其他年份上的食源性疾病的空间分布总体上是随机的。
Table 2. Global spatial autocorrelation of incidence in China, 2018~2021
表2. 2018~2021年发病率的全局空间自相关
通过对我国内地省、直辖市的食源性疾病发病率的局部空间自相关分析,确定了具有统计学意义的局部空间聚类(图2)。四个空间集群的位置和区域每年不完全相同,高高地区主要集中在西南地区,主要包括贵州省、云南省和广西壮族自治区。
注:该图基于自然资源部标准底图服务网站下载的审图号为GS (2022) 1061号的标准地图制作,底图边界无修改。
Figure 2. Local spatial autocorrelation cluster maps of foodborne diseases in China, 2018~2021
图2. 2018~2021年食源性疾病发病率的局部空间自相关图
空间聚类分析
分别对2018~2021年各省的食源性疾病报告情况进行纯空间扫描。从2018年~2021年,使用时空扫描检测到三个聚类区(图3)。其中食源性疾病时空聚集性最强的为2019~2020年云南省(RR = 5.30, LLR = 10339.05, P < 0.001),其次为2018年~2019年湖南省(RR = 2.88, LLR = 5572.68, P < 0.001)和2020年山东省(RR = 1.74, LLR = 391.52, P < 0.001) (表3)。
注:该图基于自然资源部标准底图服务网站下载的审图号为GS (2022) 1061号的标准地图制作,底图边界无修改。
Figure 3. Spatiotemporal clustering of foodborne diseases in China, 2018~2021
图3. 2018~2021年食源性疾病的时空聚类图
Table 3. Results for spatial clusters of foodborne diseases in China, 2018~2021
表3. 2018~2021年食源性疾病时空聚类结果
逐步回归
回归分析结果显示,公共卫生间数量、温度对食源性疾病报告人数的增加存在相关性;而食品支出、医疗保健指出对食源性疾病报告人数的增加存在负相关性(表4)。
Table 4. Stepwise regression results
表4. 逐步回归结果
地理加权回归(Geographic weighted regression)
我们采用地理加权回归(Geographic Weighted Regression, GWR)以及时空地理加权回归(Geographically and Temporally Weighted Regression, GTWR)模型来考察戊型肝炎与其因子之间是否存在时空关系。我们认为食源性疾病的发病率在研究区域内存在聚类性和变化性。因此GWR模型中的自适应核是合适的(the adaptive kernel in GWR models is appropriate)。通过采用AICc (Akaike information criterion)方法来找到使AICc值最小的带宽。模型的AICc值越低,观测数据提供的拟合度就越好。如表5所示,OLS,GWR,GTWR的R2值分别为0.52、0.79、0.77。对应的AICc值为273.18、261.07、279.19。综合评定结果认为地理加权回归(GWR)相对于逐步回归和时空地理加权回归(GTWR)有着更好的效果(表5)。
Table 5. Regression analysis information
表5. 回归分析信息
对于发病率的空间变化,我们通过arcgis的GWR模型进行分析,生成的结果采用自然间断点分级法(Jenks)分为5个类。图4包含了基于逐步回归中五个具有意义的印象因素的系数空间分布图。可以看到各省和直辖市均有差异。
1) 公共卫生间建设数量对食源性疾病影响的空间变异特征。从回归系数的空间分布(图4(b))来看,回归系数在中国北部地区由东向西部逐渐增大,而中国中部和南部地区系数值均为正且系数绝对值较小。这可能是由于受北部气候不同的影响,在东北部地区建立公共卫生间将有利于提高粪便管理以减少食源性疾病的污染和传播,而西部地区则因减少或规范不合格公共卫生间。
2) 温度对食源性疾病影响的空间变异特征。从回归系数的空间分布(图4(c))结果显示,西南地区温度与食源性疾病呈现负相关性,而沿海地区如广东、福建、辽宁和吉林受温度影响较大,这可能原因是夏季海产品等易发生变质,副溶血性弧菌等细菌最适温度在30℃~37℃,在夏季更易繁殖从而引起食源性疾病的发生 [14] [15] 。
(a) 截距 (b) 公共卫生间数量
(c) 温度 (d) 食品支出(e) 健康支出注:该图基于自然资源部标准底图服务网站下载的审图号为GS (2022) 1061号的标准地图制作,底图边界无修改。
Figure 4. Geographically weighted model regression spatial distribution coefficient
图4. 地理加权模型回归空间分布系数
3) 食品支出对食源性疾病影响的空间变异特征。从回归系数的空间分布(图4(d))结果显示,在国内沿海较发达地区,增加食品支出对减少食源性疾病的发生效果不大。而在内陆地区,提高居民食品支出对降低食源性疾病病例数量具有较高的意义。因提高食品质量,提高内陆地区居民对食品安全的意识、减少通过不合理、不规范的家庭自制食品所引起的食物中毒。
4) 在健康卫生方面,除黑龙江,云南两地。全国绝大部分地区提高医疗卫生支出将有利于减少食源性疾病的发生,尤其以西北部地区显著。这表明西部地区医疗发展水平相对落后,因提高食源性的疾病治疗水平。
4. 讨论
2018~2021年中国内地共累计报告食源性疾病事件25,493起,发病150,335人。年均报告发病率2.75/10万人。国内食源性疾病在2018~2021年期间发病率逐渐下降,这可能与加强食品监管的提升有着重要的关系。
食源性疾病的时空分布探索是深入了解我国食源性疾病流行状况和趋势的重要手段。通过采用自相关分析,来识别疾病在地理空间中存在的模式和趋势,从而发现存在的聚集或分散趋势 [8] 。时空扫描统计可以对疾病数据进行危险性分析,近年来,SaTScan可帮助确定地理区域和时间范围内的疾病聚类 [16] 。通过扫描可以识别聚类区域,了解疾病的地理分布的变化趋势。通过识别异常高发地区,为疾病监测和防控提供重要信息,从而可以由针对性地分配医疗资源,以更有效地管理疾病风险。空间流行病学在多个领域都取得了显著的成就,为食源性疾病的研究提供了新的视角和方法 [17] [18] [19] 。我们的研究结果显示全国各地区之间的食源性疾病发病率在2018,2019和2020年没有空间相关性。而2020年存在空间相关性。
食源性疾病的时空分布受多种因素的影响,包括地理环境、气候条件、人口密度、饮食习惯等 [20] 。我们的研究显示公共卫生间数量、温度对食源性疾病的发生具有正相关性,可能是公共卫生间的卫生管理尚不完善,蚊蝇滋生等情况易导致食源性疾病的传播,而温度的升高容易使食物发生变质、以及细菌滋生。食品支出以及卫生健康支出对食源性疾病的发生具有负相关性,可能的原因是健全食品卫生质量,加强市场监督管理以及居民食品健康意识的提高从而降低了食源性疾病的发生。而医疗支出的提高与居民健康意识同样息息相关,及时有效地治疗进一步避免了食源性疾病的传播。此外,我国幅员辽阔,包含热带季风气候、亚热带季风气候、温带季风气候、温带大陆性气候、高原山地气候。同时各地区饮食习惯差异较大。对食源性疾病的发病类型进一步研究将有利于减少食源性疾病的发生。
对于食源性疾病的流行现状,我们建议:(一) 建立健全的食源性疾病监测系统。(二) 加强健康教育,开展多种形式的食品安全卫生宣传教育工作。(三) 加强食品监管,提高食品生鲜市场的监管力度。尤其是对食源性高发季节以及人口密集场所的食品安全监管。(四) 根据不同地区的饮食习惯,生活习俗以及气候等因素,针对性的制定公共卫生策略。
NOTES
*通讯作者。