1. 引言
城市内涝灾害是与城市化进程一致的,并且与人类活动和洪水特性有关;洪涝灾害不仅对城市造成严重影响,而且还对整个社会发展造成较长时期的不良影响,甚至影响社会的稳定 [1] 。我国2009年的城市化率已达到45%,进入快速发展阶段。随着城市化的快速发展,近年来,我国许多城市出现了严重的内涝,对国家和人民的生命财产造成了重大损失。如2012年7月,北京遭遇61年来最强特大暴雨,导致至少79位市民失去生命,160.2万人受灾,经济损失达116.4亿元 [2] 。2014年3月底,深圳“3.30”暴雨造成城市内涝200处,2人因灾死亡。内涝灾害频繁发生是由许多原因造成的,一方面,由于气候变化导致极端降雨频现;另一方面,城市化发展进程的不断加快导致下垫面不透水层比例增大,即径流系数增大,雨水下渗量减少,地面截流作用变差,地表径流的汇流时间变短,洪峰提前,并且城市的扩张,也使得原有管道系统的汇水面积增大,导致原有管道的负荷增大。
21世纪,城市综合防灾减灾能力大小将成为衡量城市整体功能及其安全防卫能力的标志 [3] 。城市内涝灾害是由极端暴雨在短时间内超过雨水系统设计标准且低于城市防洪标准所导致的,具有持续时间短等特点。因此,对城市内涝形成机理和风险评估开展研究,为城市洪涝灾情预判工作提供及时有效的数据及信息,根据不同重现期的内涝灾害制定应急预案,对提高城市防灾减灾能力具有重要意义。
目前,有很多学者针对城市内涝风险评估进行了研究和应用,常用的研究方法主要包括定性分析方法和定量分析方法,如基于历史灾情数理统计方法、基于情景进行模拟分析方法、基于遥感数据分析方法以及多指标体系评价方法等 [4] 。黄维选取海口市主城区为研究区域,借助ArcGIS和InfoWorks ICM进行模拟计算,综合考虑淹没深度和淹没时间两个因素对研究区的内涝风险进行评估,得到了不同频率设计暴雨重现期情景下的内涝风险图 [5] 。戴晶晶等以苏州市城市中心区为例,采用数值模拟的手段评估识别内涝风险,为城市内涝治理及科学决策提供依据 [6] 。黄铁兰等从致灾因子危险性、孕灾环境敏感性、承载体易损性及防灾减灾能力4个方面选取评价指标,构建了城市内涝风险评价模型进行城市内涝风险评估,为城市内涝防治提供了科学参考 [7] 。王磊等采用投影寻踪方法对城市内涝风险进行了评估,并对影响因素的影响程度进行了分级比较 [8] 。
然而,城市内涝灾害受多种因素影响,例如气象、城市下垫面等。受主观性影响,不同影响因素的权重对城市内涝风险评估结果影响较大。为此,基于改进的投影寻踪方法,本文提出将投影寻踪动态聚类模型用于城市排水系统内涝风险评估。在构建投影寻踪动态聚类评估模型的基础上,根据最优投影方向向量确定评估体系各指标权重。
2. 投影寻踪动态聚类原理
投影寻踪法是基于降维思想的一种数据分析和处理方法,最早由Friedman于1974年提出,把高维数据向低维空间进行投影,方便处理多因素的复杂问题 [9] [10] 。针对投影寻踪中密度宽度参数的不确定问题,倪长健等提出了投影寻踪动态聚类方法,有效避免了投影寻踪模型的不足 [11] [12] 。投影寻踪动态聚类模型和建立步骤如下:
将第i个样本的第j个指标表示为
(
;
;n为样本数,m为指标数)。
1) 对各指数据进行无量纲化处理,即归一化,如公式(1)~(2)所示。
对于越大越优的指标
(1)
对于越小越优的指标
(2)
其中,
和
分别为第j个指标的样本最大值和最小值。
2) 投影可以从不同角度观察数据,寻找能够最大程度地反映高维数据特征和最能充分挖掘数据信息的最佳观察角度即最优投影方向。本文采用线性投影,即将高维数据投影到线性空间。设a为m维单位投影方向向量,其分量为
,则xij的投影特征值zi可表示为
(3)
3) 本文应用动态聚类方法来构造投影寻踪动态聚类模型的投影指标。假设整个样本的投影特征值序列组成的集合为
,依据实际情况或要求,采用动态聚类法将其聚为p (p ≤ n)类 [13] ,具体实现步骤如下:
①随机选取p个点作为p个聚核,记为
(4)
②根据L0,把Ω中的点分为p类,记为
(5)
其中
,
为点
和集合Ω中任一点的绝对值距离。
③从L0出发,得到新的聚核L1
(6)
④重复以上步骤,由此得到一个分类结果序列
,记
(7)
(8)
当
时终止计算,其中ɛ是一个充分小的误差允许值。
为由属于第h类的所有样本投影特征值构成的集合,定义
为任意两投影特征值间的绝对值距离。为了表示类内样本的邻近程度,则用如下公式表示
(9)
(10)
其中dd(a)愈小,则类内样本的聚集程度越高。为了表征有样本序列投影特征值的离散程度,则记投影分散度为
(11)
根据ss(a)和dd(a)的定义,提出投影寻踪动态聚类模型的投影指标QQ(a)表示为
(12)
投影寻踪动态聚类模型的投影指标定义为投影分散度与类内聚集度之差,表示类间所有样本投影特征值的距离之和。显然,投影分散度越大或类内聚集度越小,则投影指标越大。当QQ(a)取得最大值时,就实现了类间样本尽量散开、类内样本尽量集中的聚类目的。
4) 模型求解。
本文采用遗传算法求解如下优化问题,即寻找最能反映数据特征的最优投影方向向量a*,满足QQ(a)取得最大值。
(13)
3. 实例分析
借助美国EPA的SWMM模型进行排水管网系统水动力模拟计算。SWMM模型是美国环保局为了设计和管理城市暴雨而研制的综合性数学模型,它可以模拟完整的城市降雨径流和污染物运动过程,被很多国家和地区的研究者用于排水系统设计规划和管理中 [14] [15] [16] 。SWMM模型包括径流模块、输送模块、扩展的输送模块、调蓄/处理模块和受纳水体模块等主要模块。选取某排水系统为例具体说明城市洪水风险评估过程。该研究区域面积约为34.11 hm2,区域内排水管网系统分布如图1所示。该排水系统由69个排水管井、72根排水管道、1个排水口组成。采用2014年8月6日6 h暴雨过程(图3)作为模型的降雨输入进行水动力学模拟计算,获得排水系统的水力状况,某时刻部分管线的水位图如图2所示。选取评价指标,并对各种指标进行处理分析。本文选用管井最大积水深度、最大洪水流量、洪水总水量、洪水持续时间、集水区不透水面积、集水区总面积以及所在道路等级等7个评价指标 [8] ,指标样本集共有69个样本,部分样本数据如表1所示。
Figure 2. 6 h rainfall hyetographs of the 6 August 2014 event
图2. 2014年8月6日6 h暴雨过程线
Figure 3. Water level diagram of some pipes at 01:40:00
图3. 管线在01:40:00时刻的水位图
Table 1. Flood risk evaluation factor sample set and values of projection and risk degree
表1. 城市洪水风险评估指标集及投影值、风险等级值
对上述69个排水管井的各项指标进行归一化处理,并采用投影寻踪动态聚类模型进行计算分析,即将上述指标分别代入式(1)~(12),建立投影寻踪动态聚类模型,然后采用遗传算法对式(13)进行优化求解。经过迭代计算,目标函数值收敛,且最佳投影方向向量
。最佳投影方向a*反映了各指标重要程度的大小,即为客观权重,由此表明道路等级和最大积水深度是影响此区域内涝风险等级的主要因素。将a*代入式(3)得到各个排水管井的样本投影值,如图4为不同管井编号的投影值,投影值越大,则内涝风险程度越高。由图4可以得知投影值聚类结果较好,得到了明确的聚类结果,内涝高、中、低风险区很容易辨识,即当投影值
时,内涝风险分级为高风险区(3级);当
时,内涝风险分级为中风险区(2级);当
时,内涝风险分级为低风险区(1级)。通过GIS分析得到了2014年8月6日6 h暴雨条件下城市内涝风险分布图,如图5所示。内涝风险高风险区如图中深色区域所示,主要分布在道路等级为一级道路区,对积水较为敏感,且此区域集水区域面积较大,当发生上述暴雨时,管井易溢水。因此,内涝风险区划结果与实际情况相符。
Figure 4. Projection values of different wells
图4. 不同管井编号的投影值
Figure 5. Flood risk map of the study area
图5. 研究区城市内涝风险图
4. 结语
本文通过多指标分析对城市排水系统进行内涝风险评估,可以有效应用于城市防灾减灾。通过实例研究发现投影寻踪动态聚类模型可以用来处理多因素复杂问题的聚类分析。投影寻踪动态聚类模型通过遗传算法求解非线性优化问题可以有效避免投影寻踪密度宽度不确定的问题,这样求得的各指标权重较为客观,在一定程度上减轻了赋权对风险评估的影响。所以,投影寻踪动态聚类模型为城市内涝风险多指标评估提供了一种有效方法。然而,不同城市区域风险等级数目的确定有待进一步研究。