1. 引言
分布式水文模型是研究洪涝、干旱、水污染和水资源管理等的强有力工具,其构建不仅需要有对水文物理机制的理解,而且需要大量的流域空间分布信息和海量数据信息及相关技术的支撑。数字高程模型(DEM)、土壤质地空间分布的数字化信息、土地利用的遥感数字信息,在GIS软件平台上可实现地形地貌信息的非专业户化前处理,仍然需要我们与专业数学模型匹配进行前处理,以便可以利用更多的数据信息十分方便地进行水文模拟,以认识水文循环下的水文过程[1] 。YE等[2] 提出了一个基于遥感信息的时变水文模型(DTVGM),模型所有输入资料都来源于遥感影像信息,这为一种无资料地区水文及水资源问题的解决提供了一种途径。Kabir等[3] 构建了一个空间分布的水文模型(WetSpa),模拟了Gorganrood流域的日径流变化,模型中充分利用了地形、土地利用及土壤类型等数字信息。此外水资源供、用、耗、排等人类活动影响信息也逐渐被应用到分布式水资源模型的构建中,如吴俊秀和郭清[4] 利用MIKE BASIN模型对大凌河流域水资源状况进行了模拟,模型中水资源分配模块考虑了区域水资源的利用信息。
随着大量数据信息被融入到分布式水文模型构建中,弄清这些数据信息在水文模型中的拓扑结构就显得尤为必要,而缺乏能体现数据信息拓扑结构的有效编码方式,将在一定程度上阻碍了分布式水文模型进一步的发展和应用[5] 。当前比较通用的子流域编码方法方法主要有Horton法[6] 、Strahler法[7] 、Shreve法[8] 和Pfafstetter法[9] ,基于这几种编码方法的一些编码软件主要有WMS[10] 、TOPAZ[11] 、Arc Hydro Tools[12] ,GRASS[13] 等。其中Strahler法是在Horton法基础上,从形态与水文要素综合分析中提出的,并且划分的河道结构具有拓扑关系,因而应用十分广泛,但该编码方式只是一种河网编码,并未将流域坡地汇水网络和多源数据的拓扑关系考虑进去,因此有必要对其进行进一步深化处理。本文就是为解决考虑多源数据拓扑关系的全流域编码问题,提出了一种流域–子流域–网格单元–土地利用分类的四级划分框架体系,其主要适用于基本单元为网格的全分布式水文模型。针对半分布式水文模型的构建,编码方式可简化为流域–子流域–土地利用分类的三级划分框架体系。该体系通过网格单元和土地利用分类的匹配实现了空间数据与属性数据的动态关联。基于该体系构建了流域范围内多源数据融合的前处理系统,该系统使得模型前处理模块化、标准化,方便快捷实现了模型与GIS信息的无缝连接,同时减少了分布式水文模型的存储单元和提高了模型的运算速度。该系统为LILAN分布式水文模型的一个有机组成部分,LILAN分布式水文模型中集合了大量的地形地貌特征数据、人类活动的土地利用和水资源利用数据信息,该系统为模型的构建提供了坚实的基础[14] 。本文最后以长江河口地区的分布式水文模型多源数据融合前处理系统的构建作为例子,说明了该系统广泛的适用性。
2. 分布式水文模型中的多源数据融合前处理系统
分布式水文模型对空间数据的需求量越来越大,如在水文分析基础上提取的DEM洼地、流向、集水面积、子流域、河网水系、流域边界等流域地形几何(GIS)信息,雷达测雨、土地利用和土壤质地等遥感(RS)信息,水文与水质站点、水库、湖泊、河流边界、取排水口、城镇等经纬度(GPS)信息,降雨、径流、蒸发等水文气象观测资料,野外流域观测实验数据,人口、工业产值、农业产值、林业产值、牧业产值、水产养殖等社会经济数据,水资源的供、用、耗、排数据,水利工程特征数据和运行管理过程记录数据等,因此经常要进行大量的空间数据融合提取。然而这些数据具有语义差异、时空差异、尺度差异以及空间参考异化等特征,为满足分布式水文模型不同格式和算法的需求,有必要进行多源数据的融合,以实现空间数据与属性数据的匹配,消除不同数据源之间的歧义,从而将多源数据快速有效地应用到分布式水文模型中。
分布式水文模型的前处理系统功能就是要实现多源数据的融合以提供模型输入信息,该系统应具有良好的扩展性、通用型、适应性和可控性等特征,能够方便实现多种复杂时空数据的无缝融合,避免模型重复计算,节省机时和存储空间。系统构建时需明确分布式水文模型结构与算法的需求,以数据融合为切入点,在数据标准化、空间数据与属性数据关联、时间序列的匹配等方面进行规范化和统一化处理。拟解决的关键问题如下:1) 基于DEM的流域地形几何数据与土地利用信息的融合;2) 土地利用数据与社会经济数据的融合;3) 土壤质地与流域试验、测量数据、水文物理参数之间的融合;4) 雷达测雨数据与DEM数据融合;5) 气象水文时间序列与DEM数据融合;6) 水利工程运行管理与DEM数据融合。
3. 一种流域四级划分框架体系
分布式水文模型的前处理系统构建的一个核心问题就是确定多源数据信息拓扑结构的编码,基于此本文提出了一种流域–子流域–网格单元–土地利用分类的四级划分框架体系(或流域–子流域–土地利用分类的三级划分框架体系)。该框架体系是在Strahler法基础上,为进一步解决多源数据拓扑结构的编码提出的。Strahler法将流域和研究区域划为很多较小的网格单元和子流域,对流域的网格单元、子流域进行从上游到下游逐级划分和编码,并且每个子流域和网格单元都被赋给唯一的编码,从而确定了河网和子流域的拓扑关系。本文中提出的四级划分框架体系进一步将土地利用遥感信息加入到流域拓扑关系的编码中,从而可以根据土地利用类型的差异将多源数据匹配到各个网格单元及子流域单元中。
具体操作步骤为,首先应用ArcGIS9.0软件中的水文分析模块进行河网水系及子流域信息的提取;然后将水文分析后划分的子流域及河网成果转换成*.txt文件,带入前处理系统中,生成子流域、坡地网格和河网的排序文件,其中子流域的排序主要基于河网的汇流顺序,坡地网格及河网的排序中则主要记录汇入及流出本子流域的网格单元及其他子流域单元信息,最后将土地利用遥感信息带入前处理系统中,生成网格单元或子流域单元上土地利用类型文件。这样几个输入文件就组成了一个流域四级划分框架体系,多源数据信息便可以根据各个网格单元或子流域位置及相应的土地利用情况进行匹配。多源数据融合前处理系统所生成的长江河口的子流域排序、坡地网格排序、河网排序编码方法见表1~表3。表4为子流域上各种土地利用类型所占的比例信息。
表1用于体现了模型计算中子流域的汇流演算顺序;表2说明了以流域坡地网格单元为基础的几何信息和数值计算优先演算顺序,如1号子流域里面第一个网格由(2,15)网格流入,(11,25)网格流出;(2,15) 表示DEM数据的第2行第15列,(11,25)表示DEM数据的第11行第25列。表3体现了流域河网网格

Table 1. Order of sub-basin
表1. 子流域排序

Table 2. Order of slope grid
表2. 坡地网格排序

Table 3. Order of river grid
表3. 河网排序
单元的几何信息和数值计算排序,如第1个子流域内的河网由(3,17)网格单元流入,从(5,15)网格单元流到第4个子流域。这样就把流域内各个网格单元、河网水系、子流域之间的连接以及数值计算时的优先演算顺序清楚的、有条理的组织在表2与表3这两个输入文件中。表1的子流域排序在两个文件都有涉及,不需要另列文件输入到模型中。对应上述的每个网格单元或子流域单元,又有着不同的土地利用类型的数字化遥感信息(表4),这样就实现了分布式水文模型与GIS、RS信息的对接,方便了多源数据的融入。
研究区域被划分为很多较小的子流域,子流域又包含很多网格单元,并且每个网格单元、每个子流

Table 4. Land use proportion of sub-basin
表4. 子流域土地利用类型比例
域都被赋给唯一的土地利用类别信息。这样的编码方法具有诸多优点,如编码中包含有拓扑信息,方便与多源数据进行对号,编码规则富有规律性,便于计算机处理,适用范围广等。
4. 几何信息与拓扑关系
多源数据融合前处理系统应能充分利用空间几何信息及相应的拓扑关系信息将气象、水文、水资源利用等信息与地形、地貌、土壤质地信息对号入座。几何信息和拓扑关系是地理信息系统中描述地理要素的空间位置和空间关系的不可缺少的基本信息。其中几何信息主要涉及几何目标的坐标位置、方向、角度、距离和面积等信息。而空间关系信息主要涉及几何关系的“相连”、“相邻”、“包含”等信息,它通常用拓扑关系或拓扑结构的方法来分析。拓扑关系是明确定义空间关系的一种数学方法。从拓扑观点出发,关心的是空间的点、线、面之间的联接关系,而不管实际图形的几何形状。水文的空间数据信息包含两类,一类是目标本身的位置信息,即一些空间几何信息,如水文站、雨量站、取水工程等的位置分布等,一个流域上因水库的拦蓄作用,其下游流量将发生变化,不同于自然来水状态,将GPS确定的水库位置对应到所处的网格单元上,即可确定空间上哪个位置应考虑水库调度;另一类是地物间的空间关系信息,即一些拓扑关系信息,如通过提取每个单元的水域、高植被、低植被、建筑物、不透水面积等不同土地利用类型信息,从而确定不同下垫面条件应采用的产流计算模式,如降水落在水域上,可以直接转换成径流,不透水面积上下渗损失很小可以忽略不计;在水资源模拟中,通过不同土地利用类型及取排水设施的分布从而进行水资源取用水量的空间分配。本文提出的四级划分框架体系由于实现了分布式水文模型与GPS、GIS与RS信息的对接,能较好的处理空间几何信息及相应的拓扑关系信息。
5. 应用实例
长江河口上起徐六泾,下至口外50号灯标,全长约181.8 km,位于北纬31˚00′~31˚42′,东经121˚59′~ 122˚43′。长江河口地区涉及上海市及江苏省的南通市和苏州市,上海市、南通市和苏州市面积分别为5790 km2、6881 m2、5104 km2,长江河口地区总面积17,775 km2。按全国水资源分区的成果,长江河口地区涉及到湖口以下干流的通南及崇明岛诸河区以及太湖水系的武阳区和黄浦江区共3个水资源三级区。将上海市、南通市和苏州市这三个地区在长江河口地区的范围分解到对应的水资源三级区作为长江河口地区的分析范围。为了模拟与预测长江河口地区水资源变化,拟在长江河口地区建立一个半分布式水文模型,模型构建过程中将应用该多源数据融合前处理系统。
长江河口地区5 km × 5 km的DEM图见图1,应用ArcGIS9.0软件中的Hydrology水文分析模块对流域的DEM信息进行了水文信息提取,从而得到各个子流域的编码信息(见图2)。
将水文分析结果转换成*.txt文件,带入前处理系统中,该系统首先寻求河流拓扑关系,再对河流每个网格单元排序;然后根据河流拓扑关系获取子流域之间的拓扑关系,并对每个子流域的网格单元进行优先排序;最后分析各个子流域及网格单元上土地利用类型信息,得到流域–子流域–网格单元–土地利用分类的四级划分框架体系(表1~表4)。由于长江河口地区所构建的是半分布式水文模型,因此最终构建了流域–子流域–土地利用分类的三级划分框架体系,该框架体系由表4和表5两个输入文件组成。
表5第1列子流域编码体现了子流域空间关系和先后演算顺序,第2列反应该子流域上游有无输入的河段,无填0,有填1,第3列和第4列给出上游有子流域输入的编码,第5列和第6列为该子流域的

Figure 1. DEM in Yangtze estuary
图1. 长江河口DEM图

Figure 2. Order of sub-basins in Yangtze estuary
图2. 长江河口子流域编码

Table 5. Input information of sub-basins
表5. 子流域输入信息表
面积及河长;表4则给出了各个子流域上土地利用类型的比例信息。这种拓扑关系给半分布式水文模型构建提供了足够的空间信息,便于其他模型输入资料的融入,再加上降水、蒸发、径流等其他输入信息,构成了基于GIS和RS的半分布式水文模型的主要输入文件。
分布式水文模型由于超存储容量而导致不能编译是一个普遍存在的问题。这里提出的网格或者子流域单元的拓扑关系每次能给出每个计算单元的输入单元和输出单元,将流域化整为零,方便数值求解,这三个单元可以反复使用,极大节省了流域计算的空间存储单元。
6. 小结
随着大量数据信息被应用到分布式水文模型构建中,我们迫切需要一种能体现数据信息拓扑结构的有效编码方式。编码方式的优劣往往直接影响模型的运算速率和计算结果的准确性,因此不恰当的编码方式在某种程度上将阻碍了分布式水文模型的进一步发展和应用。本文中提出了一种流域–子流域–网格单元–土地利用分类的四级划分框架体系,其中包含流域–子流域–土地利用分类的三级划分框架体系。基于该体系的多源数据融合前处理系统能实现分布式水文模型与GPS、GIS、RS以及水资源的供、用、耗、排等信息的对接,较好地处理了空间几何信息及相应的拓扑关系信息,为基于GIS和RS的分布式水文模型的构建提供了一种合理的数据处理平台。
基金项目
水利部公益性行业科研专项项目(201201066)。

NOTES
作者简介:李兰,女,武汉大学,教授,博士生导师,主要从事水文、水资源、环境生态保护研究。