1. 引言
变化环境下的流域水文响应是近年来水科学研究的热点和前沿[1] 。为了研究气候变化和土地利用模式变化下的水资源长期可利用性,流域水文状况需要通过水文模型来准确的模拟,因此,可靠的水文模型是变化环境下流域水文预报和水资源规划管理的关键[2] 。以往的水文模型,包括集总式、半分布式、分布式水文模型,多数参数往往无法通过测量获得,实际中一般通过已有的长期水文历史资料率定得到[3] 。然而,受气候变化和土地利用变化的影响,一些原先已具备资料的流域因为环境改变使得历史资料不可用而成为缺资料流域,从而导致水文模型的应用受到了很大程度的限制。
鉴于此,自20世纪70年代以来,各种各样的替代方法被用于缺资料流域水文模型的参数估计。其中,模型参数的区域化是最常用的方法[2] 。参数区域化的目的是在流域尺度上建立单个模型参数与流域物理特征值(如森林覆盖率、土壤类型等)之间的经验(回归)关系。具体操作步骤为,参数首先通过在大量有资料流域上的率定得到估计,然后和这些流域的物理特征值建立起回归关系。如果一个或多个区域化参数和某个或多个流域特征相关,这些回归方程就能通过参数值的表达来估计环境变化对流域水文水资源的影响[4] 。
参数区域化为变化环境下的流域水文模型参数的有效估计提供了一条新的途径。本文在回顾变化环境下流域水文响应研究的基础上,指出现有流域参数区域化操作的基本框架,旨在从流域物理特征选取、水文模型结构分析、回归模型结构及其参数识别以及不确定性分析四个方面阐述流域水文模型参数区域化的研究现状,指出研究中存在的问题,并对未来的发展趋势提出展望。
2. 环境变化对流域水文过程的影响研究
Milly等[5] 2008年在《Science》上撰文指出:流域径流序列形成的环境背景“一致性”已不复存在,流域水文过程在变化环境下(主要包括气候变化和下垫面改变)的演变将成为一种常态。研究气候变化和下垫面改变对流域水文过程的影响已经成为变化环境下流域水文响应研究的重要内容。
2.1. 气候变化对流域水文过程的影响研究
气候变化对流域水文过程的影响包括直接影响和间接影响两个方面。气候变化对流域水文过程的直接影响,主要是通过气温、降水、蒸发等因素的改变来直接影响陆面水文循环过程,从而影响流域水文过程[6] -[8] 。1850年以来的全球地表观测温度数据显示,最近100年(1906~2005年)全球平均升温0.74℃ [9] 。气温的上升,加速了水文循环过程,驱使了降水、蒸发等水文要素的变化,增强了水文极致事件的发生频率,改变了区域水量平衡,进而影响了区域水资源分布[10] 。到目前为止,气候变化对流域水文过程影响的研究结果一般包括:径流增大[11] 、径流减少[12] 以及径流季节性变化[13] 。
气候变化对流域水文过程的间接影响,主要是通过改变降水、温度等影响植被动态生长及植被结构与功能,从而影响流域植被覆盖状态和光合作用,进而影响流域生态水文过程。朴世龙和方精云[14] 基于遥感和地理信息系统技术,对中国1982~1999近20年的植被覆盖动态变化进行了分析,结果表明,我国植被覆盖的动态变化受气候波动的影响十分显著,并且这种变化的区域性差异明显。袁婧薇等[15] 分析了中国气候变化的植物信号和生态证据,指出气候变暖导致中国总体植被盖度增加,植被活动加强,生产力增加。Shi等[16] 的研究表明,过去50年来的气候变化已经使中国西北地区13%的地表植被覆盖得到改善。徐兴奎等[17] 对气候变暖背景下青藏高原植被覆盖特征的时空变化进行了分析,并对其成因进行了探讨。结果发现,青藏高原地区植被覆盖率在全球气候变暖大背景下呈增加趋势,降水量是决定高原地区植被整体覆盖年际变化和波动的主要气候驱动因素。Yu等[18] 的模拟结果认为,到21世纪末中国会有正向的植被增加。
2.2. 下垫面改变对流域水文过程的影响研究
流域下垫面(如土地利用方式、土壤属性等)影响着流域水文过程[19] -[21] ,而流域下垫面改变必然会对流域水文过程造成影响。流域下垫面改变,除了包括由气候变化引起的流域植被覆盖变化外,主要是指由人类活动引起的土地利用/覆盖变化(LUCC)。而人类活动对流域下垫面的影响,则主要是通过土地利用、兴修水库、水土保持、农田灌溉以及城市化和工业化等活动,不同程度的改变土地覆盖状态,进而影响主要以土地为下垫面的流域水文循环和水资源形成过程。其中,土地利用、城市化和农田灌溉直接引起土地覆盖的变化[22] ;兴修水库则影响了水的天然输移,也会间接影响土地覆盖的变化[23] 。
目前,国内外都有许多关于土地利用/覆盖变化对流域水文过程影响的研究。大多数研究认为,城市化导致流域不透水层面积增加,下垫面的渗透性、滞水性和热力状况随之发生变化,使得截留、填洼、下渗和蒸发量减少,从而导致地表径流和洪峰流量增加,径流系数增大,显著影响区域水循环过程[24] ;农业耕作使土壤结皮和压实,从而降低了入渗和蒸发,使得土壤容重增加,年径流量增大[25] 。由于蓄水和排水复杂机制的综合效应,农业用地对洪水产生的影响却相对较小[26] 。而关于植被对流域径流的影响,目前还存在较多的争论。大多数研究认为,植被覆盖率与径流量呈负相关关系[27] -[29] 。张建军等[30] 研究了黄土高原不同植被覆盖对流域水文的影响,结果表明,森林流域的年径流量明显小于农地流域和半农半牧流域;农地流域、半农半牧流域、次生林流域的基流量显著高于人工林流域和其它植被覆盖流域。田迪等[31] 通过对美国切斯比克湾地区150个流域下垫面特性对河流流量影响的研究发现,随着草地和林地比例的增加,流量趋于减少、流量变化趋于稳定。但也有研究认为森林植被的存在会增加年径流量。Wang等[32] 的研究表明,1967年以来,马营河流域上游林草地大规模转为耕地后,流域年径流量减少了近三成。
综上所述,气候变化与人类活动共同影响下的流域水文过程发生了明显改变,水文模型采用历史径流资料进行参数率定,将会使模型模拟得到的流域水文水资源状况面临由变化环境带来的失真风险。为了能准确评价环境变化对流域水文水资源状态的影响,研究变化环境下流域物理属性与水文模型参数之间的区域化关系已然成为生产实践的迫切需求。
3. 流域水文模型参数区域化研究现状
区域化方法常被用于无资料地区的水文预报问题(Predictions in Ungauged Basins, PUB),为此,国际水文科学协会(IAHS)专门制定了PUB十年计划(2003~2012) [33] 。近年来,许多学者对无资料地区模型参数区域化进行了研究,取得了一定的研究进展。Wagener等[34] 总结前人的研究成果后认为,任何降水–径流模型都可以简化成如下形式:
(1)
式中,
为模拟流量;
为流域水文模型结构;
为模型输入(如,降水、气温等);
为模型参数;
为局部模型误差项。当有较长的历史径流资料可用时,模型参数通过率定得到估计。当缺少径流资料或流量数据不可用时,应首先在大量有资料的流域上率定模型参数,然后再试图找出模型参数和流域特征之间的函数关系,即:
(2)
式中,
为无资料地区模型参数估计值;
为区域模型结构;
为一组区域模型参数;
为一组流域地形及气象特征指标;
为区域模型的误差项。为了清晰描述参数区域化过程,Wagener等[34] 给出了参数区域化示意图,如图1所示。从图中可以看出,流域物理特性、流域水文模型结构以及区域模型结构及其参数识别都是区域化过程中的关键组成部分,而各部分之间的选择和组合会造成模型参数和预报的不确定性,影响参数区域化结果的可靠程度。因此,本文将从这四个方面归纳总结国内外流域水文模型参数区域化的研究现状。
3.1. 流域物理特征选取
绝大多数区域化方法的核心是建立模型参数与流域物理特征值或由物理特征值推导出的响应指数之间的相依关系[35] 。因此,选取能够表征变化环境下流域特定响应的物理量对气候变化和人类活动共同影响下的模型参数与流域特征之间稳健关系的建立尤为重要。

Figure 1. Schematic representation of a regionalized procedure
图1. 参数区域化示意图
注:
、
、
分别为第
个有资料流域的模型输入、模型参数组和流域特征组,N为有资料流域个数。
、
、
分别为缺资料流域的模型输入、模型参数组和流域特征组。
为了研究气候变化对流域水文过程的影响,一些学者将能够反映流域气候特征的响应指数作为重要变量考虑进模型参数与流域物理特征值之间建立起的经验关系之中。其中,干旱指数[36] 是最常用的一个气象指数,它表示多年平均潜在蒸散发量与多年平均降水量的比值。Ye [37] 和Ali [38] 分别基于物理基础的数值模拟和基于至上而下的经验数据分析方法,在美国50个MOPEX流域上建立起地下水退水曲线参数与包括干旱指数在内的流域特征值之间的函数形式。Yadav等[39] 在英国30个流域上比较了不同的流域物理特征及响应指数与一个集总模型参数之间的统计关系,结果发现,相关性较高的流域特征之一是湿润指数(干旱指数的倒数)。
为了研究下垫面改变对流域水文过程的影响,早在20世纪50年代,一些学者和机构就尝试将流域下垫面特征考虑进模型之中。其中,最典型的就是美国农业部水土保持局在1954年开发的SCS模型[40] 。此模型的主要特点就是引入一无因次参数
,建立模型中唯一参数
与
的经验关系。
是反映降雨前流域特征的一个综合参数,它与流域前期土壤湿润程度、坡度、植被、土壤类型和土地利用状况有关[41] 。进入20世纪70年代以后,随着水资源开发利用程度的不断提高,无资料地区的径流预测变得愈发重要,学者们开始逐渐将注意力转移到模型参数的区域化研究中。研究初期,受流域可利用资料少和质量差的限制,较少的流域特征被用来建立与模型参数的经验关系。且以往对流域物理属性的处理,更多的是流域直观特征(如,河网密度[42] [43] 、流域面积[44] 、流域平均坡度[45] 等)的整体描述以及流域上不同土壤类型和土地利用所占比例(如,森林覆盖率[46] 、流域不透水率[47] 等)的简单统计,往往缺少与流域内在水文过程直接相关的细部特征的精细刻画(如,土壤水力学特性等)。
2000年以后,随着GIS、RS等先进技术的发展和应用,流域可利用的资料信息越来越多,更多更细致的流域特征指标被融合进不同模型参数的经验公式中。例如,王国庆[48] 将黄河水量平衡模型4个参数中的3个(最大土壤含水量
、地面径流系数
和地下径流系数
)分别与流域平均土壤孔隙度、土壤稳定下渗率和土壤传导度建立回归方程。Yang等[49] 将水热耦合平衡模型中的唯一参数
与流域相对入渗能力
、相对植被土壤有效蓄水能力
和平均坡度
建立起函数关系。随后,Yang等[50] 又用植被覆盖度
替换
,将
引入到模型解析方程参数
的经验公式中,结果表明,考虑植被土壤水分和植被覆盖度能改善对流域水量平衡年际变化的模拟精度。与此同时,与流域水文过程密切相关的响应指数也越来越多的被用来拟合模型参数的回归方程[51] [52] 。
尽管各种各样的流域物理属性被广泛地应用在参数区域化研究中,但一般很难去推断哪个流域属性和模型参数更加显著相关。而且,流域物理特征的选取在很大程度上受研究者的主观经验影响[53] 。一方面,这与数据的获取及可利用数据的质量有关[54] ;另一方面,我们对流域属性的理解与流域实际复杂的自然过程之间存在一定的差距,即这些可测量的流域属性与真实的流域响应之间可能并不相关,或者联系很弱[55] 。
3.2. 水文模型结构分析
降水–径流模型是水文分析的标准工具,然而,任何水文模型方程及其参数只是对流域水文过程复杂状态的一种近似描述,因此,如何选择合适的降水–径流模型来最小化模型结构缺陷和提高模型参数可识别性一直以来都是水文学家和水资源管理者必须面对的一个挑战。一般而言,水文模型中考虑下垫面变化对水文过程的影响越精细,模型结构就越复杂,所需要的流域信息就越多,模型不确定性增加的可能就越大。但是水文模型的模拟效果并不会因为模型结构的复杂而存在必然的改善[56] 。过去一些学者比较了集总和分布式水文模型在径流模拟中的效果[57] -[61] ,结果发现分布式水文模型并没有表现出比集总模型更加明显的优势[62] 。Kling和Gupta [63] 的研究结果也表明,集总模型可以提供与分布式模型几乎一致的径流预测,但是在某些情况下需要对集总模型参数进行大量的率定。
关于水文模型结构对参数区域化的影响,Braun和Renner [64] 研究了HBV模型参数与流域特征之间的关系,结果表明,HBV模型的内在结构不适合将表征集总模型特征的参数值与流域的物理属性联系起来。柴晓玲等[65] 比较了新安江模型和IHACRES模型在无资料地区径流模拟中的应用,结果发现,IHACRES模型模拟精度高于新安江模型,说明在无资料或缺资料地区,参数较少的模型比复杂模型具有更大的适用性。Kay等[66] 认为,水文模型的选择应与参数区域化方法紧密联系起来。当前的研究为区域化过程中水文模型的选取提供了一定的经验和基础,但大多数研究的重心主要集中在径流模拟过程中的模型表现,没有系统比较模型结构及参数在描述流域水文物理过程中的优势与差异。与此同时,各国研究者提出的流域水文模型各式各样、繁简不一,然而我们可提供给模型的信息资料远远没有跟上模型发展的速度[67] 。因此,如何协调模型研制与流域资料获取之间的关系仍然是当前水文模型结构研究的难点。
3.3. 区域模型结构及其参数识别
在水文模型参数估计的过程中,研究者一直都在试图弄清这样一个问题,那就是,流域的物理特性和模型参数之间的本质关系是什么?怎样的数学形式能够更加精准贴切地描述这种关系?研究初期,基于回归技术的分析手段常被用来建立流域水文响应和流域物理属性描述符(流域水文模型参数)之间的联系[68] [69] ,不同水文模型参数的一元或多元回归方程因而被广泛地应用在加拿大[70] 、希腊[71] 、巴西[72] 、非洲[73] 、澳大利亚[74] 、美国[75] 、英国[76] 、欧洲大陆[77] 、日本[78] 和中国[79] 的广大流域上,获得了相当丰富的经验。随着回归模型研究的进一步深入,研究者们逐渐意识到,模型参数之间很强的关联性,使得基于回归方法得到的模型参数很难通过区域化关系式得到很好的估计[75] 。为了设法回避模型参数可识别性差的问题,一些传统回归方法的改进方法也因此被相继提出。Fernandez等[80] 提出了一步回归方程区域率定方法,即回归模型和水文模型同时率定、一起寻优。为了提高参数的可识别性,Lamb等[81] 提出了顺序回归方法,具体步骤为,一致性随机抽样(URS)方法首先被用于抽取所有有资料流域的可行参数空间,模型参数的可识别度随即通过参数多点图得到主观判断,然后建立区域(回归)模型以获得最可识别参数的最优值。得到的最优值被设定为这个参数的区域值。随后,URS方法再次在所有流域上进行抽样,新的可识别度高的参数再次被固定下来。重复上述操作直到所有的参数被依次确定。顺序回归方法在英国近40个流域上的应用结果表明,该方法的表现要优于单变量回归方法[82] 。Wagener和Wheater [83] 提出了考虑参数可识别度的加权回归方法,并在英国东南部的10个流域上进行了实例应用,得出了加权回归方法的整体效果高于标准回归方法的结论。
尽管回归方法作为最常见的方法被很多学者应用到参数区域化研究中,其它方法也越来越多的被尝试。例如,聚类分析[84] 、空间插值[85] [86] 、神经网络[53] 、空间相近法[87] 、属性相似法[88] 、流量历时曲线率定法[89] -[91] 等。随着单个研究方法的不断深入,也有学者将这些方法和回归方法进行比较。Vandewiele和Elias [86] 的研究结果发现,克里金方法能提高多元回归方法在无资料地区月水量平衡模型参数估计中的表现。Heuvelmans等[53] 比较前向人工神经网络方法(ANNs)和传统线性回归方法在SWAT模型参数区域化中的整体表现后认为,在模型参数和流域属性之间的非线性关系存在较强的物理解释的前提下,ANNs可以提供比线性回归更加精确的参数估计。Merz和Bloschl [92] 对一个概念性水文模型的两种参数区域化方法在奥地利近300个流域上的应用效果进行了比较,结果发现,空间相近法比参数回归法(包括全局回归和局部回归)效果更好,而Young等[87] 在英国260个流域上的研究却得出了正好相反的结论。McIntyre等[88] 比较了属性相似法和参数回归法在英国127个流域上的应用效果,结果表明,属性相似法优于参数回归法。这两种方法同样被Kay等[66] 应用到英国119个流域的洪水频率估计中后却发现,对于不同的模型,不同的区域化方法表现更优。考虑到过去研究的流域个数相对较少,未能充分涵盖广泛多变的水文气象类型,Oudin等[93] 在法国913个流域上对三种参数区域化方法进行了较全面的比较,结果发现空间相近法最优,属性相似法次之,参数回归法最差。李红霞等[94] 将这三种方法应用到澳大利亚210个流域上也得出了同样的结论。
从上述方法比较中可以发现,在不同的研究中,不同方法的模拟效果因研究者所采用的流域、数据和模型的不同而有差异。即使在同一研究中,不同方法模拟效果的胜出也必须满足一定的约束条件。到目前为止,还没有一种在任何情况下都较优的参数区域化方法,因此,有必要在以后的研究中对参数区域化方法做进一步的探讨。
3.4. 不确定性分析
流域水文模型参数区域化过程是多个复杂步骤的有机组合,包括流域物理属性选取、模型结构及参数识别等。这些操作均存在着多种选择而非唯一,而不同的组合和选择会造成模型参数和预报的不确定性,进而影响参数区域化结果的可靠程度。针对不确定性问题,国内外已经开展了大量的研究,其中,普适似然不确定性估计(GLUE)方法[95] [96] 和贝叶斯估计[97] [98] 代表了不确定性研究的重要进展。为了细致反映GLUE方法估计得到的不确定性区间并为不同的不确定性估计方法的比较提供更加客观的评价准则,熊立华等[99] 提出了七个评价指标(包括覆盖率、平均带宽和平均相对带宽、2个描述平均对称度的指标、平均偏移幅度和平均相对偏移幅度)来从不同方面刻画水文模型的预报区间。选用七个指标中的三个主要指标(即覆盖率、平均带宽和平均偏移幅度),董磊华等[100] -[102] 分析比较了贝叶斯模型平均(BMA)和单个模型的预报区间,得出了BMA方法不仅能提高预报精度,还能推求出性质更为优良预报区间的结论。与此同时,为了推导出具有显著统计特征的水文模型参数的后验分布,基于贝叶斯理论和GLUE方法的融合方法也被相继提出。例如,Blasone和Vrugt [103] 提出将基于经典贝叶斯理论的SCEM-UA方法与GLUE方法结合起来,采用SCEM-UA采样方法代替传统的GLUE方法中的Monte Carlo随机取样方法,并根据估计的预测区间的覆盖率来控制可行参数组个数的选择,对传统的GLUE方法进行改进。在Blasone所做工作基础之上,卫晓婧等[104] 以预测区间性质最优为指标来控制可行参数组个数的选取,进一步提出了基于马尔科夫链–蒙特卡洛算法的改进通用似然不确定性估计(MMGLUE)方法。实例研究证明MMGLUE方法较传统的GLUE方法能够推求出性质更为优良的预测区间。然而,由于输入、参数以及模型结构等众多不确定性来源的引入,使得不确定性问题的解决到目前为止还远未能达到理想程度。因此,对于如何降低参数区域化过程中的不确定性,未来还需要开展更加深入的研究。
4. 总结和讨论
流域特征和模型参数之间的可靠关系是流域水文模型参数区域化,土地利用变化评估和无资料地区径流预测的先决条件。随着分布式信息越来越多的被应用到水资源规划及管理过程中,改进流域水文模型的参数区域化策略依然被持续需要。目前,国内外对模型参数区域化已开展了一定深度的研究,取得了阶段性的成果。然而,许多问题仍然有待解决和进一步深入研究。
1) 流域物理属性的选取是当前参数区域化研究的难点。在数据资料足够的前提下,可以考虑将可能影响特定流域水文响应机制的物理特征,从物理成因途径、结合实际资料做一个系统的比较分析,挑选出最能代表流域特征的物理量。
2) 由于大尺度上的数据信息获取困难,当前大尺度流域的参数区域化研究受到一定限制[105] 。随着RS等先进技术越来越多的应用于模型参数估计中,更多更细致的区域地面物理属性和植被生物物理特征将越来越多的和流域水文模型参数建立起联系。因此,在充分利用各种信息源的基础上,应考虑在分布式水文模型的结构框架下建立全球尺度的参数区域化策略。
3) 复杂的水文模型一方面试图尽可能精确地描述流域水文过程,另一方面又会因为参数过多而相互作用,进而影响模型的整体表现。因此,在模拟效果相当的前提下,应考虑尽量选择模型结构相对简单、物理意义清晰的模型。这样既可以减少参数估计和率定过程中的计算量,又可以避免因参数过多而带来的异参同效或过参数化问题。
基金项目
国家自然科学基金重点项目(51190094)和国家自然科学基金项目(51479139)资助。

NOTES
作者简介:李帅(1987-),男,湖北汉川人,博士研究生,主要从事流域水文模型研究。