1. 引言
丹江口水库是汉江中上游的特大型水利工程,水量十分丰富且水质优良,具有防洪、供水、发电以及航运等多种综合效益。该水库作为南水北调中线工程的水源地,2014年底正式向北京、天津、河北和河南等受水区提供生产生活用水,库区水质的好坏直接影响到南水北调中线工程沿线二十多个大中型城市及库区周边的经济发展和居民用水安全 [1] 。因此对丹江口水库的水质状况开展监测研究具有十分重要的现实意义。
目前,丹江口水库的水质监测手段主要是在特定断面或点上实行人工采样监测或自动监测站监测 [2] [3] 。这两种监测方法在精度上有一定准确性,但耗时耗力、成本较高,且有限的监测断面不足以完全反映丹江口库区的水质时空分布情况,导致难以全面快速准确地定位污染源和敏感区,一定程度上影响了水资源保护管理工作的有效开展。遥感监测技术作为一种非传统性质的监测技术 [4] ,具有空间全覆盖、快速和成本低等突出优势 [5] ,十分适合丹江口水库这种大范围水域的水质快速监测需求 [6] 。
遥感监测技术是指利用遥感波段信息与水质指标的光谱特性,建立反演模型预测水质指标浓度 [5] 。自上世纪70年代初期开始,遥感技术逐渐应用到陆地水体的研究中,国内外诸多学者开展了大量水质遥感反演研究,均取得了不错的效果。如闻建光等 [7] 基于Hyperion星载高光谱遥感影像,运用波段比值法、一阶微分处理技术构建了太湖叶绿素a浓度的反演模型;吕恒等 [8] 提出利用TM影像反演太湖叶绿素a浓度的最佳波段组合是TM3/(TM1 + TM4);Shi等 [9] 从实测数据中发现MODIS-Aqua影像与总悬浮物在645 nm的波长处具有极强的相关性,据此发展了适应性极强的总悬浮物经验反演模型,并在太湖取得了良好的效果;吴川等 [2] 采用统计回归方法建立遥感反演模型,反演丹江口水库叶绿素a、TP和水体透明度,证明水质遥感反演具有实际应用价值。与此同时,Yinuo Zhang [10] 等将多时相陆地卫星用于丹江口的反演,操建华 [11] 等将BP神经网络用于丹江口库区水质指标预测。但是,目前遥感反演的结论仍然不能令人满意,其平均误差仅能控制在30%左右,遥感反演水质的方法仍需开展深入研究,特别是多种方法的对比研究仍有待进一步深入,以寻求一种简便、可靠、准确的水质遥感反演方法。
本文以丹江口水库为研究对象,基于高分辨率遥感数据和实测水质数据,比较数理统计方法和人工智能算法在水质遥感中的准确性和可靠性,提出适用于丹江口水库氨氮的遥感反演技术。并推演2007~2009年丹江口水库氨氮水质时空分布和演变趋势,使得管理部门对于丹江口水库水质的把握从有限的测点上升到水库整体,为丹江口水库整体的水质保护提供技术支撑。
2. 数据采集与处理
2.1. 水质监测断面及监测数据获取
以典型水质参数氨氮为研究对象,选取的实测水质资料为2007年9月15日、2008年9月1日,2009年7月18日,2009年10月22日,2009年11月23日五日丹江口水库三个监测断面(浪河口断面、丹江口坝上断面、陶岔断面)的水质监测数据,断面位置示意图见图1,水质数据来源于长江水资源保护局丹江分局。

Figure1. Location diagram of water quality monitoring section in the Danjiangkou reservoir
图1. 丹江口水库水质监测断面位置示意图
2.2. 遥感影像数据采集与预处理
研究选用Landsat5 TM卫星影像数据作为丹江口水质遥感数据信息源。Landsat5重访周期为16天,即同一地点的遥感影像更新频率为16天。Landsat5 TM影像包含7个波段,分别为蓝色波段、绿色波段、红色波段、近红外、中红外、热红外、中红外,各个波段具体参数见表1。本研究从USGS等网站,获取了与实测数据时间同步的Landsat卫星影像数据。

Table 1. Landsat-5 band parameter table
表1. Landsat-5波段参数表
遥感成像时,由于各方面因素的影响,使得遥感影像存在一定的几何畸变、大气消光、辐射量失真等现象,这些畸变和失真现象影响了影像的质量和应用,需对其进行遥感影像预处理,主要包括辐射定标和大气校正。本研究采用ENVI5.1专业软件进行遥感影像预处理。首先,用ENVI里的Radiometric Calibration工具进行辐射定标,将原始影像无量纲DN (Digital Number)值转换为辐射亮度值;然后,用ENVI里的FLAASH Atmospheric Correction Model工具进行FLAASH大气校正,消除大气中水蒸气、O2、CO2等对原始影像产生的影响。完成预处理后,影像的反射率发生了明显的变化(图2),预处理后,反射率更接近真实情况。

Figure 2. Comparison of remote sensing image pre-processing
图2. 遥感影像预处理对比图
3. 反演模型构建
3.1. 多元回归模型
根据前述基础资料,采用水质遥感反演常用的多元线性回归模型进行建模,得到反演公式如下:
(1)

Table 2. Error table of multiple regression model
表2. 多元回归模型误差表
由多元回归模型误差表2中可知,回归模型的率定期和验证期的平均相对误差分别为8.3%和22.4%。效果较佳,能够用于水质遥感反演。
3.2. 人工神经网络模型
神经网络的全称是人工神经网络(Artificial Neural Network, ANN),它采用物理上可实现的器件或计算机来模拟生物体中神经网络的某些结构和功能,并应用于工程领域。人工神经网络可看成是简化了的人脑的数学模型,由大量处理单元(神经元)广泛连接而成 [12] 。神经网络的着眼点不在于利用物理器件完整的复制生物体中的神经细胞网络,而是抽取其中可利用的部分来克服目前计算机或其他系统不能解决的问题,如学习、控制、识别和专家系统等。由于水中各水质指标相互影响,常规反演方法难以有效地考虑这部分因素从而建立更加符合实际的反演模型,而人工神经网络类似于人脑,非常适合模拟这种错综复杂的关系,故而采用人工神经网络模型反演氨氮浓度是可行的 [13] 。
本研究通过MATLAB工具箱里的Neural Fitting功能构建人工神经网络模型。其中,模型的初始阈值、学习速率等使用工具箱中的默认值,算法从Levenberg-Marquardt、Bayesian-Regularization、Scaled Conjugate Gradient 3种神经网络算法中优选一种。因每次计算时神经网络默认选择的初始权值不同,需训练多次后选择相关性最好的网络作为反演网络。本研究总共18个有效样本点,其中14个用于模型率定,4个用于模型验证。将数据输入模型中计算,各个算法的模拟效果见表3。从表中可知Levenberg-Marquardt算法的模拟效果最佳。

Table 3. Comparison of simulation effect of different neural network algorithms
表3. 不同算法的神经网络的模拟效果对比表
Levenberg-Marquardt算法的误差分析见表4。从表中可知,模型预测效果总体较好;率定期出现过拟合现象,模拟效果极佳,平均相对误差为3.59%;验证期平均相对误差为19.28%,相较于率定期效果稍差。相较于多元回归模型的8.3%和22.4%而言,神经网络模型反演效果更为精准,更能模拟实际情况。

Table 4. Artificial neural network model error table
表4. 人工神经网络模型误差表
4. 结果分析
为得到2007~2009年的水质分布,需先通过ENVI中的监督分类和图像掩膜方法提取丹江口水库水体区域,如图3所示,仅对识别出来的水体区域进行氨氮遥感反演。

Figure 3. Map of Danjiangkou reservoir water area extraction results
图3. 丹江口水库水体区域提取结果图
本研究共选取了四幅遥感影像进行氨氮浓度反演,分别是2007年、2008年、2009年丹江口水库丰水期影像及2007年丹江口水库枯水期影像。将构建的人工神经网络模型应用于丹江口水库水体区域,得到丹江口水库反演氨氮浓度分布如图4所示。

Figure 4. The spatial distribution of NH3N’s concentration in different periods
图4. NH3N浓度在不同时期的空间分布图
从图4可以得出以下结论:
1) 年内分布上,丹江口水库丰水期氨氮浓度明显高于枯水期,其中尤以丹库最为明显。究其原因,可能是丰水期相较于枯水期,雨水冲刷作用造成的面源污染大增,大量有机氮、无机氮随雨水冲刷进入河流再汇集于水库中,导致氨氮浓度升高,进一步说明面源污染是影响氨氮浓度的重要因素。
2) 年际分布上,2007年到2009年之间,丹江口水库的氨氮浓度整体上有下降趋势。说明近年来,有关部门对于丹江口水库流域实施的一系列环境保护与修复措施取得了较为明显的成果。
3) 总体上,从氨氮的角度上看,丹江口水库水质优良,氨氮浓度普遍优于地表水II类水质标准,满足我国饮用水水源地水质要求,且南水北调中线工程陶岔渠首附近,水体氨氮浓度能够满足地表水Ⅰ类水质标准,饮用水水源地一级保护区的要求,为受水区沿线的城市供水安全提供了保证。
5. 结论
水质遥感反演作为一种非传统性的监测手段,具有空间全覆盖、快速和成本低等传统水质监测难以比拟的优点,能够作为实测数据的有益补充,极具有深入研究和推广的价值和必要。本文以Landsat卫星影像和现场实测水质数据为数据源,建立氨氮的人工神经网络模型对丹江口水库2007~2009年水质进行遥感反演,结果表明,人工神经网络模型反演丹江口水库氨氮时空分布准确性和可靠性良好,率定期和验证期的平均相对误差分别为3.59%和19.28%,反演结果可以作为实测数据的有益补充;丹江口水库水质整体上趋好,氨氮浓度均低于二类水要求,丰水期明显高于枯水期。
本文仍有部分局限性,值得未来进一步研究改进,包括:
1) 如因实测数据采样频率有限及其与遥感影像过境时间匹配困难,导致可用水质数据有限,使计算结果存在一定的误差。
2) 人工神经网络算法作为一种经典的分类算法,模拟效果较好,然而存在过拟合问题 [14] [15] [16] 。究其原因可能是因数据有限导致训练样本比较少造成的 [17] 。这种过拟合问题虽然会导致模型预测可靠性有所降低 [15] ,但是,考虑到水质遥感反演数据匹配困难和计算机领域深度学习算法的快速发展,人工神经网络仍然是一种值得继续研究和开发的算法。
基金项目
本文由国家重点研发计划(No. 2017YFA0603704, ,2017YFC1502503)资助。