1. 引论
水库不仅是调控水资源时空分布、优化水资源配置的重要水利工程措施,也是国家防汛抗旱体系的重要组成部分,在保障生产生活供水、应对极端气候灾害以及改善生态环境等方面发挥着不可替代的作用,根据2018年水利统计数据(统计数据范围为中国境内),截至2017年12月31日,全国已建成的各类型水库总数量为98,795座,总库容为9035亿m3;其中大型水库732座,中型水库3934座,小型水库94,129座 [1]。因而有必要对水库水质进行综合评价。
水质评价的概念第一次出现在20世纪初的生物学界,德国柯克维兹(Kirk)和莫松(Moson)提出了生物学的水质评价分类方法。自20世纪60年代水质指标的概念被提出并运用到了水质评价后,关于水质指标的选取和水质评价方法的研究逐渐兴起 [2]。美国是最早进行水质评价的国家之一,可参考 [3] [4] [5] [6]。我国的水环境质量评价工作大体上经历了初步尝试时期、广泛探索时期、全面发展时期和环境影响评价时期等4个时期 [7] [8]。
当前水环境质量评价方法主要有两大类,一种是以水质物理化学指标的实测值为根据的评价方式;另一种是以水生物种群与水质的关系为根据的生物学评价方式。其中第一种水环境质量评价方法运用较为普遍,例如单因子评价法、主成分分析法、ANNS评价法、水质指数法、AHP法、模糊评价法、灰色评价法、物元分析法等。鉴于上述方法的局限性,熵权云模型水质评价方法被引入 [9] [10] [11]。云模型在评价地震风险、水资源再生能力、空气质量、土地利用风险等多方面得到广泛应用 [12] - [22]。随着正态云模型被证明具有应用普适性,云模型被成功地运用到了自然语言处理、空间数据挖掘、智能控制、风险评估、时间序列预测、算法改进、质量评价等众多领域 [23] [24]。
由于云模型能综合考虑评价因子的多样性、评价标准的非线性、评价过程中的随机性、模糊性,采用云模型方法进行水质评价有其独特优势。而熵权法是客观确定权重的方法,相较于层次分析法等主观法而言更具精确性;故本文采用熵权云模型方法,使用山西某水库2018年1月至2020年12月期间的水质指标检测数据,对该水库水质进行分析和预测。
2. 云模型参数预处理
设U是一个用精确数值表示的定量论域,A是U上的定性概念,对于论域中的任意元素
,存在一个有稳定倾向的随机数
,我们称
为
对定性概念A的隶属度,称
在论域U上的分布为隶属云,简称云(Cloud),每一个
称为一个云滴,云则是由若干个云滴组成的 [25]。而在本文的水库水质评价中,U即为某一水质等级所对应的限值;A代表与这一等级所对应的水质概念(如等级I对应“水质优”);
则为某一次水质实测值。
2.1. 熵权法确定评价因子权重
能够获取的该水库地表水质数据主要有水温、pH值、溶解氧、高锰酸盐指数、化学需氧量、五日生化需氧量、氨氮、总磷、总氮、铜、锌、氟化物、硒、砷、汞、镉、铬(六价)、铅、氰化物、挥发酚、石油类、阴离子表面活性剂、硫化物、粪大肠菌群、硫酸盐(以SO42-计)、氯化物(以Cl-计)、硝酸盐(以N计)、铁锰、总硬度、电导率、透明度、叶绿素。
根据污染源调查和监测数据,结合水质评价参数选择的原则,本文选择溶解氧(DO),高锰酸盐指数(CODMn),化学需氧量(COD),五日生化需氧量(BOD5),氨氮(NH3-N),总磷(P) 6个水质指标作为评价因子,建立水质评价体系,根据《地表水环境质量标准》(GB3838-2002),各项因子分可为5个级别,其具体的分级标准见表1。

Table 1. Standard limits for basic items of some surface water environmental quality standards
表1. 部分地表水环境质量标准基本项目标准限值
由于各评价因子对水质评价结果的贡献有所不同,故而权重也有区别,本节根据熵权法计算各评价因子的权重,其主要根据各指标传递给决策者的信息量大小来确定权重。
设评价因子合集
,它的权重矩阵为
。
熵权法确定权重的基本步骤如下:
1) 选取
个样本,
个指标,则
为第
个样本的第
个指标的数值
;
2) 指标的归一化处理:异质指标同质化;
由于各项指标的计量单位并不统一,因此在用它们计算综合指标前,先要对它们进行标准化处理,即把指标的绝对值转化为相对值,并令
,从而解决各项不同质指标值的同质化问题。而且,由于正向指标(极大型指标)和负向指标(极小型指标)数值代表的含义不同(正向指标数值越高越好,负向指标数值越低越好),因此,对于高低指标我们用不同的算法进行数据标准化处理。其具体方法如下:
正向指标:
(1)
负向指标:
(2)
则
为第
个样本的第
个指标的数值
。为了方便起见,归一化后的数据仍记为
。
3) 计算第
项指标下第
个样本占该指标的比重:
(3)
4) 计算第
项指标的熵值:
(4)
其中
,满足
;
5) 计算信息熵冗余度:
(5)
6) 计算各评价因子的权值:
(6)
由上述计算步骤可以得到6个评价因子的权重向量为
其中的数值从左到右分别为溶解氧(DO),高锰酸盐指数(CODMn),化学需氧量(COD),五日生化需氧量(BOD5),氨氮(NH3-N),总磷(P)的权重。
2.2. 确定云模型特征参数
在2.1节已确定评价因子及评价标准,接下来确定云模型的三个数字特征:期望
,熵
,超熵
(依照文献 [22] 所提出的方法),云用这3个数字特征 [10] 来整体表征一个概念。假设对于变量V具有上下边界
,则该变量的云模型的数字特征可依照如下公式计算:
(7)
在上述公式中:
期望
表示论域空间中云滴分布的期望,熵
是定性概念不确定性的度量,超熵
即为熵
的熵,是熵的不确定性的度量,它的大小间接地反映了云滴的厚度。
、
分别为变量V的最大和最小边界;k为常数,取值依经验选取,本文中k对于不同指标的云模型分别取0.01 (对于溶解氧,高锰酸盐指数,化学需氧量,五日生化需氧量,氨氮),0.001 (对于总磷)。
3. 基于熵权云模型的地表水质评价方法
3.1. 云模型的生成
本文中我们主要使用正向云发生器生成云滴,进一步生成评价指标云模型图。正向云发生器算法步骤如下:
输入:三个数字特征
、
、
,云滴数
。
输出:
个云滴的定量值
和确定度
。
算法步骤:
1) 生成以
为期望、
为标准差的一个正态随机数
;
2) 生成以
为期望值、
的绝对值为标准差的一个正态随机数
。
称为水质评价论域中的一个云滴;
3) 按照如下公式计算确定度
,
4) 重复(1)~(2),直至产生
个云滴构成整个云为止。
根据上述算法,分别生成6个评价因子的云模型,如图1~6所示。其中以评价因子的质量浓度为横坐标,评价因子的某一实测值所对应的确定度U (通过云模型映射)则为纵坐标。
以图2高锰酸盐指数(CODMn)为例,某实测点的高锰酸盐指数为3.1 mg/L时,由正向云发生器可以得到高锰酸盐指数隶属于各水质级别的确定度分别为:UI (高锰酸盐指数) = 0.0470,UII (高锰酸盐指数) = 0.9931,UIII (高锰酸盐指数) = 0.0819,UIV (高锰酸盐指数) = 0.0156,UV (高锰酸盐指数) = 0,其中UII值最大,UIII次之,其他确定度为0,说明高锰酸盐指数为3.1 mg/L时,隶属于水质级别II类的可能性最大,隶属于III类有一定的可能,隶属于I,IV类可能极小,但是不隶属于V类。同理,由相同方法可以计算出其他评价因子的确定度,并得到相对应的确定度矩阵。
3.2. 评价综合确定度的计算
将2.1中计算所得的权重
与得到各评价因子隶属于各水质级别的确定度矩阵
相乘,即可得到各评价因子的综合确定度
,计算其各列值的综合确定度,监测点所属的水质级别为最大确定度所在的级别。下面我们举例说明评价综合确定度计算过程。
如下为2018年1月份某水库1各评价因子隶属于各水质级别的确定度矩阵
,矩阵各行分别为评价因子溶解氧(DO),高锰酸盐指数(CODMn),化学需氧量(COD),五日生化需氧量(BOD5),氨氮(NH3-N),总磷(P)隶属于不同水质级别I、II、III、IV、V类的确定度。
则各评价因子的综合确定度
为:
这表明2018年1月份某水库1水质级别为I、II、III、IV、V类的确定度分别为0.4920、0.6603、0.1050、0.0158、0,依据最大确定度原则我们可以得到此处水质级别为II类。
4. 数值结果
由第3节所述步骤,最终得到该水库近三年的水质评价结果如表2~7所示。由表格可知,2018,2019,2020这三年水质评价结果除监测断面某水库2在2020年3月、12月水质为I类外,其余均为II类,可见近年该水库水质状态总体稳定,无污染状况,且由UⅠ为0.4左右,UIII多小于0.1,可知水质中上,为II类偏I类。后期可加强水资源保护,以进一步提升水质。

Table 2. Monitoring section 1 2018 water quality level determination and water quality evaluation results
表2. 监测断面1 2018年水质级别确定度及水质评价结果

Table 3. Monitoring section 1 2019 water quality level determination and water quality evaluation results
表3. 监测断面1 2019年水质级别确定度及水质评价结果

Table 4. Monitoring section 1 2020 water quality level determination and water quality evaluation results
表4. 监测断面1 2020年水质级别确定度及水质评价结果

Table 5. Monitoring section 2 2018 water quality level determination and water quality evaluation results
表5. 监测断面2 2018年水质级别确定度及水质评价结果

Table 6. Monitoring section 2 2019 water quality level determination and water quality evaluation results
表6. 监测断面2 2019年水质级别确定度及水质评价结果

Table 7. Monitoring section 2 2020 water quality level determination and water quality evaluation results
表7. 监测断面2 2020年水质级别确定度及水质评价结果
又虽然水质最终评价结果大多II类,水质级别一致,其确定度的不同又代表了不同意义,
2018年1月、2月与2018年3月、4月相比较UⅠ更大,而UII更小,可见1、2月水质优于3、4月份。类似的我们可以得到某水库1在2018年1、2月份,2019年2、3、4、5、11月份,2020年3、12月份水质较好(UII < 0.7),2018年3、5、10月份,2019年7、9月份,2020年4、5、8、10月份水质较差(UII > 0.8)。某水库2在2018年1、2、8月份,2019年2、3、5、6、10、11月份,2020年2、3、12月份水质较好,2018年4、9、10月份,2019年7、8月份,2020年4、5、6、8、9、10月份水质较差。
在本次研究中,我们对两个采样点35个月共计70个样本进行水质评价,在运用云模型方法判定样本综合水质类别的过程中,我们也得出了对于每个指标其所属的水质类别,具体情况为:
溶解氧(DO):70个样本均属II类水质。
高锰酸盐指数(CODMn):55个样本属于I类水质,15个样本属于II类水质。
化学需氧量(COD):70个样本均属I类水质。
五日生化需氧量(BOD5):70个样本均属I类水质。
氨氮(NH3-N):37个样本属于I类水质,33个样本属于II类水质。
总磷(P):61样本个属于II类水质,9个样本属于III类水质。
综上可见,该水库对于化学需氧量(COD),五日生化需氧量(BOD5)以及高锰酸盐指数(CODMn)这三个指标,已经达到最高水质级别,只需继续保持现有水准即可;而对于氨氮(NH3-N),溶解氧(DO),总磷(P)这三个指标仍存在较大不足,水库应在这三方面进一步加强管理控制,对各指标,尤其是对于指标总磷,采取针对性治理措施,以期提升水质。
5. 结论
通过基于熵权云模型方法得到的综合确定度对该水库进行水质评价,可以看出,采用云模型做水质评价具有如下优点:
① 可以避免使用综合评分法时出现的某一评价指标偏大的情况,从而更客观合理地考量所有评价指标;
② 可以避免单一评价指标的随机性和模糊性,采用单一指标无法对水体的综合水质进行准确判断,而采用云模型方法可以通过确定度概念解决这一问题,在不同指标隶属于不同水质级别的情况下判定样本的综合水质;
③ 可以更精准详细地了解水体的水质情况,在了解水质不同级别的同时,对隶属于同一级别的水体也可以通过其对应确定度的不同来分辨其水质的优劣。
致谢
非常感谢山西省水利技术研究推广补助项目(2022GM006)与山西省国际合作基地与平台项目(20210404110)的资助,以及太原理工大学数学学院与山西能源学院能源与动力工程系所提供的支持。
NOTES
*通讯作者。