1. 引言
太浦河是连接太湖和黄浦江的主要河道,也是太湖流域阳澄淀泖区、杭嘉湖区的界河。太浦河西起东太湖边的时家港,向东穿越蚂蚁漾、桃花漾至平望北与京杭大运河相交,再经汾湖、马斜湖等大小湖荡,至南大港入西泖河接黄浦江,全长57.6 km,沿途跨越江苏省、浙江省和上海市。作为治太十一项骨干工程之一,太浦河具有防洪、排涝、供水和航运等综合功能,上游江苏段主要是作为行洪通道,而太浦河下游是嘉兴和上海两地的水源地。作为黄浦江上游常年主要供水河道,并兼顾两岸地区用水需求,在枯水年份或枯水期因太湖水位较低、太浦闸自流引水量较小、黄浦江上游水质受污染恶化时,运用太浦河泵站抽取太湖水经太浦河补充入黄浦江,以改善太浦河干流水质,提升上海市的供水水质和供水保证率 [1]。为研究太浦河泵闸引水对太浦河下游水源地水环境的影响,2014年2月~4月开展了太浦河调水改善下游水质的试验,通过控制太浦闸不同下泄量的方式,考察下游水质状况。
河流污染状况是由多个水质指标组成的复杂系统,每一个指标都可以从某一方面反映水体的污染状况,但水质指标间存在着紧密的联系,在分析过程中可能会因为指标间存在共线性问题而无法得到正确的结论。而主成分分析可以通过线性变换,将原来的多个指标组合成相互独立的少数几个综合指标来简化数据 [2] [3],找出主要影响因子,科学合理评估水体污染状况。主成分分析起初多用于社会经济学领域,近年来,在环境质量评估中逐渐得到应用 [4] [5],并且应用前景广阔,如通过主成分分析和因子分析确定权重来研究平原区地下水脆弱性评价 [6],主成分分析和地统计学理论结合起来研究农田土壤中重金属的空间分布 [7] 和海底沉积物的时空分布 [8],通过主成分分析研究河口地区有机氯农药的时空分布特征 [9],通过主成分分析研究太湖底泥疏浚前后的水环境质量 [10],主成分分析和聚类分析复合模型在水生态系统区划 [11] 和水环境管理 [12] 中的应用,应用主成分分析和其他多元统计分析对太湖、泾河、辽河等湖泊河流水体进行地表水质和富营养化状况评价 [13] - [18]。
由于太浦河站点和水质指标多,从中难以综合判断各站的水质情况,加上水文工况复杂。基于上述原因,有必要采取主成分分析方法,对太浦河干支流水质进行综合性评估,以减少人为因素的影响,使得到的结论更加科学、合理,为进一步保护太浦河水环境提供科学依据。因此,为了解数据背后隐藏的规律,采用主成分分析法,深入挖掘太浦河水文水质数据,以最少的信息丢失把众多的观测变量浓缩为少数几个因子,通过分析各个因子的时空分布和相互之间的关系,深入探讨不同水文条件下太浦河沿程污染物时空分布特征,为太浦河水环境保护与管理提供参考依据。
2. 材料与方法
2.1. 试验方案
1) 调水方案
调水试验从2月23日开始至4月25日结束。调度方案如下:太浦闸下泄流量按常态50 m3/s的基础上,阶段性按
50 m
3
/s、80 m3/s、200 m3/s和50 m3/s四种调度方案5个实测阶段进行调度,时间分别为2月23日~3月3日,3月3日~3月10日,3月11日~3月18日,3月18日~3月28日和4月16日~4月25日,调度具体如表1。

Table 1. Scheme of water diversion
表1. 水文水质监测调度方案
2) 样品采集
每个调水试验期按大、中、小潮以及涨憩和落憩安排采样。研究区域内共设置监测断面13个(如表2),其中太浦河干流(7个):太浦闸(下)、平望(西)、黎里(西)、北室、金泽、八百亩;太浦河南岸(4个):平西大桥、雪湖老桥、陶庄枢纽、丁栅闸;太浦河北岸(2个):平望运河桥、北窑港桥。监测断面采样时,主槽设左中右3条垂线,分别取表层(水面下0.5 m)和底层(河底之上0.5 m)两层水样,采样方法参见《水质采样技术规程(SL187-1996)》,水样采集后立即带回实验室分析,监测分析方法参见《水环境监测规范(SL219-98)》。采样测试自2014年2月至4月,在不同潮期进行采样测试工作,期间共885组监测数据。

Table 2. Location of water quality monitoring
表2. 监测断面设置

3) 监测指标
主要监测指标包括:水位、流量、溶解氧(DO)、高锰酸盐指数(CODmn)、化学需氧量(CODcr)、生化需氧量(BOD)、氨氮(NH3N)、总磷(TP)、总氮(TN)、石油类共10项水文水质指标。
2.2. 数据分析方法
采用主成分分析法对调水试验期间的太浦河沿线水质的时空变化特征进行分析。主成分分析法的基本思想是将原始因素或变量线性组合为若干个彼此独立的、且包含原始因素信息的新的综合因素或变量,从而对原始的变量因素进行提取和简化,使得新变量既包含原始因素或数据的主要信息,又能更集中、更典型地显示出研究对象的特征 [18]。具体分析步骤包括构建数据矩阵、计算指标的相关系数矩阵、求特征值和特征向量、计算贡献率等方面 [3]。
以上方法基于R语言统计分析计算工具实现,R是属于GNU系统的源代码开放的软件,是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具;统计分析工具;统计制图功能;通过编程语言可操纵数据的输入和输出等一系列功能。R可以提供一些集成的统计工具,并且可以提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法 [19]。近年来,有学者开始运用R语言开展相关统计分析,2012年,肖凯等运用R语言建立了分类回归树(CART)模型开展了藻类影响因素识别的应用 [20],2018年,Min Zhang等运用R语言首次建立了广义加和模型(GAMs)探讨了太湖藻类生长的驱动因素 [21]。本文使用MASS和VEGAN两个程序包,使用“princomp”函数进行主成分分析。
3. 结果与讨论
3.1. 主成分分析结果
将溶解氧(DO)、高锰酸盐指数(CODmn)、化学需氧量(CODcr)、生化需氧量(BOD)、氨氮(NH3N)、总磷(TP)、总氮(TN)、石油类8个水质指标2~4月的监测数据组成原始数据矩阵,为了去除水环境指标的量纲对计算的影响,将原始矩阵标准化,然后对这些标准化后的数据作主成分分析,计算得出了8个成分的方差贡献率,如表3所示。同时,在此基础上,建立了主成分与水质指标的关系矩阵,如表4所示。

Table 3. Importance of components
表3. 各成分方差贡献率和累计贡献率
根据各成分的方差贡献率可以看出,前两个成分的贡献率较大,其中PCI占总方差的58.57%,PCII占总方差的16.23%,前两个主成分共占总方差的74.80%,累计反映了原始数据总信息量的74.80%,起到了既能精简数据又能较完整地保持信息量的作用,提取PCI和PCII取代8个水质指标是可行的。由此,得到了两个主成分,分别为第一主成分PCI (Comp.1)和第二主成分PCII (Comp.2),其中,第一主成分又是最重要的,包含的信息最多,对其水质变化影响最大。

Table 4. Loading values of the principal components
表4. 主成分载荷值
根据特征向量得到主成分1和主成分2与各指标的关系分别为:
从主成分载荷大小来看,与第一主成分密切相关的是高锰酸盐、氨氮、总磷和总氮,它们与第一主成分的相关系数分别为−0.407、−0.406、−0.386和−0.415,均在0.4左右,说明第一主成分反映了水体的有机污染状况和营养盐水平,COD和氮磷营养盐主要来源为农业面源污染和生活污染,可能与沿线大量的农业面源污染、生活直排以及支流汇入污染有关。
与第二主成分密切相关的是BOD和石油类。尤其是石油类,与第二主成分的相关系数达到了0.775,反映了水体石油类导致的有机污染,一方面,太浦河是长湖申线航道的重要组成部分,每年船舶过境量约22万艘,产生的船舶舱底油污水约2.16万m3/a。此外,上游航运业的发展也带动了太浦河流域航运附加业的发展,航运附加业主要包括船只停靠、加油站、维修和码头等,产生的油类等污染物通过雨水冲刷或直排也会进入太浦河。
从方差贡献率可以看出,第一主成分方差贡献率58.57%,远远大于第二主成分的贡献率16.23%。因此,太浦河水质主要是由第一主成分,即由氮磷营养盐和高锰酸盐指数控制,受沿线农业面源和生活污染影响,其次受控于水体中的石油类等有机污染。
3.2. 太浦河水质时空分布特征
1) 主成分空间分布特征
对监测期间主成分得分进行空间投影,得出主成分得分在太浦河干支流上的空间分布图,同时根据主成分与水质指标的关系矩阵,将水质指标与主成分的关系以箭头的形式拟合在空间分布图上,如图1所示。
与第一主成分密切相关的是高锰酸盐、氨氮、总磷和总氮,第一主成分代表了主要的污染,以横轴表示,因此,横轴代表了主要的污染,由于第一主成分与高锰酸盐等水质指标是负相关,横轴的负向代表污染物浓度越大。第二主成分表示的是以石油类为代表的有机污染,代表次要污染,以纵轴表示,第二成分与石油类正相关,纵轴的正向代表石油类等有机污染越大。水质指标拟合箭头的方向表示,该项水质指标朝箭头方向逐渐增大。
结果表明,主要支流京杭运河和江南运河较为接近,中游地区的支流汾湖和北窑港比较接近,干流中游断面较为接近,而干流上游和下游断面较为接近,水质综合状况比较类似,此图直观的表明了不同断面水质综合状况的亲疏关系。
从不同河流的污染特征上看,第一主成分代表的高锰酸盐和氮磷营养盐等污染最严重的集中在京杭运河、江南运河等主要支流区域,大部分分布在第一主成分横轴的负向位置,从污染物变化指示箭头上看,高锰酸盐、

Figure 1. Spatial distribution of principal component score
图1. 主成分空间分布
化学需氧量、生化需氧量以及氮磷营养盐浓度均呈现较高的浓度水平,呈现较为明显的有机污染,主要源于太浦河上中游吴江地区工业生活污染以及农业面源分布密集;太浦河干流水质相对较优,基本分布在横轴的正向区域,同时也在高锰酸盐、化学需氧量等污染物浓度指示箭头的负向位置,各项污染物浓度均较小。对于第二主成分代表的石油类污染,太浦河干流污染程度相对较高,尤其干流中北室、黎里西等断面分布在纵轴的正向区域,同时也在石油类浓度指示箭头的正向区域,主要由于现状太浦河平望以西段为V级航道,平望以东段、京杭运河和頔塘为IV航道,平望和芦墟之间航运繁忙,导致该区域呈现石油类污染。
从干流不同断面的污染分布来看,第一主成分代表的高锰酸盐和氮磷营养盐等污染最严重的集中在北室和黎里西断面,高锰酸盐、化学需氧量、生化需氧量以及氮磷营养盐浓度均呈现较高的浓度水平,呈现较为明显的有机污染;太浦闸和平望西断面水质相对较优,基本分布在横轴的正向区域,各项污染物浓度均较小。对于第二主成分代表的石油类污染,北室、黎里西断面污染程度相对较高,同样太浦闸断面石油类污染相对较轻。
2) 太浦河污染物沿程分布特征
为了了解具体指标的污染特征,对污染严重的指标氨氮太浦河沿程分布及干支流情况进行了分析,沿程分布见图2~3。

Figure 2. Spatial distribution of NH3N in Taipu River
图2. 太浦河氨氮的沿程分布情况

Figure 3. Comparative analysis of NH3N between main stream and tributaries
图3. 太浦河氨氮的干支流比较
BOXPLOT分析结果表明,从上游到下游,太浦河水质沿程变化总体呈现恶化趋势:太浦闸到北室断面氨氮浓度明显上升,上游主要支流京杭运河氨氮最高达到了3 mg/L,达到了劣V类浓度水平,受京杭大运河汇入等因素影响,太浦河流经运河后黎里断面水质恶化两个类别,主要污染物NH3N浓度从II类上升到IV类,到达北室断面水质相对最差,污染物浓度达到峰值,恶化至V类水平,由于太浦河下游青浦金泽地区污染源较少,北室到八百亩断面水质略有改善,进入青浦区域之后污染物浓度略有回落。
干支流比较结果表明,支流各断面NH3N浓度显著高于干流各断面,平均浓度为1.2 mg/L,干流各断面NH3N平均浓度为0.70 mg/L,支流较干流高71%,各监测断面中,京杭运河平西大桥断面NH3N浓度最高为1.85 mg/L,较干流平望大桥断面高825%。由此可知,支流污染物的汇入是干流水质沿程变差的原因之一。
除此以外,区域污染排放强度过大也是导致太浦河沿线水质不稳定的原因。太浦河沿岸的污染主要来源于工业和城镇生活点源排放、农业面源污染和航运污染等。太浦河两岸地区工业废水占污水处理厂废污水处理量的75%以上,沿线高污染企业庞大的排污总量给区域河网带来巨大的水环境压力。此外,太浦河沿线区域还存在大量畜禽养殖、围网养殖等农业面源及未纳管的生活污染源向周边河道湖荡排污,据不完全统计,太浦河干流及两岸1 km范围内共有入河排污口20处,15处为企业排污口,其余5处为生活污水排污口。根据太浦河流域水资源开发利用现状调查评价有关成果,COD入河量3.35万吨/年,NH3-N入河量3870吨/年,其中COD主要来源是农业面源污染和污水处理厂,NH3-N主要来源为农业面源污染。
3.3. 太浦河水文水质响应关系
1) 不同调水方案主成分分布特征

Figure 4. Principal component score in different scenarios
图4. 不同调水方案下主成分分布
对监测期间主成分得分进行空间投影,得出主成分得分在不同调水方案下的差异分布图,同时根据主成分与水质指标的关系矩阵,将水质指标与主成分的关系以箭头的形式拟合在不同方案差异分布图上,如图4所示。
结果表明,同一河流中,方案I (50 m3/s)、方案II (80 m3/s)和方案V (50 m3/s且单向引水)聚集在一起,方案III (80 m3/s且单向引水)和IV (200 m3/s)聚集在一起,水质综合状况比较类似,此图直观的表明了不同水文条件下水质综合状况的亲疏关系。
从不同水文条件下的污染分布上看,同一河流中,以京杭运河为例,方案I (50 m3/s)和方案V (50 m3/s且单向引水)条件下,第一主成分代表的高锰酸盐和氮磷营养盐等污染最严重,大部分分布在横轴的负向位置,PCI最小达到−8,从污染物变化指示箭头上看,高锰酸盐、化学需氧量、生化需氧量以及氮磷营养盐浓度均呈现较高的浓度水平,低流量条件下污染较为严重;方案III (80 m3/s且单向引水)和IV (200 m3/s)水质相对较优,相对于方案I和方案V分布在横轴的正向区域,同时也在高锰酸盐、化学需氧量等污染物浓度指示箭头的负向位置,各项污染物浓度均较小。对于第二主成分代表的石油类污染,方案I (50 m3/s)条件集中分布在纵轴的正向区域,同时也在石油类浓度指示箭头的正向区域,表明低流量条件下石油类污染较为严重。
2) 不同水文条件的污染物变化
为了了解太浦河水文水质响应关系,以污染严重的氨氮为例,对不同水文条件下的污染物浓度变化特征进行了分析,如图5和图6。
结果表明,太浦河干流水质情况受下泄流量影响较大。方案I上游50 m3/s流量条件下各断面氮磷营养盐浓度较高,水质为IV类水平,方案II上游80 m3/s流量条件下各断面氨氮有所下降,当下泄流量增大至200 m3/s时,即方案IV时,水质明显改善,氨氮浓度稳定在III类水水平,全部低于1 mg/L,大部分达到了II类水标准。这是由于太浦河作为太湖流域引江济太的排水通道,水量受到流域调水的影响较大,尤其是枯水期当来水水量较小时,沿程京杭运河等支流污染物汇入干流,导致干流水质进一步恶化。而对于下泄流量同为50 m3/s的方案

Figure 5. NH3N in different scenario
图5. 不同调水方案下氨氮浓度

Figure 6. NH3N & water level in different scenario
图6. 不同调水方案下氨氮与水位比较
I和方案V以及下泄流量同为80 m3/s的方案II和方案III,从太浦河单向引水的方案干流氨氮浓度相对更低,这是由于单向引水方案可以有效抑制周边污染支流水体进入到太浦河干流中,因此,同等下泄流量的条件下,开启太浦河单向引水更有利于干流的水质提升。
比较氨氮与水位的关系发现,在不同调水方案下,太浦河干流氨氮浓度与干流水位具有较为显著的相关关系,均呈现负相关,即当干流水位降低时,各断面氨氮浓度随之升高,尤其方案III (80 m3/s且单向引水)和IV (200 m3/s)条件下更为明显,水位与氨氮的相关性更强。这是由于太浦河水位降低,水文条件不利于河网中污染物的稀释,同时,吴江地区京杭运河等污染严重的支流水体进入水位较低的太浦河干流中,造成干流污染物浓度增高。
4. 结论
1) 基于R语言利用主成分分析法,以最少的信息丢失从8个水质指标中浓缩提取了2个主成分,太浦河区域水质主要是由第一主成分,即由氮磷营养盐和高锰酸盐指数控制,受沿线农业面源和生活污染影响,其次受控于水体中的石油类等有机污染,主要源于航运及其附加业影响。
2) 研究了太浦河水质的空间分布规律。从主成分分布看,总体京杭运河和江南运河污染最为严重,第一主成分代表的高锰酸盐和氮磷营养盐等污染最严重的集中在京杭运河、江南运河等主要支流,石油类等次要污染集中在太浦河干流黎里西–北室段,京杭大运河水质显著劣于太浦河干流,是造成太浦河干流水质恶化的最主要原因。
3) 研究了太浦河水文水质关系。从主成分分布看,低流量条件下,无论第一主成分的首要污染还是第二主成分的次要污染均较为严重。当下泄流量增大至200 m3/s时,水质明显改善,氨氮浓度稳定在III类水水平;相同流量条件下,开启太浦河单向引水更有利于干流的水质提升;在不同调水方案下,太浦河干流氨氮浓度与干流水位均呈现负相关。
基金项目
上海市环保局重大科研项目《太浦河流域水环境安全与污染防控对策研究》(沪环科[2017]第6号)、上海市水务局科研项目《上海市中小河道水质评价指标体系研究》(沪水科2018-02)、上海市科委科技攻关计划项目《上海市水环境监测预警评估技术体系和决策支持平台研究与示范》(编号:17DZ1202500)。
参考文献
NOTES
*通讯作者。