基于PROSPECT模型与高光谱数据的叶片干物质含量估算研究
Study on Estimation of Leaf Dry Matter Content Based on PROSPECT Model and Hyperspectral Data
摘要: 本研究利用统计模型建立了不同光谱尺度下四种植被指数与叶片干物质含量(LDMC)之间的定量关系,这为干物质含量的精准估算提供了相应的理论支持,对监测植物的长势和健康状况也具有一定的指示意义。实验数据由PROSPECT-5模型模拟数据,LOPEX和ANGERS实测数据构成,其中模拟数据用于寻找敏感波段并据此对实测数据进行重采样,处理后的实测数据一半用于建立模型,剩余的另一半则用来验证模型的精度。研究方法是先构建LDMC敏感植被指数,接着分别对其进行光谱尺度敏感性分析,最后可以构建出20个反演模型。总的来说,波段宽度对估测LDMC的影响较小,主要是植被指数的选取会对精度产生一定的影响。为确保结论的可靠性,本研究把未参与建模的实测数据组合成三类,从决定系数R2和均方根误差RMSE两个角度分别对每个反演方程进行精度验证。相比之下用LOPEX和ANGERS数据集验证精度最具说服力,其结果表明:NDVI和RVI所构建的方程精度比较高,拟合度R2可达0.66左右;RMSE较低,约为0.0021,DVI模型的验证结果最不理想,R2只分布在(0.13, 0.25)区间,且RMSE最高,为0.0037。最终的结论是RVI (1688, 1718)模型在不同光谱尺度下估测LDMC的精度水平较高,因此该植被指数具有较好的应用前景。其中10nm为RVI模型的精度最佳光谱尺度,R2是0.6593,RMSE仅为0.002。
Abstract: In this study, a statistical model was used to establish the quantitative relationship between the four vegetation indices and the leaf dry matter content (LDMC) at different spectral scales. This provides corresponding theoretical support for the accurate estimation of LDMC, and monitors the growth and health of plants. It also has certain directive significance. The experimental data is composed of PROSPECT-5 model simulation data and LOPEX and ANGERS measured data. The simulated data is used to find the sensitive band and resample the measured data accordingly. Half of the processed measured data is used to build the model, and the remaining half is used to verify the accuracy of the model. The research method is to first construct the LDMC sensitive vegetation index, then separately analyze the spectral scale sensitivity, and finally construct 20 inversion models. In general, the band width has little effect on the estimated LDMC, mainly because the selection of the vegetation index will have a certain impact on the accuracy. In order to ensure the reliability of the conclusions, this study combined the measured data that did not participate in the modeling into three categories to verify the accuracy of each inversion equation from the perspective of the determination coefficient R2 and the root mean square error RMSE. In contrast, the accuracy of using LOPEX and ANGERS data sets to verify accuracy is the most convincing. The results show that the equations constructed by NDVI and RVI have higher accuracy and a fitting degree R2 of about 0.66; the RMSE is lower, about 0.0021. The verification results of the DVI model are the most unsatisfactory, R2 is only distributed in the interval (0.13, 0.25), and the RMSE is the highest, which is 0.0037. The final conclusion is that the RVI(1688, 1718) model has a higher level of accuracy in estimating LDMC at different spectral scales, so the vegetation index has better application prospects. Among them, 10 nm is the best spectral scale for the accuracy of the RVI model, R2 is 0.6593, and the RMSE is only 0.002.
文章引用:江健, 顾雨亭, 秦采薇. 基于PROSPECT模型与高光谱数据的叶片干物质含量估算研究[J]. 建模与仿真, 2025, 14(1): 954-968. https://doi.org/10.12677/mos.2025.141087

1. 引言

1.1. 研究背景与意义

植被覆盖地球陆地表面的约70%,是遥感观测和生态研究的核心对象。许多生态过程,如光合作用、养分循环等,都和植被生化组分有着紧密联系[1]。叶片通过光合作用将光能转化为叶片干物质(Leaf Dry Matter, LDM),其含量对植物生长、抗逆性及作物长势至关重要[2]。为进一步解释叶片干物质含量(Leaf Dry Matter Content, LDMC)对植物生长状况的影响及其在农业,林火,生态系统等方面的重要意义,需对其进行大面积、高精度的估算。传统测量LDMC的方法耗时耗力[3],且仅适用于小范围,不适用于大尺度植被区域。高光谱遥感技术的发展为LDMC的大面积、高精度估算提供了可能[4]。特别是探测干物质含量这种弱势组分时,高光谱技术的高灵敏度优势更加突显。高光谱技术除了能够规避传统测量方法的一些不足,还可以进一步提高反演精度。因此在LDMC的无损估算中高光谱技术极具应用前景[5]

高光谱遥感具有多波段、窄带宽的特点,能精准找到对干物质最敏感的波段,从而以更高的精度估算LDMC。通过基于叶片辐射传输机制的PROSPECT模型模拟的反射率光谱,可准确提取特征波段。模拟数据的优势在于只需输入部分叶片理化参数,有效地排除了外界因素引起的光谱变化,因此能够更精准地提取敏感波段。学者们已建立了多种植被指数(Vegetation Index),结合最适指数和最佳波段构建反演方程,可实现LDMC的有效快速估算。然而,野外环境复杂,需结合模拟数据和实测数据以提高模型精度[6] [7]。现有的模型中仍存在较多干扰因素,如方向、地形等,这都使得模型达不到理想精度,以满足对精度要求较高产业(如精准农业)的需求[8]。本文结合模拟数据与实测数据,首先采用模拟数据分析植被指数与LDMC之间的相关性、提取最佳波段,并借助实测数据建立模型,最后利用未参与建模的实测数据验证精度。尽管高光谱技术优势明显,但数据量大且易冗余,需进行降维处理。目前,基于高光谱数据估算LDMC的尝试虽多,但平均准确率仍有待提高,相关研究仍需继续深入。

1.2. 研究现状

以光谱绝对值(反射率)或其变换形式,或将不同波段的光谱数据组合成植被指数作为自变量,同时以LDMC为因变量,利用统计分析方法建立线性或非线性的模型。植被指数在一定程度上能够抑制非植被信息(如减少地形因子、大气衰减的影响),从而突出植被信息。目前估测鲜叶干物质含量仍存有很大难度,主要是其在短波红外波段的吸收特征易被水分覆盖,光谱响应不强。但有关研究从未因此停止,国内外学者已在这一领域做了大量工作,也总结了一些规律。

国外研究:Broge等[9]发现LDMC与Landsat数据中的中红外光谱显著相关,认为利用经验模型可从Landsat TM数据中估测冠层LDMC。Maire等[10]曾利用光谱指数法估算叶片尺度与冠层尺度的干物质含量,对比发现叶片尺度下精度较低。因而改进和发展新的光谱指数用来估算LDMC仍将是今后的研究重点。Romero等[2]分析多种植物叶片在干叶、鲜叶层次下的高光谱数据,结果表明NDMI(1495, 2305)对LDMC的估算具有很好的效果,R2是0.805;Wang等[11]选取敏感波段组合(1649, 1722)建立NDMI来估测LDMC,经验证同样具备较好的精度,R2高达0.897。国内研究:黄春燕等[12]进行了基于光谱指数的棉花干物质积累估算模型研究,经统计分析与光谱微分处理,最终建立了基于RVI和NDVI的5种模型,R2的显著水平均很高。她同时对比了RVI和NDVI所构建的模型,结果表明RVI的估测水平更高。地面实验所得结论应用到卫星遥感数据时应避免选取非大气窗口波段[13],因此他在选取敏感波段时充分考虑了水分(EWT)的干扰。王洋等[14]借助PROSPECT模型,运用改进的Sobol算法对叶片干物质含量进行光谱敏感性分析,精准提取了特征波段,构建出叶片尺度的敏感光谱指数并建立对应的模型。

2. 数据与方法

2.1. 研究数据

本研究共采用两类数据,一类是模拟数据,另一类是实测数据。其中模拟数据用于在忽略外界干扰的条件下找出相应植被指数条件下的最敏感波段,而实测数据则用于建模以及精度评价。根据模拟数据得出的敏感波段对实测数据进行重采样,处理之后的实测数据一半用于建模,另一半验证其精度。

2.1.1. 模拟数据

PROSPECT叶片辐射传输模型[15]可以模拟植物叶片光学传输的过程,能得到大量数据,充分考虑到光线在辐射传输过程中发生的不同情况,最大程度避免变量的不确定性。因此本研究使用PROSPECT模型模拟产生全波段(400~2500 nm)高光谱数据[16]。该模型以平板辐射传输模型为基础,通过折射指数、叶肉结构来描述散射过程,吸收系数表示吸收过程。该模型假设在叶片内部,光通量是各向同性的,比较适用于模拟非紧密叶片。实际研究中PROSPECT的输入参数有两种:即叶结构参数N和生化组分含量C。为研究干物质含量与叶片光谱反射率之间的关系,在输入参数范围内给定不同的叶片结构参数和生化含量,通过随机数产生10,000组输入参数,进而模拟出对应的光谱曲线得到叶片反射率ρλ和透射率τλ。PROSPECT模型的5种参数输入范围在下表1中给出。

Table 1. Ranges for each input parameter of the PROSPECT model

1. PROSPECT模型各输入参数的范围

参数

Parameter

符号

Symbol

数值

Value

单位

Unit

叶肉结构参数

N

1.5

叶片叶绿素含量

Cab

5~100

μg·cm2

叶片类胡萝卜素含量

Car

0~30

μg·cm2

叶片含水量

Cw

0.001~0.05

cm

叶片干物质含量

Cm

0.001~0.03

g·cm2

PROSPECT模型的计算公式为:(ρ, τ) = PROSPECT (N, Cab, Cw, Cm, Car),自变量的具体含义参照上表[17]。干物质包含的种类众多且很难单独表示各成分的含量,所以通常采取总的干物质含量Cm来描述这些成分。从波谱范围看:在可见光区域,反射率对干物质几乎不灵敏,此时主要是受叶绿素影响。在近红外和短波红外区域,干物质对反射率的影响才得以体现,但主要还是受到叶结构和叶含水量的影响。本文为模拟实际的植被生理状态,也通过模型对叶含水量做了合理假设。

2.1.2. 实测数据

实测数据包括LOPEX93和ANGERS03数据,它们均是含有几百种植被样本的经典数据库。植被光谱跟很多外界因素密切相关,其构成是复杂的,难以定量地去除这些因素的干扰,因此在高光谱估算植被生化组分的研究中往往选用一些权威机构所建立的波谱数据库,它们能够确保模型精度。

LOPEX93 [18]是研究高光谱反演植被生化参量的经典数据库,样本取自45种植物。该库更新于2015年3月9日,共包含330组波段范围为400~2500 nm的叶片样本。ANGERS03数据主要用于分析不同气候区的植被叶片光谱特征,源自法国农业研究院开展的叶片光学特性测量实验,样本取自39种植物。该库更新于2013年9月3日,共包含276组波段范围为400~2450 nm的叶片样本。

2.2. 研究方法

本研究利用4种形式的植被指数与干物质含量(两者均为PROSPECT模拟数据)的决定系数R2二维数组,找到4组与之对应的最佳波段组合构建敏感植被指数,进而分析植被指数光谱尺度敏感性。重采样完成后,实测数据的一半用于建立模型,另一半将组合成3类验证数据(LOPEX-165组,ANGERS-138组,LOPEX和ANGERS-303组)来综合评价模型的精度。

2.2.1. 植被指数

Table 2. General form of the four vegetation indices

2. 四种植被指数的一般形式

植被指数(Vegetation index)

形式(Form)

差值植被指数(DVI)

A − B

比值植被指数(RVI)

A/B

归一化差值植被指数(NDVI)

(A − B)/(A + B)

倒数差值植被指数(RDVI)

(1/A) − (1/B)

植被指数往往对植被长势等具有指示意义,它是光谱信号经四则运算而得出的一种简洁形式,能够定量地评价植被的信息。本研究中PROSPECT-5共有10,000条光谱曲线,将每条曲线的2101个波段分别进行两两组合,根据公式依次构建常见的四种植被指数,形式见表2

2.2.2. 带宽效应分析

对于植被,不同传感器的光谱响应不同,所以不同光谱尺度下的干物质含量反演精度不尽相同。因此在反演过程中,研究光谱指数在不同带宽下的反演能力是不可或缺的一步。

利用模型所构建得到的各类植被指数的光谱尺度均为1 nm,无法进一步评价带宽对VI与LDMC之间相关性的影响。因此有必要进行带宽敏感性分析,即研究在5种不同波段宽度上(1 nm, 5 nm, 10 nm, 20 nm, 50 nm),所构建植被指数与叶片干物质含量之间决定系数R2的变化情况。本研究拟采用PROSPECT-5数据所得到的敏感波段作为中心波段对实测数据进行高斯重采样。高斯分布函数(Gaussian distribution)是一种概率密度函数,也称正态分布。如果随机变量χ服从尺度参数为σ、位置参数为μ的概率分布,其概率密度函数即为:

f( x )= 1 2πσ exp( ( xμ ) 2 2 σ 2 ) (1)

高斯分布的概率密度函数曲线与钟形类似,因此也称钟形曲线[19]。光谱尺度敏感性分析首先利用上述函数,以1 nm带宽的敏感波段为中心波长,越接近它,重采样权重越高。

2.2.3. 模型建立

相比参数复杂的物理模型,统计模型抓住植被光谱指数的本质,本研究建立的模型是一元一次线性方程,公式如下:

y = a * x + b (2)

式中,y表示叶片干物质含量,x代表植被指数。

在四种植被指数及其各自对应的五种带宽条件下总共可获取20个反演方程,把未参与建模的实测数据组合成三类作为验证样本依次对它们进行精度评价,一般采用如下两种方法进行检验:

(1) 用模拟结果与实测值的决定系数R2来检验模拟结果与实测值的一致性,范围通常在(0, 1)区间内。其值越大,表明二者拟合度越高,模型预测水平越好[20]。公式如下:

R 2 = 1 n ( y ^ i y ¯ ) 2 / 1 n ( y i y ¯ ) 2 (3)

注:其中 y ^ i 是预测值; y ¯ 是观测值的均值;y是观测值;i = 1, 2, …, n

(2) RMSE (Root Mean Square Error),它表示观测值与真值偏差的平方和与观测次数n比值的平方根,可用来衡量观测值和真值之间的偏差。均方根误差的公式如下:

RMSE= i=1 n ( ob s i si m i ) 2 n (4)

注:其中obsi为实测值;simi为模拟值;n是样本容量,i = 1, 2, …, n

模拟结果与实测值的一致性可以参考RMSE值的大小。值越小意味着模型偏差越小,估算精度越高。

3. 干物质敏感植被指数构建与光谱尺度敏感性分析

3.1. 敏感植被指数构建

本文拟构建四种植被指数,包括DVI、RVI、NDVI和RDVI。计算出VI与LDMC之间的R2二维数组,据此可以找到每类植被指数下决定系数R2最高的一组波段组合。由该组合所构建的指数就是LDMC敏感植被指数。该过程重复4次,最终会得到四种LDMC敏感植被指数。值得注意的是1400 nm和1900 nm波段附近反射率对干物质含量不敏感,因为此时反射率主要受含水量和叶片结构的影响,而叶结构又受水分的影响[21]。所以提取最佳波段时要尽量避开对水分敏感的波谱区域,从而降低叶水分含量对本次研究的干扰。所构建的LDMC敏感植被指数中,RiRj应大致分布于叶片干物质含量敏感波谱范围(RiRj指第i和第j波段的光谱反射率)。用imagesc函数将四种植被指数的R2二维数组出图,见图1。图像中横坐标与纵坐标分别代表植被指数对应的两个波长值。结合波段组合易知,图像以对角线为轴对称,因此只需分析对角线右下方区域。颜色的变化直观地体现出决定系数R2的数值变化情况。

Figure 1. Distribution of coefficient of determination R2 for different band combinations of four vegetation indices

1. 四种植被指数不同波段组合下的决定系数R2分布图

定量构建敏感植被指数的前提是要找到R2数组中的最大值及其对应的一组波段,即提取每种植被指数中对LDMC最敏感的波段组合。从图像中只能获取R2的大致分布,却很难找到最佳波段的准确位置,因此本研究通过max函数得到R2的最大值,并借助find函数找出最大值所对应的行列号,转换后的最佳波段值参照表3。干物质含量在可见光波段光谱响应较弱,但在近红外-短波红外区域响应较强,1.75 μm,2.14 μm,2.28 μm波段附近其敏感性指数在20%以上,即在这些波段干物质含量对电磁波的吸收较强。本研究选取的四组特征波段均含有丰富的光谱信息。

Table 3. Sensitive bands for dry matter content

3. 干物质含量敏感波段

植被指数(VI)

公式(Formula)

R2最大值(Max)

DVI

R2137 − R2426

0.9442

RVI

R1688/R1718

0.9992

NDVI

(R1688 − R1718)/(R1688 + R1718)

0.9991

RDVI

(1/R1633) − (1/R1746)

0.9949

注:以DVI公式为例,R2137代表2137 nm处PROSPECT-5模拟的反射率,R2426代表2426 nm处的反射率。R2指1 nm带宽条件下DVI与LDMC之间的决定系数。

3.2. 光谱尺度敏感性分析

选取带宽1 nm的实测数据LOPEX和ANGERS作为建立模型的样本,包括303组数据,每组数据有2051个波段(注:受ANGERS数据的波段范围限制,因而研究的波段范围相应的缩小到400~2450 nm)。为探寻光谱尺度对建模的影响,首先对实测数据进行高斯分布重采样,再对其进行光谱尺度敏感性分析,即用R2来分析VI对不同带宽的敏感程度。

3.2.1. 重采样

依据不同带宽的光谱重采样权重分别对四组敏感波段进行重采样处理。如5 nm重采样时,将中心波段前后的2个波段分别赋予特定权重再求和即可。同理可获得10 nm、20 nm、50 nm各自的反射率值。四种植被指数的重采样过程大致相同,唯一区别是要改变重采样的中心波段。得到重采样的光谱反射率值后,根据表2中的指数公式再次计算不同光谱分辨率下的四种植被指数。计算后每种指数都会得到对应五种带宽的新植被指数。接着找到各植被指数与干物质含量之间的R2值便可进行带宽影响分析。

3.2.2. 带宽影响分析

经回归分析得到五种带宽条件下VI与LDMC之间的R2,结果如表4所示。

Table 4. Coefficient of determination of each index with respect to leaf dry matter content at different bandwidths R2

4. 不同带宽下各指数与叶片干物质含量的决定系数R2

植被指数(VI)

1 nm

5 nm

10 nm

20 nm

50 nm

差值植被指数(DVI)

0.1155

0.1229

0.1385

0.1638

0.1826

比值植被指数(RVI)

0.6949

0.7076

0.7083

0.7025

0.6106

归一化植被指数(NDVI)

0.6925

0.7051

0.7057

0.6998

0.6081

倒数差值植被指(RDVI)

0.2625

0.2572

0.2554

0.2704

0.2690

为直观地观察出VI与LDMC之间的决定系数随带宽的变化趋势,将表4用折线图表示以进一步分析,如下图2所示。由图可知,DVI的R2在1 nm处是谷值,决定系数与光谱分辨率成正比,50 nm处达到峰值,但也只有0.1826,相关性非常弱;RVI-10 nm是R2最大的位置,值为0.7083。1 nm、5 nm、20 nm处的R2与最大值也比较接近,相差不大。但是到了50 nm光谱尺度下,R2出现了较为明显的下降,与最大值相比低了0.0977;NDVI与RVI的变化趋势类似,R2最大值也出现在10 nm处,为0.7057;RDVI的决定系数整体偏小,大致分布在(0.25, 0.27),峰值出现在20 nm处,为0.2704。分别考虑四种植被指数与干物质含量的决定系数R2随波段宽度的变化,可以发现光谱尺度对决定系数的干扰作用不明显,即模型对光谱尺度敏感性较低,R2值的上下波动仅在0.02左右。比较明显的变动发生在50 nm的波段宽度下,四种指数20 nm到50 nm的波动依次为DVI0.0188、RVI0.0919、NDVI0.0917、RDVI0.0014,其中最大的差异也仅仅是RVI的0.0919。因此认为带宽对各植被指数所建立的模型影响不大。在同等植被指数条件下,预测水平随光谱尺度的变化不会出现明显差异。

Figure 2. Line plots of trends in R2 between four vegetation indices and leaf dry matter content

2. 四种植被指数与叶片干物质含量之间R2的变化趋势折线图

RVI和NDVI与LDMC之间的R2除了在50 nm处约为0.6,其余光谱尺度下均达到了0.7左右,表现出良好的估测能力。它们的决定系数比DVI和RDVI的模型要高很多,相比之下DVI和RDVI的拟合度R2集中分布在(0.11, 0.27)区间,说明这两类指数所建立的反演方程估测水平并不是很理想,进一步对比这两类指数,RDVI的拟合度整体要高于DVI。

4. 干物质含量估算研究

4.1. 基于植被指数构建模型

把重采样所得的植被指数作为自变量x;叶片干物质含量作为因变量y。分别选用303组VI与LDMC的数据组合然后构建模型。经数据处理四种植被指数在五种不同波段宽度下最终可得到20个干物质含量反演方程,见表5

结合表4表5可知,DVI和RDVI拟合度明显低于RVI和NDVI,但为了实验的严密性,接下来对这20个方程依次反演。得到预测的叶片干物质含量后,再利用未参与建模的实测数据验证模型精度,从而科学地评价模型的优劣性。

Table 5. Inverse equations for dry matter content at different band widths for each vegetation index (corresponding R2 against Table 4)

5. 各植被指数在不同波段宽度下的干物质含量反演方程(相应的R2对照表4)

光谱尺度/nm

DVI

RVI

NDVI

RDVI

1

y = −0.0314x + 0.0073

y = 0.2229x − 0.2253

y = 0.4616x − 0.0025

y = 0.02x + 2E−05

5

y = −0.0333x + 0.0074

y = 0.2293x − 0.2318

y = 0.4745x − 0.0026

y = 0.02x + 3E−05

10

y = −0.0371x + 0.0078

y = 0.2343x − 0.237

y = 0.4848x − 0.0028

y = 0.0195x + 4E−05

20

y = −0.0427x + 0.0083

y = 0.2404x − 0.2433

y = 0.4971x − 0.003

y = 0.0203x − 0.0002

50

y = −0.048x + 0.0088

y = 0.2634x − 0.2667

y = 0.543x − 0.0034

y = 0.0205x − 0.0002

4.2. 精度验证

为了评价所构建方程的精度,选用3类验证数据LOPEX (165组),ANGERS (138组),LOPEX和ANGERSS (303组)分别对干物质反演模型进行精度验证。它们是重采样后的3类叶片光谱反射率数据。

4.2.1. LOPEX验证数据

通过反演模型和植被指数可以得到20组干物质含量的估测值,接着从R2和RMSE两个方面来对估测结果进行评价。LOPEX的验证结果见表6,根据表中数据可以定量地将所有反演模型进行比较并找出精度指标最高的一组模型。

Table 6. LOPEX data validation results

6. LOPEX数据验证结果

光谱尺度

DVI

RVI

NDVI

RDVI

R2

RMSE

R2

RMSE

R2

RMSE

R2

RMSE

1 nm

0.1567

0.0023

0.5554

0.0016

0.5528

0.0016

0.3915

0.0023

5 nm

0.1577

0.0023

0.5713

0.0016

0.5685

0.0016

0.4086

0.0023

10 nm

0.1591

0.0023

0.5750

0.0016

0.5720

0.0016

0.4022

0.0023

20 nm

0.1591

0.0023

0.5751

0.0016

0.5721

0.0017

0.4045

0.0024

50 nm

0.1586

0.0022

0.5317

0.0018

0.5290

0.0018

0.4090

0.0023

从表中并不能直观地感受到拟合度的变化情况,为进一步分析每种植被指数类型的精度受不同光谱尺度的干扰,下面将用折线图来更直观地分析精度的波动情况,图3表示该验证条件下实测值与估测值的R2随带宽的变化趋势,图4表示均方根误差RMSE的变化趋势。从图中可以看到模型决定系数本就较高的RVI和NDVI模型在估测LDMC时同样具有良好的精度,且波段宽度的变化未对其精度产生明显影响,在50 nm处略有下降。相较之下,DVI、RDVI这两种指数建立的模型拟合度较低,DVI的R2在0.16附近,RDVI的R2较之略高,在0.4附近。两者的RMSE在(0.0022, 0.0024)区间内较为集中,其值要高于RVI和NDVI的RMSE,也同样说明它们的精度欠佳。经运算分析,本数据集的平均准确率最高为71%,最优模型在RVI-10 nm带宽条件下。

4.2.2. ANGERS验证数据

用ANGERS验证数据进一步评价模型精度,得到表7图5图6。分析图表可知,其R2和RMSE的变化趋势与4.2.1近乎一致。但就精度来说,R2整体上有了一定提高,DVI在50 nm处是0.2928,约是LOPEX精度验证结果的两倍;在RVI和NDVI条件下,相较之前均有约0.1的涨幅;RDVI在各波段宽度下均可达到0.6左右,较LOPEX验证结果增幅约为0.2。从RMSE来看,四种指数的值均有不同程度的增加:如NDVI和RVI增加了0.0009,DVI涨幅约为0.0025,RDVI为0.0008。这表明用ANGERS数据集来评价模型稳定性比LOPEX数据集的结果要差一些。经运算分析,本数据集的平均准确率最高为64%,最优模型也出现在RVI-10 nm条件下。

Figure 3. Trend plot of R2 with spectral scale between measured and estimated values under four vegetation indices (LOPEX)

3. 四种植被指数下实测值与估测值之间R2随光谱尺度的变化趋势图(LOPEX)

Figure 4. Trend plot of RMSE between measured and estimated values with spectral scale under four vegetation indices (LOPEX)

4. 四种植被指数下实测值与估测值之间RMSE随光谱尺度的变化趋势图(LOPEX)

Table 7. ANGERS data validation results

7. ANGERS数据验证结果

光谱尺度

DVI

RVI

NDVI

RDVI

R2

RMSE

R2

RMSE

R2

RMSE

R2

RMSE

1 nm

0.1086

0.0048

0.7070

0.0025

0.7026

0.0025

0.5987

0.0031

5 nm

0.1209

0.0048

0.7094

0.0025

0.7050

0.0025

0.6055

0.0031

10 nm

0.1497

0.0048

0.7115

0.0025

0.7072

0.0025

0.6145

0.0031

20 nm

0.2277

0.0047

0.7063

0.0025

0.7022

0.0025

0.6369

0.0030

50 nm

0.2928

0.0046

0.6675

0.0026

0.6640

0.0026

0.6263

0.0030

Figure 5. Trend plot of R2 with spectral scale between measured and estimated values under four vegetation indices (ANGERS)

5. 四种植被指数下实测值与估测值之间R2随光谱尺度的变化趋势图(ANGERS)

Figure 6. Trend plot of RMSE between measured and estimated values with spectral scale under four vegetation indices (ANGERS)

6. 四种植被指数下实测值与估测值之间RMSE随光谱尺度的变化趋势图(ANGERS)

4.2.3. LOPEX和ANGERS验证数据

用LOPEX和ANGERS验证数据进一步评价模型精度,得到表8。为进一步分析每种植被指数类型的精度受不同光谱尺度的干扰,用折线图来直观分析精度的波动情况,图7表示实测值与估测值的R2随带宽的变化趋势,图8表示RMSE的变化趋势。经运算分析,本数据集平均准确率最高为68%,最优模型仍出现在RVI-10 nm带宽条件下。

Table 8. LOPEX and ANGERS data validation results

8. LOPEX和ANGERS数据验证结果

光谱尺度

DVI

RVI

NDVI

RDVI

R2

RMSE

R2

RMSE

R2

RMSE

R2

RMSE

1 nm

0.1266

0.0037

0.6508

0.0021

0.6449

0.0021

0.5235

0.0027

5 nm

0.1355

0.0037

0.6567

0.0021

0.6508

0.0021

0.5320

0.0027

10 nm

0.1559

0.0036

0.6593

0.0020

0.6534

0.0021

0.5374

0.0027

20 nm

0.2098

0.0036

0.6550

0.0021

0.6492

0.0021

0.5511

0.0027

50 nm

0.2508

0.0035

0.6089

0.0022

0.6037

0.0022

0.5431

0.0027

Figure 7. Trend plot of R2 with spectral scale between measured and estimated values under four vegetation indices (LOPEX and ANGERS)

7. 四种植被指数下实测值与估测值之间R2随光谱尺度的变化趋势图(LOPEX和ANGERS)

综合考虑图7图8的R2和RMSE的变化趋势及其数值大小,可以发现其变化趋势跟前两次验证数据集的结果很接近,R2值总体表现不错,比ANGERS验证结果低,但比LOPEX的验证结果要高。RMSE值精度水平良好,比LOPEX数据高,但比ANGERS数据验证结果要低。两类精度指标都很好地表明模型比较可靠,其中10 nm波段宽度下RVI模型的精度达到了最优,R2值为0.6593;RMSE值也较低,仅为0.0020。图9是RVI-10 nm条件下干物质含量估测值与实测值之间的散点图,从中可以直观地看出拟合效果:干物质含量实测值与估测值拟合出的直线与y=x的图线基本吻合,其斜率接近于1,截距也趋近于0,表明估测水平良好。特别地,有几个散点落于第二象限,即LDMC的估测值是负值,这并无实际意义。

Figure 8. Trend plot of RMSE between measured and estimated values with spectral scale under four vegetation indices (LOPEX and ANGERS)

8. 四种植被指数下实测值与估测值之间RMSE随光谱尺度的变化趋势图(LOPEX和ANGERS)

Figure 9. Estimated versus measured fit curves for the RVI-10 nm inversion model

9. RVI-10 nm反演模型的估测值与实测值拟合曲线

在使用上述三类实测数据验证精度时,生成的R2和RMSE有一些差别,造成此现象的原因是两类数据集的量不完全一致,或他们所测的样本叶片本就有所不同。综合对比三类数据集验证精度的能力,可知R2值:ANGERS > LOPEX和ANGERS > LOPEX,RMSE值:ANGERS > LOPEX和ANGERS > LOPEX。因此使用LOPEX和ANGERS组合数据集来评价模型精度较为合理。尽管NDVI模型的R2值较RVI整体偏低,但它们最大的相差仅为0.006;两类指数的RMSE值近似,都比较低,说明模型的预测水平较稳定,受带宽影响不大。三次验证结果都表明RVI所构建的模型精度最高,能够利用RVI精准地去估测叶片尺度下的LDMC,NDVI模型的精度次之。

5. 结论与讨论

5.1. 结论

(1) 利用PROSPECT模型模拟叶片反射率进而提取敏感波段,并通过实测数据建立统计模型。从光谱尺度来看,带宽会给建模带来一定影响,首先对各类植被指数进行了光谱尺度敏感性分析。实验结果表明带宽对各植被指数所建立的模型影响较小,即在同等植被指数条件下,预测水平随光谱尺度的变化不会出现明显差异。当波段宽度从20 nm变到50 nm时,NDVI和RVI模型反演的效果稍微变差,分析它们重采样的敏感波段,发现2个波段之间比较靠近,特别是50 nm时,会有一些重叠波段一起被采样,这使得数据间相关性变高,导致拟合度下降。

(2) 波段宽度对估测LDMC的影响较小,主要是植被指数的选取会对精度产生一定的影响。结果表明RVI和NDVI在不同光谱尺度上的决定系数大部分接近0.7,理论上它们估测叶片干物质含量的能力较好。为进一步评价模型优劣,利用验证数据组合成3类样本对所构建的20个LDMC反演模型进行精度验证,对比发现较为合理的验证数据集是LOPEX和ANGERS。结果表明DVI模型精度比较差,RDVI模型精度略高于它。而RVI模型的精度在各光谱尺度下均较高。回归分析时RVI-10 nm的决定系数为0.7083,是20个模型中的最大值,表现出显著相关性。对比RVI和NDVI,同一带宽下它们的RMSE近似相同,RVI的拟合度整体略高于NDVI。

(3) 在基于PROSPECT模型和高光谱数据的LDMC估算中,RVI (1688, 1718)在所选光谱尺度下的反演方程均具有不错的精度,其中10 nm为最优带宽。这给利用统计模型估测LDMC提供了有益参考,也促进了高光谱技术在精准农业等领域的实际应用。

5.2. 讨论

(1) 本研究选取了四种植被指数,今后可以选取更多高光谱指数,如基于通用光谱模式分解算法的植被指数VIPUD (具有独立于传感器的特性),从而进一步提高模型精度;下一步还应选取不同气候区、物候期的数据来评价模型精度,以增强其普适性。此外,可以尝试基于物理机制的统计方法,即介于统计模型和物理模型之间的半经验模型,如Monte-Carlo法、神经网络法等。

(2) 多种传感器数据反演LDMC时,其光谱响应不尽相同,因此本研究着重考虑了光谱尺度对模型的干扰并对其进行敏感性分析。今后可选用更多的带宽进行测试,以期为不同光谱分辨率的遥感数据反演提供参考。为避免卫星数据的外界干扰条件,研究仅从叶片尺度下理想的模拟数据入手,找出最佳波段进行建模;实际应用主要以星载、机载的高光谱遥感数据为主,这将涉及尺度转换问题。因此在冠层尺度估测LDMC时,要考虑更多要素,如背景、叶面积指数、观测角度以及大气干扰等。这对改进估算模型,降低反演不确定性都有一定帮助。

(3) 与反演叶绿素、水分相比,目前鲜叶片层次估测干物质含量仍存有较大难度,本文最优模型的平均准确率仅为71%。叶水分含量的光谱响应强于干物质含量,且两者在短波红外波段的吸收特征有重叠部分,所以本研究在提取干物质敏感波段时避开了水的强吸收波段。此外,对等效水厚度的研究也许能间接促进对弱势组分干物质含量的研究。

参考文献

[1] 颜春燕. 遥感提取植被生化组分信息方法与模型研究[D]: [博士学位论文]. 北京: 中国科学院遥感应用研究所, 2003.
[2] Romero, A., Aguado, I. and Yebra, M. (2011) Estimation of Dry Matter Content in Leaves Using Normalized Indexes and PROSPECT Model Inversion. International Journal of Remote Sensing, 33, 396-414.
https://doi.org/10.1080/01431161.2010.532819
[3] Pajares, G. (2015) Overview and Current Status of Remote Sensing Applications Based on Unmanned Aerial Vehicles (UAVs). Photogrammetric Engineering & Remote Sensing, 81, 281-330.
https://doi.org/10.14358/pers.81.4.281
[4] 赵德华, 李建龙, 宋子键. 高光谱技术提取植被生化参数机理与方法研究进展[J]. 地球科学进展, 2003(1): 94-99.
[5] 浦瑞良, 宫鹏. 高光谱遥感及其应用[M]. 北京: 高等教育出版社, 2000: 185-228.
[6] 赵永光, 马灵玲, 李传荣, 等. 基于冠层辐射传输模型的地表反射率光谱重建方法[J]. 光谱学与光谱分析, 2015, 35(7): 1763-1769.
[7] 马文勇, 王训明. 基于高光谱分析的草地叶绿素含量估算研究进展[J]. 地理科学进展, 2016, 35(1): 25-34.
[8] Clevers, J.G.P.W. and Kooistra, L. (2011) Using Hyperspectral Remote Sensing Data for Retrieving Total Canopy Chlorophyll and Nitrogen Content. 2011 3rd Workshop on Hyperspectral Image and Signal Processing: Evolution in Remote Sensing (WHISPERS), Lisbon, 6-9 June 2011, 1-4.
https://doi.org/10.1109/whispers.2011.6080916
[9] Broge, N.H. and Mortensen, J.V. (2002) Deriving Green Crop Area Index and Canopy Chlorophyll Density of Winter Wheat from Spectral Reflectance Data. Remote Sensing of Environment, 81, 45-57.
https://doi.org/10.1016/s0034-4257(01)00332-7
[10] Lemaire, G., Francois, C., Soudani, K., Berveiller, D., Pontailler, J., Breda, N., et al. (2008) Calibration and Validation of Hyperspectral Indices for the Estimation of Broadleaved Forest Leaf Chlorophyll Content, Leaf Mass per Area, Leaf Area Index and Leaf Canopy Biomass. Remote Sensing of Environment, 112, 3846-3864.
https://doi.org/10.1016/j.rse.2008.06.005
[11] Wang, L., Hunt, E.R., Qu, J.J., Hao, X. and Daughtry, C.S.T. (2013) Remote Sensing of Fuel Moisture Content from Ratios of Narrow-Band Vegetation Water and Dry-Matter Indices. Remote Sensing of Environment, 129, 103-110.
https://doi.org/10.1016/j.rse.2012.10.027
[12] 黄春燕, 王登伟, 陈冠文, 袁杰, 祁亚琴, 陈燕, 程诚. 基于高光谱植被指数的棉花干物质积累估算模型研究[J]. 棉花学报, 2006(2): 115-119.
[13] 张佳华, 郭文娟, 姚凤梅. 植被水分遥感监测模型的研究[J]. 应用基础与工程科学学报, 2007, 15(1): 45-53.
[14] 王洋, 肖文, 邹焕成, 陆婧楠, 曹英丽, 于丰华. 基于PROSPECT模型的植物叶片干物质估测建模研究[J]. 沈阳农业大学学报, 2018, 49(1): 121-127.
[15] Jacquemoud, S. and Baret, F. (1990) PROSPECT: A Model of Leaf Optical Properties Spectra. Remote Sensing of Environment, 34, 75-91.
https://doi.org/10.1016/0034-4257(90)90100-z
[16] Feret, J., François, C., Asner, G.P., Gitelson, A.A., Martin, R.E., Bidel, L.P.R., et al. (2008) PROSPECT-4 and 5: Advances in the Leaf Optical Properties Model Separating Photosynthetic Pigments. Remote Sensing of Environment, 112, 3030-3043.
https://doi.org/10.1016/j.rse.2008.02.012
[17] 莫云华, 张文娟, 张连蓬. 基于PROSAIL模型的高光谱遥感图像模拟研究[J]. 红外, 2016, 37(9): 1-7.
[18] Hosgood, B., Jacquemound, S., Andreoli, G., et al. (1995) Leaf Optical Properties Experiment 93 (LOPEX93). European Commission.
[19] 尉迟江. 对高斯分布函数形式的推导[J]. 统计与信息论坛, 2009, 24(5): 3-6.
[20] 李哲, 张飞, 陈丽华, 张海威. 光谱指数的植物叶片叶绿素含量估算模型[J]. 光谱学与光谱分析, 2018, 38(5): 1533-1539.
[21] Aldakheel, Y.Y. and Danson, F.M. (1997) Spectral Reflectance of Dehydrating Leaves: Measurements and Modeling. International Journal of Remote Sensing, 60, 542-547.