1. 介绍
山火会引起输电线跳闸停电事故,严重影响电网的安全和稳定,山火预警不仅能保障超高压输电网安全的重要工作,也能对林火预防提供决策支持,是森林防火部门和电网公司深度关注的领域 [1] [2]。
早期的研究主要通过统计分析山火的易发性,收集历史火灾气象资料,统计气象、地形、火灾次数来确定山火气象因子的规律,但这种方法只能统计气象、地形等因子,人为、植被因子也是山火的发生的一个重要原因,但这类因子难以进行统计,因此统计分析方法对山火评估的可靠性并不理想 [3]。
随着模糊集理论的发展,Krishna Prasad Vadrevu等对地形、植被、气候、社会经济等火灾潜在影响因素进行模糊推断,利用空间模糊决策算法对专家判断进行综合,最终绘制森林火灾风险图。这项研究表明模型对识别潜在火灾热点非常有用,可以根据预测结果提取采取森林防火措施。但它的缺点是,需要借助领域专家丰富的经验意识和准确的主观判断 [4]。
逻辑回归模型良好的建模特性,既不要求变量分布正态性,并且可同时使用连续和类别两种类型的变量 [5] ,使其成为火险研究中应用最成功和最广泛的建模工具之一。
Shi等人利用逻辑回归建立了湖北省电力线路走廊野火风险评估及发生山火时线路跳闸概率的估算模型,实验结果表明,建立的逻辑回归模型可以很好地预测野火和线路跳闸的发生 [6]。
但逻辑回归只能发掘自变量和因变量之间线性的关系,忽视了两者之间的非线性关系。
随着机器学习算法在各个领域得到广泛应用,有很多学者将其引入火灾预测领域。
Binh Thai Pham等用9个空间解释变量,即海拔、坡度、坡向、年平均气温、干旱指数、河流密度、土地覆被和距离道路和居民区距离,基于贝叶斯网络(BN)、朴素贝叶斯网络(NB)的能力,决策树(DT)和多元Logistic回归(MLP) 4种机器学习方法,预测和绘制越南一个国家公园的火灾敏感性图,其中BN的预测效果最好 [7]。
机器学习解决了逻辑回归只能提取山火和山火影响因子之间线性关系的缺陷,能够根据非线性关系对山火规律进行建模。但是有研究表明,如果某个地理位置发生了山火,那么这个位置周围都是山火高风险区域,而机器学习只考虑了火点像素位置的山火影响因子,忽视了周围像素的信息 [8]。
近年来,随着深度学习的迅速发展,逐渐有学者将其引入林火预测领域。
Zhang等人提出了一种基于卷积神经网络(CNN, Convolutional Neural Networks)模型的森林火灾敏感性空间预测方法,结果证实了提出的CNN模型比随机森林、支持向量机、多层感知器神经网络和核逻辑回归基准分类器具有更高的精确度 [8]。
深度学习解决了机器学习忽略上下文信息的缺陷,通过卷积核将火点位置像素和周围像素的信息跟山火结合起来。
深度学习在山火评估领域中的应用还比较少,本文用深度学习模型进行山火评估,拓展了深度学习在山火领域的应用;普通的卷积神经网络只能提取山火的空间特征,但是山火在时间上有着较强的规律性,在春季和冬季时山火高发区,卷积网络并不能对山火时间上的规律进行提取。所以,本文提出了ConvLSTM模型来解决卷积网络忽视山火时间规律的缺陷,并在此基础上,根据山火不同影响因子对山火权重不同的规律对ConvLSTM模型进行改进,实验结果表明,验证集准确率提升5.7%。
2. 提出的方法
2.1. 模型中的ConVLSTM
在深度学习方法中最常用的时序关系模型是RNN (Recurrent Neural Network)。所有的RNN方法可以追踪一些随时间变化的状态,LSTM由于引入了记忆细胞,这种细胞可以记忆或者忘记从一个时间到另一个时间的状态,使得LSTM不仅可以像普通RNN一样能够处理短期依赖,也能够处理普通RNN不能处理的长期依赖。这种改进弥补了其它RNN的主要缺点之一:某个状态被用到之前就忘记了;同时,这种改进还提供了针对梯度消失问题的保护。
LSTM的核心是LSTM细胞,如图1所示。
由以下一组公式跟新得到:
(1)
(2)
(3)
(4)
(5)
是时间t的输出,
是在时间t的输入,各个矩阵W和向量b是在模型训练过程中待学习的权重和偏置值,
和tanh是激活函数。更多的LSTM模型细节可以在Shi et al. [9] 找到。
虽然LSTM在许多领域取得了成功,但是由于LSTM需要大量的参数权重和矩阵运算,我们利用ConvLSTM克服了这个问题 [10] ,其中矩阵乘法被卷积所替代,大大减少了训练参数数量。这个替换将公式替换为如下:
(6)
(7)
(8)
(9)
(10)
其中,
是时间t的输出,
是时间t的输入,
代表卷积运算。
ConvLSTM中,卷积运算用于输入到状态和状态到状态的转换。它比标准LSTM更好地捕捉属性的空间信息,从而更好地挖掘山火影响因子之间的相关性。
在我们的实验中,我们发现由于ConvLSTM能够专注于山火风险预测的关键领域,因此相比于一般的LSTM可以获得更好的性能。
2.2. 模型的改进
基于不同山火影响因子对山火的影响程度不同的思想,即不同通道对山火的影响不同,提出在ConvLSTM上添加通道注意力机制,让模型在训练的过程中学习各个通道对山火影响的权重,对ConvLSTM添加通道注意力机制,对模型进行了改进,改进如下图2所示。
3. 实验
3.1. 数据集
为了获得较好的实验结果,我们从NASA-FIRM网站上获取了2018~2019年的山火的火点,用于本次实验的火点数据集。如果研究区域某个地理位置存在热异常,卫星传感器则会将此热异常记录下来。另外一方面,电力部门巡检人员记录的历史火点信息也作为本研究的山火样本数据。
3.2. 山火影响因子
野火的发生并非随机而是存在一定的规律,它受到多种因素综合作用的影响。这些因素主要分为三大类:植被因素、地形因素和气象因素,也有学者称之为山火三角模型,因为山火频发也与人类活动有关,故也将人为因素考虑其中。项目拟基于植被因子、地形因子和气象因子和人为因子实现山火风险的评估及预警。
与地形相关的影响因素包括海拔、坡度、坡向。海拔越高,植被的湿度越大,可燃物的含水率和空气湿度就越大,山火发生的风险就越小。坡度的大小直接影响可燃物含水率的变化,在坡度陡峭的地区,土壤的保水能力差,水分流失严重,植被往往比较干燥,山火风险高;同时,坡度还会影响火灾的蔓延速度,对于上坡山火,上部的可燃物受到下方山火的烘烤,使得水分大量流失,加速山火蔓延。坡向的不同,植被接受阳光照射的程度、照射时常也不一样,影响植被状况和空气湿度。
天气因素包括降雨量、平均相对湿度、最高气温、最大阵风风速、最大阵风风向。降雨量和空气相对湿度的大小会影响可燃物含水率,降雨量越大,相对湿度越大,空气中的含水量越大,植被的水分流失则越少,山火风险越低。气温是野外火灾发生和蔓延的重要因素之一,当气温升高时,空气相对湿度下降,植被的蒸腾作用增强,导致可燃物含水率降低,山火风险上升。风可以带走空气中的水分,加速植被的蒸腾作用,减少可燃物含水率;另外一方面,风还能加速植被大火的蔓延和传播起。
植被因素包括植被归一化指数(NDVI)和植被含水率(FMC)。NDVI是近红外波段的反射值(NIR)与红光波段的反射值(R)之差比上两者之和。NDVI的范围是[−1,1],因为不同地表对近红外波段和红光波段的反射率有较大差异,所以可以通过NDVI来判断地表覆盖物。
植被含水率对植被着火的难易程度直接相关,与此同时影响火势蔓延速度。有研究文献表明第7波段的归一化红外指数(NDII7)可以用来表征可燃物含水率 [11]。因此,本研究从数据的可获得性考虑,采用NDII7来代替可燃物含水率。
由于人类工业化活动加快,进入林区和使用森林的人数不断增加,对森林的影响加剧,道路建设加重了沿路的毁林开荒用火,山火由此而诱发。村庄一般依附在山区,再村庄人类活动频繁,对于祭祀、烧荒等活动很可能会引发山火。我们选取了距离道路的距离、距离河流距离、距离村庄的距离来表征人类活动对山火的影响。
通过对山火影响因子的调研,本实验最终根据文献选取了15个山火影响因子:天气数据(降雨量、相对湿度、最高气温、最大风速、最大风速风向);遥感数据(地表温度、归一化植被指数、归一化红外指数);地形因素(高程、坡度、坡向、土地类型);人为因子(距道路距离、距居民地距离、距河流距离)。详细数据描述如表1所示。
3.3. 模型训练
首先,根据火点的日期和经纬度提取火点位置上的山火影响因子的图像块,各个山火影响因子的图像块作为图像的一个通道,这个多通道图像将作为模型的输入,图像块的各个通道是各个山火影响因子(图像的一个通道为一个山火影响因子,即数据集中图像有15个通道),同时火点标签记为1;另外随机提取相同的非火点个数,并提取非火点对应日期和经纬度各个山火影响因子的图像块,形成多通道图像,同时标记非火点为0。
接着,将上一步提取到的火点和非火点的数据集输入到ConvLSTM模型分类器进行训练验证,其中80%的数据作为训练集,20%的数据作为验证集。实验结果如表2和图3所示。

Table 2. Experimental results before model improvement
表2. 模型改进前的实验结果
(a)
(b)
Figure 3. Experimental results before model improvement
图3. 模型改进前的实验结果
对模型进行改进后,即对输入X和h进行全局平均池化得到统计特征(也就是在输入的每个通道上求平均,得到一个shape = (通道数,1,1) = (15, 1, 1)的统计特征),得到X和h的统计特征后,再将这两个特征在通道上进行拼接,得到通道注意力权重,最后再将这个通道注意力权重和输入X(t)加权求和,得到一个新的X~,将X~作为模型的输入进行训练。实验结果如表3和图4所示。

Table 3. Experimental results after model improvement
表3. 模型改进后的实验结果
(a)
(b)
Figure 4. Experimental results after model improvement
图4. 模型改进后的实验结果
对比实验结果表明,在两个模型都训练150epochs的情况下,Att-ConvLSTM模型训练集的准确率是高于ConvLSTM模型的,并且训练集的loss值也更低,说明在训练集中预测误差更小,模型拟合的更好。ConvLSTM模型对山火验证集的准确率为0.7,loss值为0.572,改进的通道注意力ConvLSTM模型的验证集准确率为0.757,loss值为0.584。在相同的实验条件下,Att-ConvLSTM的loss值比ConvLSTM的loss值更小,说明Att-ConvLSTM对数据集的拟合程度更高,而且并没有出现过拟合的情况。可以得出实验结论:通道注意力机制通过自适应的调整不同山火影响因子对山火的权重有效的提升了模型的识别能力,使泛化能力更强。
模型训练完成后,可以根据输电走廊的天气、植被、地形、人为因子进行山火评估。其中天气可以从电网上的传感器或者气象站,植被数据则基于遥感卫星通过波段运算得到,地形和人为因子是静态因子,在短期内不会发生大的改变。将山火影响因子输入模型,模型将输出一个0~1的山火风险概率值。这个概率值代表这当前区域发生山火概率的可能性,概率越大,发生山火可能性越大,电网单位对山火风险高的区域及时发布山火预警。
4. 总结
本文结合卫星火点和电网历史监测火点,调研山火影响因素得到15个山火影响因子,提出了一种基于深度学习的输电走廊山火评估预警模型,根据ConvLSTM能够提取山火在时间上的规律性,提出用ConvLSTM识别山火。另外本研究从不同山火影响因子对山火的影响程度不同的角度出发,在此模型的基础上对模型结构进行了改进,对ConvLSTM添加通道注意力得到Att-ConvLSTM模型。对比实验表明,改进后的模型可以更加准确地预警山火,通道注意力对山火的识别有很好的作用,改进的模型能更准确地对输电走廊的山火进行评估,提高了电网单位对突发山火的预警防范能力。
基金项目
广东工业大学创新创业项目(xj202111845521)。
NOTES
*通讯作者。