1. 引言
人工神经网络(Artificial Neutral Networks, ANNs)由大量相互连接的神经元构成,通过控制神经元间的连接强度对信息进行处理。将BP算法引入ANNs得到的BP神经网络在气象方面应用较晚,与传统数值预报模式相比,BP神经网络应用于天气预测,降低了实施过程的复杂程度,减少了数据的限制条件,提高了预测的准确率,因此更加符合人们的需求。曹兴锋 [1] 建立了一个前馈性BP神经网络,采用变梯度的方法对长江流域导致小麦赤霉病的气象进行了相关分析,得到了有效准确的预测结果,对控制该地区小麦赤霉病发病提供了理论指导。又有部分学者在BP模型的基础上,通过改进其输入层输入因子的方式提高BP模型的预测精度。例如:作者 [2] 在BP模型输入层中加入划分算法将降雨径流分为汛期和非汛期,改进后的模型对降雨径流量的预测准确率明显提高。
神经网络的训练是一个复杂的过程,并且随着网络权值以及训练样本集的变化,会导致网络训练结果随机性较大且容易陷入局部极值,因此部分学者开始尝试针对BP神经网络的缺点对其进行改进并运用于各个领域的预测。例如:艾洪福 [3] 在BP神经网络模型中加入了遗传算法建立了GA-BP预测模型,并对长春市PM2.5含量进行仿真;陈笑 [4] 建立了遗传算法优化的BP神经网络模型对地下水埋深进行模拟和预测,并使用RMSE、NSE、MAPE三种评价指标进行模型评估,最后以蒙城县为例进行仿真;袁俊杰 [5] 在其文章中建立了BP、GA-BP、PSO-BP三种模型对平流层风场风速进行预测,结果表明优化后的BP神经网络预测效果优于单一BP模型预测,并且加入粒子群算法的优化效果略好于加入遗传算法;谢梦蝶 [6] 运用遗传算法优化BP神经网络建立了股指预测模型,经实证研究表明优化后的GA-BP模型预测误差小于BP模型并且其收敛速度也有所提高。赵智 [7] 运用GA-BP神经网络对某地PM2.5的值进行预测仿真;杨云 [8] 运用GA-BP神经网络对供暖期的空气指数进行预测分析;张鹏达 [9] 运用GA-BP、BP神经网络分别对城市的空气质量进行预测仿真,以上文献均说明加入遗传算法或者其他改进算法降低BP神经网络模型预测误差是可行且有效的。
本文建立了一个自适应遗传算子优化的BP神经网络的气温预测模型,主要针对BP神经网络对阈值、权值敏感的缺点,与此同时提高其收敛速度。然后分别用BP和GA-BP种模型对日照市近年来的气温进行模拟训练及预测,分析对比其结果,显然加入自适应算子优化BP神经网络降低了单一BP神经网络模型的预测误差,具有实际应用价值,可以用于长期天气预报的气象需求,对于预防某些气候灾害提供参考。
2. 基本理论
2.1. BP神经网络
BP (back propagation)神经网络 [10] 是ANNs中运用较广泛的一种网络模型,其数学模型如下图1:
Figure 1. BP neural network mathematical model
图1. BP神经网络数学模型
具体算法过程如下:
1) 样本数据正向传输,经过输入层后加权输送给隐含层,然后隐含层各神经元汇总所有的输入,再通过转移函数产生某种输出,并通过下一层连接权重加权由输出层输出。
BP神经网络隐含层中第i个神经元的输出为:
输出层中第k个神经元的输出为:
式中,n为输入层节点数,式中,n为输入层节点数,pj为输入层第j个神经元的输入,a1i为隐含层含层节点i的输出,a2i为输出层节点k的输出,w1ij为节点i和节点j的连接权值,w2kj为节点i和节点k的连接权值,b1i为隐含层节点i的阂值,b2k为输出层节点k的阂值,f1(.)和f2(.)分别为隐含层和输出层的传递函数。
2) 比较期望输出与实际输出之间的误差。
误差函数为:
3) 误差反传阶段,需将误差送回,反向依次调整各连接层之间的权重并反复学习训练,一直循环直到输出层输出相对满意的结果。
2.2. 遗传算法理论
遗传算法(Genetic Algorithm, GA) [11] 是建立在自然选择和基因遗传学原理的基础上发展而形成的一种进化算法。其基本思路为根据待优化问题的目标函数设计一个适应度函数E(w)然后对优化问题的参数按照一定的规则进行编码得到初始种群,接着对种群进行评价、遗传操作。这样经过多代进化,得到适应度最好的个体作为问题的最优解,其中适应度值的好坏评估使用神经网络的实际输出值与期望输出值之间的均方差(MSE)。函数公式如下:
式中ti为第i个训练样本的网络输出值,ai为相应的期望输出值,N为训练集的规模。
3. 预测模型算法设计及气温预测模型建立
3.1. 预测模型算法设计
BP神经网络训练学习的过程实际是一个通过不断调整其参数而降低输出误差的过程,加入自适应遗传算子优化意在进一步降低输出误差。故遗传算法优化神经网络的主要步骤分设计BP神经网络的结构,设计GA的参数,BP模型预测三步。其算法 [12] 流程如下图2。
Figure 2. Genetic algorithm optimization of BP neural network algorithm program diagram
图2. 优化GA-BP神经网络算法程序图
1) 种群初始化。个体编码中运用实数编码,设置训练进化代数以及迭代次数等参数,随机产生初始种群。
2) 获取个体评价函数。其中评价标准由MSE确定。
3) 选择运算。按照个体适应度值,采用轮盘赌法。
4) 交叉运算。
自适应算子位置交叉:
自适应算子速度交叉:
5) 变异运算。
自适应算子位置变异:
自适应算子速度变异:
3.2. 气温预测模型设计
3.2.1. 数据选择及预处理
日照市位于东经118˚25'~119˚39',北纬35˚04'~36˚04'之间,东临黄海,西接临沂市,南与江苏省连云港市毗邻,北与青岛市、潍坊市接壤,隔海与日本、韩国相望。地处温带,年平均气温全12.7℃,属典型的暖温带湿润季风区大陆性气候,四季分明,冷热季和干湿季的区别明显。本文选取日照市2000年1月到2018年12月共19年的逐月气象相关数据(来自中国气象网),在对大量影响因素做主成分分析降维筛选后选择月平均风速、平均海平面气压、降水量、降水天数、平均能见度、最大持续风速、最低温度作为影响因子。MATLAB仿真过程中,2000~2015年气温相关数据用于模型仿真训练,参与仿真训练的数据充足且特征简单,故仿真结果不易出现过拟合及欠拟合现象,2015~2018年的数据用于仿真预测。文中对输入数据做归一化处理,最后再对输出数据做反归一化处理以提高神经网络模型的数据处理效率。具体方式如下:
式中,xi为输入向量P的第i维分量值,
为xi归一化后的分量值,ximin为训练样本空间中输入向量第i维分量的最小值,ximax为最大值;yi为输出向量T的第i维分量值,yimin和yimax分别为训练样本中输出空间第i维分量的最小值和最大值。
部分归一化数据见表1。
3.2.2. 隐含层选择
对在神经网络预测模型的构建中,包括7个输入参数(月平均风速、平均海平面气压、月降水量、月降水天数、月平均能见度、最大持续风速、最低温度),1个输出参数为月平均气温,样本数为228,种群规模为60,进化代数为60,训练迭代次数100,学习率为0.1,动量系数为0.8,训练目标误差设置为0.001。
不同隐含层节点数对应的网络输出误差性能不同,隐含层的节点数 [13] 根据经验公式
确定。式中表示输入层节点数;表示输出层节点数,取1到10之间的任意常数,误差性能由平均方差MSE衡量。表2为模型在输入层节点数为7,输出层节点数为1时,隐含层节点数n与MSE的关系,易知,当隐含层节点数为10时输出误差性能最强,故隐含层节点数取10。此时BP神经网络拓扑结构图如图3。
Table 2. The number n of hidden layer nodes and the relationship between the MSE
表2. 隐含层节点数n与MSE的关系
4. 仿真结果
在MATLAB对山东省日照市的气温相关数据仿真过程中,得到BP、GA-BP神经网络训练误差变化曲线(图4、图5),它们分别在迭代次数为3、2时输出性能达到最佳,此时,BP模型的输出误差为0.00131,并未达到期望输出误差,但加入了自适应遗传算子的BP模型的输出误差为0.00048722,达到并超出了期望输出误差。明显自适应遗传算子的加入在提高了神经网络收敛速度的同时改善了模型的预测性能。
Figure 4. Prediction error performance of BP
图4. BP预测误差性能曲线图
Figure 5. Prediction error performance of GA-BP
图5. GA-BP预测误差性能曲线图
图6、图7分别为BP、GA-BP神经网络的气温仿真预测,显然,在GA-BP模型预测中大多数测试样本的真实值比BP模型更接近预测值,也可以说GA-BP预测模型的准确度要高于BP模型。
图8,图9分别给出了BP、GA-BP神经网络的仿真预测误差曲线。由这两个曲线图我们不难看出BP模型的预测误差区间为[−3.5, 5),GA-BP的气温预测误差区间为(−1.5, 4),从而不难分析出GA-BP预测误差范围小于BP模型,也可以说加入自适应算子的GA-BP模型预测效果优于BP模型。继续对两种模型做进一步精确评估得到表3。
由表3容易看出BP、GA-BP两种模型对日照市2015~2018年月平均气温的预测精确程度,这说明加入遗传算法的BP神经网络的初始权值和阈值更加合理,并且对神经网络收敛速度慢的缺点有所改善,因此加入自适应算子优化遗传算法使得BP模型预测精度逐渐增加,这有力的说明了文中的优化算法是有效且合理的。
Figure 9. GA-BP model prediction error
图9. GA-BP预测误差曲线
Table 3. Evaluation of the prediction results of both models
表3. 两种模型的预测结果评估
致谢
本论文从选题到完成,从内容到格式,从标题到标点,每一步都是在孙小淇导师的悉心指导下完成的。在写作过程中遇到了很多问题,正是老师的耐心指导,使得问题都得以解决。在此,谨向导师表示崇高的敬意和衷心的感谢!其次,感谢我的同窗好友刘倩,正是她的帮助和鼓励,论文得以顺利完成。感谢我的家人,他们给予我支持和鼓励,使我克服困难。最后,我还要感谢在我学习期间给我极大关心和支持的同学,同时也感谢杂志社编辑对我的直接和间接的帮助。
基金项目
山东省自然科学基金(ZR2019PA007)。