1. 引言
太阳风是太阳向外辐射的带电粒子流,其携带的磁场变化会对地球磁场产生影响,进而产生地磁扰动。Kp指数是衡量地磁扰动强度的重要指标。磁暴可能会影响无线电波的传播,从而干扰地面通信和卫星信号,这可能影响导航卫星系统的精确度,以及手机和卫星电视的信号质量。同时,强烈的磁暴可能会对电力传输系统产生影响,增加输电线路的电流负荷,有时甚至可能导致变压器或其他电网设施损坏,引起电力中断。煤矿作为重要的能源产业,其生产过程中的电子设备及电力供应安全性至关重要。Kp指数用于量化太阳风与磁层相互作用产生的全球地磁扰动的严重程度。Kp指数是数作为网络的输入。不过,可以找到更多与Kp相关的参数,以提高网络预测结果的相关性。此外,还可以引入粒子群优化等更多算法来优化神经网根据分布在世界各地的13个地磁站的K指数确定的[1]。Kp指数从0到9,以三等分表示(共28个值) [2]:
00, 0+, 1-, 10, 1+, ..., 8-, 80, 8+, 9-, 90
Kp指数分类如下:0~2为平静,2~3为扰动,3~4为活跃,4~5为小型磁暴,5~6.5为大型磁暴,6.5以上为严重磁暴。
目前,官方Kp指数的发布存在两周的延迟,不能满足空间气象服务的实时要求,同时过长的发布延迟,也无法满足煤矿安全预警的及时性。因此,需要更加精准及及时的预测方法。
Kp指数的实时预测已有两种方法。一种是创建Kp指数短期预测模型,以太阳风特性为输入,提前30分钟左右预测Kp指数。神经网络是这种方法的应用基础。由于Kp指数的预测精度在很大程度上取决于太阳活动的强度,因此不可能以一致和连续的方式预测Kp指数。另一种方法是根据地磁站的实时监测信息,建立一定的Kp指数估计算法来预测Kp指数。如果采用第二种Kp指数预测方式,构建过程会更加困难。此外,它还需要使用众多地磁站的监测数据[3]。
利用隆德空间气象模型可以创建一个实时预测空间气象及其影响的神经网络模型[4]。隆德空间天气模型的一个模块是开发一个神经网络模型,其中一些模型已用于实时运行并运行多年,能够进行三小时的实时预测。本文主要在其模型的基础上,通过优化测试数据及算法,调整神经网络权重,以达到更精准的预测效果,缩短预测周期,从而使其对煤矿用电子设备的影响更及时,能够更早做出预警。
2. 神经网络模型
Figure 1. A simple multilayer feedforward neural network using the backpropagation algorithm has a three-layer structure: an input layer, a hidden layer, and an output layer. Suppose there are two inputs x1 and x2, a hidden layer of size 2 and an output. Where “Inputs” denotes the input data, “v” denotes the input weights and “w” denotes the weights of the hidden layer neurons
图1. 一个使用反向传播算法的简单多层前馈神经网络具有三层结构:输入层、隐藏层和输出层。假设有两个输入x1和x2,一个大小为2的隐层和一个输出。其中,“Inputs”表示输入数据,“v”表示输入权重,“w”表示隐藏层神经元的权重
采用多层前馈网络作为神经网络模型。前馈神经网络是最基本的神经网络类型,神经元分层排列,每个神经元只与前一层的神经元相连[5]。层与层之间没有反馈,因为每一层都只接收上一层的输出并输出到下一层[6]。本项目采用多层感知模型。我们采用反向传播算法来训练网络。当出现第n个训练实例时,网络的实际响应(a(n))在统计意义上更接近应用的期望响应(d(n))。
(1)
其中,N是训练集中包含的样本总数。
该方法根据这一反馈来修改后继层的每个连接权重,以降低误差值。广义三角法则决定了神经元i和神经元j之间的突触权重修正:
(2)
梯度
决定权重空间的搜索方向,n是学习率参数。
经过多次反复训练后,网络通常会达到计算误差最小的程度。关于确定Kp值的一些经验性研究发现了太阳风参数与Kp指数之间的关系。
如图1所示,描述了一个使用反向传播网络的简单多层前馈网络。
网络性能主要通过以下数值来衡量:平均绝对误差、均方根误差和相关系数。
所有观测值偏离算术平均值的绝对值的平均值称为平均绝对误差。使用平均绝对误差可以避免误差相互抵消的问题,因为它真实地反映了实际预测误差的大小[7]。
对于一组数据{x1 ,x2 ,...,xn },平均绝对偏差公式为:
(3)
其中,m(x)是这组数据的平均值。
另一种测量方法是均方根误差,其计算公式为:
(4)
相关系数的计算公式为:
(5)
我们期望RMSE非常低,相关系数接近1。
3. 数据准备
通过空间物理数据设施(SPDF)网站下载了12年的太阳风参数和行星磁层Kp指数。训练数据为期11年(1982年至1992年),测试数据为期一年(1995年)。太阳风参数和Kp指数均以小时平均值表示。由于太阳风参数不是连续的,某些时间点的数据是缺失的。为了提高网络的准确性,我们采用了两种方法来解决这些问题。第一种方法是直接删除缺失数据。如果相邻三个太阳风参数中的任何一个有缺失值,那么在设计和测试网络时就不会使用相应时间的完整数据集。另一种方法是使用线性插值法填补太阳风参数的缺失数据。
为获得最佳数据形式,以每小时平均值和三小时平均值对数据进行了训练和测试。
3.1. 训练集和验证集
网络的输入层是时间t的太阳风参数BZ、n和V。网络的输出层是时间t + 3的Kp值。网络训练的目标是使其具备提前三小时预测Kp值的能力。由于太阳风参数有缺失值,而且kp值都是以三小时为增量计算的,而太阳风参数都是一小时值,因此尝试了两种方法处理数据。第一种是直接删除太阳风参数缺失值对应的Kp值,另一种是使用线性插值法填补太阳风参数的缺失值,然后求取三小时的平均值,以达到与网络输出参数Kp一致。两种方法的结果和选择将在文中讨论。每个数据集又分为两个相等的子集:训练集和验证集。训练集在训练阶段用作网络输入/输出,验证集在后续验证阶段用于找到最佳网络架构。
Figure 2. Comparison graph of data before and after filling by linear interpolation. The top graph is before filling and the bottom graph is after filling
图2. 通过线性插值法填充前后的数据对比图。上图为填充前,下图为填充后
3.2. 测试集
下载了1995年一年的太阳风参数和Kp值作为测试集。测试集主要用于验证网络的性能,并作为优化网络的基础。测试集数据的格式与训练集数据的格式一致,即间隔一小时或间隔三小时,以确保网络的统一性。
4. 已有的工作
文献证实了Kp指数与太阳风参数之间的相关性(见,例如,[8]-[10])。为了发现太阳风参数与以Kp指数衡量的磁层活动之间的相关性,已经进行了一些实证研究[11]。与预测相比,这些研究主要侧重于近距离预测,常用的关系式为[3]。
(6)
其中
是八个日Kp值的总和,而
是太阳风速度的日平均值,单位为千米/秒。给出了常数C1和C2的不同值。Pudovkin等人(1980年) [12]采用nT为单位的IMF参数Bz、
和V的日平均值,单位为102 km/s。评估了这一关系:
(7)
针对不同的时间采样率,研究了下载数据中Kp指数与三个太阳风参数之间的线性关系。如图4对此进行了描述。绿线表示[KP、V]之间的相关性,蓝线表示[KP、-Bz]之间的相关性,红线表示[KP、n]之间的相关性。太阳风速和Kp之间的相关性相对较高,这是因为在大多数低活动期,V和Kp都相对较低且稳定。这些相关性是纯线性的,而神经网络训练过程的目标是提取太阳风特征与Kp指数之间的非线性相关性。
如图3所示,三个太阳风参数与Kp值的总体相关性表明,在t时刻,[Bz、n、V]与Kp(t+2)和Kp(t+3)的相关性更好。因此,该网络以时刻t的太阳风参数为输入,以时刻(t+3)的Kp值为输出,提前3小时预测Kp。
Figure 3. Linear relationship between the Kp index and the time difference between the three solar wind parameters and the downloaded data
图3. Kp指数与三个太阳风参数和下载数据之间的时间差之间的线性关系
5. Kp预测
网络训练和优化
太阳风参数单元构成神经网络的输入层,而预测的Kp值则是输出层的单个单元。
首先,将从网站上下载的含有缺失值(以“NaN”表示)的太阳风参数作为输入,并将三小时后的Kp值作为输出来训练网络。如图4显示了神经网络目标和输出之间的线性回归图。
很明显,原始数据和神经网络的回归性能并不理想。对于预测集,网络的RMSE为1.1596,相关系数为0.613,MAE也为0.816。神经网络的预测效果不佳。由于该网络显然无法准确预测测试集中太阳风参数值缺失的情况,因此该网络预测的许多数据误差非常大。此外,网络训练过程需要大量迭代,网络训练效果不佳。因此,有必要对太阳风参数进行优化。
第一个方案是处理数据,以提高网络性能。对于太阳风参数缺失的时间,包括Kp在内的所有数据都将被剔除。换句话说,只要三个太阳风参数中的任何一个在时间t有缺失值,就会从训练集和测试集中删除时间t的[Bz、n、V]和Kp。如图5显示了神经网络目标和输出之间的线性回归图。
Figure 4. Linear regression plot of target to output
图4. 目标相对于输出的线性回归图
Figure 5. Regression relationships for the test set. The network is trained after removing missing values
图5. 测试集的回归关系。该网络在去除缺失值后进行训练
结果表明,网络性能显著提高。对于测试集,网络的RMSE为0.9952,相关系数为0.754,MAE为0.82。如图6显示了神经网络测试集的预测Kp值和实际Kp值的比较。由于剔除了一些太阳风参数和Kp值,因此数据不再是连续的或时间序列的。对于连续性好、参数全面的数据,该网络可以提供准确的预测,而且易于设置。然而,当处理连续数据并要求保持数据的时间序列时,该网络就从根本上不合适了。因此,该网络在本项目中的应用极为有限。
Figure 6. Comparison of Predicted KP Values and Actual KP Values for the Neural Network Test Set
图6. 神经网络测试集的预测KP值与实际KP值的比较
优化数据的第二种方法是使用线性插值来填补缺失值。如图2显示了插值前后的数据。使用这种方法可以确保数据的连续性和时间性。不过,这种方法会略微降低数据之间的相关性。如果缺失值过多,或者数据集的开头或结尾有大量缺失值,相关性就会受到很大影响。插值有多种方法,但在这里我们使用线性插值,这是最简单的方法,而且可以保留一定的线性相关性。这可以通过“fillmissing”插值函数来实现。为了训练和测试神经网络,我们以一小时为间隔对太阳风参数和Kp值进行了插值。如图7描述了神经网络目标和输出的线性回归图。
Figure 7. Regression relationship for the test set. The network was trained after linear interpolation of the missing values
图7. 测试集的回归关系。该网络是在对缺失值进行线性插值后训练出来的
结果表明,与未进行缺失值优化的网络相比,性能有了明显提高。与去除缺失值的网络相比,性能基本相同。对于测试集,网络的RMSE为0.9565,相关系数为0.758。此外,MAE为0.77。如图8显示了神经网络测试集Kp预测值与实际值的对比。在所有情况下,该网络在预测Kp值方面都优于去除缺失值后训练的网络。当太阳风参数缺失时,经过插值也能更准确地预测Kp。
Figure 8. Comparison of predicted KP values with actual KP values for the neural network test set. The network was trained and tested after linear interpolation to fill in missing data
图8. 神经网络测试集的预测KP值与实际KP值的比较。该网络在经过线性插值以填补缺失数据后进行了训练和测试
Figure 9. Fitness variation curves in genetic algorithms
图9. 遗传算法中的适应度变化曲线
预测值与实际值的对比图显示,当Kp值过低(Kp < 1)或过高(Kp > 6)时,Kp预测的准确性不高。当Kp值介于1和6之间时,预测更为准确。分析其原因,这是由于训练集中有太多Kp值介于中间的示例。要解决这个问题,必须训练两个网络,分别预测高Kp和低Kp。而本项目则在此基础上进行了扩展,采用遗传算法进行优化,只用一个网络就能实现更准确的预测。
Figure 10. The regression relations for the GA-BP network’s test set
图10. GA-BP 网络测试集的回归关系
Figure 11. Comparison of predicted and real Kp values for the GA-BP network test set
图11. GA-BP 网络测试集的预测 Kp 值与实际 Kp 值的比较
该网络主要使用遗传算法来优化前馈神经网络各层之间的权重和偏置值,称为GA-BP网络[13]。通过使用默认参数对神经网络的结果进行反向传播,寻找理想的权重和偏置结果作为网络参数[14] [15]。遗传算法的适应度曲线如图9所示。在整个算法执行过程中,均方根误差的变化主要体现在图中的适应度上。网络总共迭代了50次。可以看出,随着均方根误差的迅速降低,算法的执行产生了较好的优化效果。
使用GA-BP神经网络对该数据集进行了训练和测试,并得出了预测结果。如图10和图11显示了该网络的回归图和预测结果对比。
结果显示,与不经过优化的网络相比,GA-BP网络具有更高的相关系数、更低的RMSE和MAE。该网络预测集的RMSE为0.9425,相关系数为0.778,而MAE为0.76。虽然没有训练两个网络分别预测高Kp和低Kp,但由于遗传算法的优化,整体相关性提高了。在比较优化前后的两个网络的各种结果图时,可以确定与之前的研究相比,GA-BP网络能满足实时预测的相关性要求。它可用于实时Kp预测,并具有更好的预测效果。
6. 与煤矿安全相关性
上述内容已经通过预测的方法,提前预知地磁扰动的到来,为煤矿设备、电力安全运行提供预防手段。为了降低地磁扰动对煤矿设备安全性的影响,还可以采取以下应对措施:
1) 加强设备维护:定期对煤矿设备进行维护检查,确保设备处于良好状态。对于易受地磁扰动影响的设备,应加强防护措施,提高设备的抗干扰能力。
2) 提高通信质量:采用高质量的通信设备和技术,提高通信信号的稳定性和可靠性。在地磁扰动期间,可以采用备用通信方案,确保通信畅通无阻。
3) 改进电力系统:研发具有更高抗干扰能力的电力输送系统,提高煤矿生产的安全性和效率。
4) 加强安全管理:加强煤矿安全管理,提高员工的安全意识和操作技能。在地磁扰动期间,加强安全巡查和监测,及时发现和处理安全隐患。
预测地磁扰动对设备的影响,结合上述方法,有助于煤矿企业提前评估风险并采取相应的预防措施。例如,在地磁扰动预测为强烈的情况下,煤矿企业可以暂停对关键设备的操作,或者对设备进行额外的保护和加固,以减少地磁扰动对设备造成的损害。此外,预测还能帮助煤矿企业合理安排生产计划,确保在地磁扰动期间能够维持生产的正常进行。
7. 结论
地磁扰动作为一种自然现象,其发生频率、强度以及持续时间曾难以预测,但其对煤矿设备安全性的影响却不容忽视。预测地磁扰动是降低其对煤矿设备安全性影响的关键。通过监测太阳活动、地球磁场变化等数据,结合先进的预测模型,我们能够较为准确地预测地磁扰动的发生时间、强度和影响范围。这样的预测能够为煤矿企业提前制定应对措施,避免或减轻地磁扰动对设备造成的损害。
第5节的结果表明,通过两种网络都实现了Kp的准确预测。网络A仅对数据进行了处理。在对缺失值进行线性插值填充后,对网络进行了训练和测试。对于测试集,网络的RMSE为0.9565,相关系数为0.758,MAE为0.77。网络B优化数据的同时优化算法。该网络对缺失值进行线性插值,然后使用遗传算法进行优化。网络测试集的RMSE为0.9425,相关系数为0.778,而MAE为0.76。
相比于Boberg已有的模型,通过遗传算法,将两个模型综合为一个,具有更高的运行效率。同时,对比其0.76的相关性及0.96的均方根误差,本模型有更高的相关性与更低的误差。优化数据并使用遗传算法的网络已经可以带来更准确的预测结果。对于三小时平均值的太阳风参数和Kp值的数据集,模型可大大提高预期值与实际值之间的相关性。
该项目在某些方面还有待改进。例如,进一步研究如何缩小均方根误差值,并将更好的相关性转化为更精确的数值预测结果。
未来工作的重点是开发更准确的单时刻预测。以下过程有助于改善这一状况。在数据集方面,由于本项目主要基于Boberg等人的工作,因此只引入了三个太阳风参络。