1. 引言
地下洞室的建设广泛存在于矿山开采、隧道工程、核废料储存等多个领域,在这些工程中[1],爆破施工作为一种常见的开挖方式,往往会对周围岩体产生显著的物理损伤[2]。爆破损伤区的岩体力学性质,尤其是弹性模量,直接影响到地下洞室的稳定性、承载力以及后期的结构安全[3] [4]。弹性模量作为衡量岩体刚度的重要物理参数,能够反映岩体在外力作用下的变形特性。精确获取爆破损伤区的弹性模量,对于合理评估洞室的稳定性和优化后续设计至关重要。
传统的弹性模量测定方法一般依赖于现场勘测和实验室试验,常见的手段包括静力加载试验、压缩试验、应变测试等。这些方法需要通过取样和现场测试获得岩体的物理特性。然而,由于地下洞室爆破施工过程中岩体受力复杂[5],且传统实验受环境、时间和成本等因素限制,往往难以准确、全面地反映损伤区的实际情况[6]。此外,岩体在爆破后的损伤机制与应力场分布具有高度的不确定性[7],传统方法难以捕捉到爆破过程中的动态变化,因此急需一种新的、更加精准和高效的手段来实现损伤区物理参数的快速预测。
随着现代测量技术的发展,现场的实时监测手段,尤其是地震波传播[8]、应力应变监测[9] [10]、地质雷达[11]等技术,使得能够在施工过程中实时获取大量与弹性模量相关的测量数据。通过在爆破损伤区布设测点,收集岩体的应变、应力、波速等数据,可以为研究损伤区弹性模量的变化提供更加精确的实测数据。这些数据在空间和时间上分布广泛,呈现出强烈的非线性特征,因此,如何从这些复杂的现场数据中提取出有用信息,成为了目前研究中的一大挑战。
近年来,人工智能,特别是神经网络技术的迅猛发展,为解决这一问题提供了新的思路。神经网络作为一种经典的监督学习算法,具有强大的非线性拟合能力,能够在输入数据与目标输出之间建立起复杂的映射关系。其强大的自学习能力使其能够自动从大量的历史数据中捕捉到隐藏的规律,而不依赖于人为的假设或简化模型。通过输入测点的现场数据,神经网络能够预测爆破损伤区的弹性模量折减,克服了传统方法中的局限性,并能有效适应不同地质条件下的变化。
本研究旨在利用神经网络,通过对现场测量数据的深入挖掘,建立测量数据与爆破损伤区弹性模量折减之间的非线性映射关系。首先,通过在爆破损伤区的不同位置布设测点,实时获取位移变形数据,并将其作为网络的输入特征。训练神经网络,建立起输入特征与弹性模量之间的关系。最终,经过训练的神经网络可以在新的施工环境下,根据实时数据准确预测损伤区的弹性模量,从而为工程设计和安全评估提供可靠的力学参数支持[12]。
与传统的物理实验方法相比,神经网络方法具有显著的优势:首先,通过现场实时数据进行预测,避免了昂贵的实验费用和时间消耗;其次,神经网络能够自动适应不同地质条件下的复杂变化,具有较强的泛化能力;最后,通过不断积累数据和优化模型,该方法能够提高预测精度,提供更加精细化的弹性模量预测。基于神经网络的弹性模量预测方法,能够有效提高地下洞室爆破施工中损伤区物理参数的确定精度,为工程实践提供了具有较强实用价值的技术手段[13]。
通过本研究,有望能够为地下洞室爆破施工中的损伤区物理参数的预测提供一种新的技术途径,推动智能化地质监测技术在地下工程中的应用,提升工程设计、施工和安全管理的科学性和可靠性。同时,本研究为后续相关领域的研究提供了新的思路,并为其他复杂地质环境下的岩体力学性质预测提供了参考。
2. 神经网络预测算法
神经网络(Neural Networks, NN)是一种通过模拟生物神经系统的结构和功能来进行信息处理的数学模型[14]。近年来,神经网络算法在模式识别、回归分析、函数逼近等领域取得了显著成果,尤其适用于处理具有复杂非线性关系的大规模数据集。在地下工程中,神经网络被广泛应用于弹性模量等力学参数的预测,其主要优势在于能够自动从大量的历史数据中提取特征,并建立起输入数据与目标输出之间的非线性映射关系[15]。
2.1. 神经网络的基本原理
神经网络的核心由大量的节点(神经元)组成,通常分为输入层、隐藏层和输出层。每个神经元通过加权和激活函数处理输入信号,生成输出信号,并传递到下一层神经元。网络通过层次化结构和激活函数的组合实现数据的非线性变换[16]。典型的神经网络结构包括多层感知机(MLP)、卷积神经网络(CNN)、递归神经网络(RNN)等,其中多层感知机(MLP)及其变种最常用于回归预测问题[17] [18]。神经网络的基本计算过程如式1所示:
(1)
其中,
是输入信号,
是连接权重,
是偏置项,
是激活函数,
是输出信号。通过调整权重和偏置,神经网络可以学习到输入与输出之间的关系。
2.2. BP神经网络
反向传播神经网络(Backpropagation Neural Network, BP神经网络)是一种前馈神经网络,它由多个神经元层级构成,包含输入层、多个隐藏层和输出层[19]。BP神经网络的训练过程通常通过反向传播算法实现,这一过程主要包括以下几个步骤:
(1) 前向传播:输入数据通过输入层传递到隐藏层,经过激活函数的非线性变换后,最终传递到输出层得到预测结果。
(2) 误差计算:输出层的预测结果与实际值之间的差异通过损失函数计算得到误差,常见的损失函数包括均方误差(MSE)和交叉熵。
(3) 反向传播:通过链式法则计算误差相对于网络权重和偏置的梯度,并将这些梯度反向传递至网络的各个层。
(4) 权重更新:通过梯度下降算法根据计算出的梯度信息更新神经网络中的权重和偏置,最终实现最小化损失函数的目标。
BP神经网络能够在大量数据训练的过程中逐步调整参数,学习到输入数据与输出结果之间的复杂关系。特别是对于复杂的非线性问题,BP神经网络表现出了强大的学习能力。在地下洞室爆破施工过程中,爆破损伤区的弹性模量折减是影响结构安全性的重要参数[20]。由于弹性模量与岩体的力学特性之间存在复杂的非线性关系,传统的物理模型往往无法直接提供准确的预测结果[21] [22]。BP神经网络,能够通过大量的现场位移监测数据进行训练,自动捕捉数据中的规律性,从而有效地预测弹性模量折减[23]。具体而言,神经网络通过输入层接收现场测量数据,经过多个隐藏层的非线性变换,输出弹性模量折减的预测值。在训练过程中,网络不断优化权重和偏置,以最小化预测结果与真实值之间的误差。由于神经网络能够处理大量的多维数据,且不依赖于显式的物理模型,因此它非常适合应用于地下工程中复杂的力学参数预测。
3. 训练数据集的建模和生成
3.1. 拉丁超立方体采样
拉丁超立方体采样(Latin Hypercube Sampling, LHS)是一种常用的高效采样方法,广泛应用于高维输入空间中的实验设计和模型训练中[24] [25]。其主要优势在于能够均匀覆盖多维输入空间,从而提高采样的效率和模型训练的稳定性。特别是在需要通过有限样本来探索高维复杂空间时,拉丁超立方体采样方法能够有效减少采样过程中的冗余和偏差,确保样本点的代表性[26]。拉丁超立方体采样的基本原理是将每个维度的输入空间划分为若干等分区间,然后在每个区间内随机选择一个点,确保每个区间中仅有一个点被选中。与传统的蒙特卡罗采样方法相比,LHS能够在保证每个维度均匀覆盖的同时,避免了采样点的集中现象[27]。具体而言,LHS的采样过程可以通过以下步骤进行:
(1) 输入空间划分:假设需要采样的输入空间是一个D维空间,每个维度的取值范围为
。首先,将每个维度的范围[ai, bi]均匀划分为N个等间隔的区间。即对于第i维度,划分出的区间如式2所示:
(2)
(2) 在每个维度上随机选择采样点:在每个维度的N个区间内,随机选择一个点,并确保每个区间仅有一个采样点,每个维度都会生成N个采样点。
(3) 对采样点进行排列:为了避免采样点的冗余和集中,拉丁超立方体采样会将每个维度的采样点进行随机排列,确保了不同维度之间的采样点在各区间内均匀分布。
(4) 组合多维采样点:将每个维度的采样点进行组合,形成一个N × D的采样矩阵,其中每一行代表一个多维样本点。
通过以上过程,拉丁超立方体采样可以生成一个包含N个样本点的采样集,且这些样本点在D维输入空间中分布均匀,避免了传统随机采样可能出现的偏差和不均匀性。相较于传统的蒙特卡罗采样方法,LHS方法能够在较少的采样点下更好地覆盖输入空间,提高模型的训练效率。在高维输入空间中,LHS能有效减少采样点的冗余,提高计算资源的利用率。LHS能够确保每个维度的输入空间均匀覆盖,避免了偏向某些区域的现象。这使得LHS在构建输入集时具有更高的代表性,能够更好地反映输入空间的全貌。另外,LHS方法对于高维、复杂的输入空间尤其适用。在许多实际问题中,输入空间可能具有多个复杂的交互作用,LHS能够通过均匀的采样方式揭示这些潜在的关系。
在本研究中,LHS方法被用来生成输入空间的样本集,作为神经网络训练的输入数据。输入空间的每一维对应于地下洞室爆破施工影响的周围不同区域岩层。通过LHS采样,能够确保采样点在所有可能的取值范围内均匀分布,从而使得神经网络能够学习到输入特征之间的有效关系,提高预测精度。同时还可以有效避免过度集中采样,确保模型能够在全局范围内进行训练而不是仅仅依赖于某些局部区域。这对于后续的神经网络模型的推广性和准确性具有重要意义。
3.2. 有限元模型的建立
有限元模型采用了宽150 m、高100 m的土体作为计算主体,在土体内部开挖出一个宽50 m、高50 m的巨大地下洞室。计算前,地下洞室已开挖50 m,其余部分采用分区域开挖的方式进行(如图1所示)。模型使用库伦莫尔本构模型[28],土体单元为C3D8R实体单元,结构衬砌则采用三维壳单元。土体底部施加三方向位移约束,侧边施加X方向位移约束,土体前后边界则采用Y方向位移约束。为体现爆破开挖施工对周围岩层的影响,对掌子面前方的岩层进行分区块给予弹性模量的折减,共设置了掌子面背面区域、前部拱顶、后部拱顶、前部拱墙、后部拱墙共五个区域的弹性模量折减(如图1所示)。折减系数通过拉丁超立方体采样确定。模型采用静力计算,设置了两个静力分析步:第一步施加重力荷载以给土体提供初始应力,第二步对需要爆破开挖的岩体施加生死单元相互作用。分别在掌子面中心、掌子面顶部岩体、洞室顶部、洞室墙壁设置位移数据提取点,实时提取爆破开挖施工对周围岩层的影响。提取的数据结合掌子面周围岩层的物理性能折减作为神经网络的训练集,其中岩层的位移数据为训练集的输入集,而岩层分区弹性模量的折减系数为训练集的输出集。
Figure 1. Schematic diagram of the finite element model
图1. 有限元模型示意图
3.3. 神经网络训练数据生成
基于LHS方法,生成了1500组弹性模量折减数据,涵盖了地下洞室开挖过程中五个关键区域:掌子面背面区域、前部拱顶、后部拱顶、前部拱墙和后部拱墙。这些数据均匀分布在整个输入空间中,为进一步的有限元计算提供了可靠的基础。结合Python对ABAQUS有限元软件的二次开发,通过将这1500组弹性模量折减数据输入模型,计算了1500个地下洞室开挖模型,并在开挖过程中获取了多个关键监测点的位移数据,包括掌子面中心、掌子面顶部岩体、洞室顶部和洞室墙壁。图2~6分别为前部拱墙、后部拱墙、前部拱顶、后部拱顶和掌子面背面区域的弹性模量变化与洞室变形的散点图。从图中可以清晰地观察到,利用拉丁超立方体采样方法生成的数据点在横坐标上的分布是均匀的,这确保了模拟结果的广泛性和可靠性。
Figure 2. Relationship between the reduction of elastic modulus of the front arch wall and the deformation of the cave monitoring point
图2. 前部拱墙弹性模量折减与洞室监测点变形的关系
Figure 3. Relationship between the reduction of elastic modulus of rear arch wall and deformation of cave monitoring point
图3. 后部拱墙弹性模量折减与洞室监测点变形的关系
Figure 4. Relationship between reduction of elastic modulus of front vault and deformation of cave monitoring points
图4. 前部拱顶弹性模量折减与洞室监测点变形的关系
Figure 5. Relationship between the reduction of elastic modulus of rear vault and deformation of cave monitoring points
图5. 后部拱顶弹性模量折减与洞室监测点变形的关系
Figure 6. Relationship between elastic modulus reduction in the back area of the tunnel face and deformation of monitoring points in the cavern
图6. 掌子面背面区域弹性模量折减与洞室监测点变形的关系
在不同区域的弹性模量变化对洞室变形的影响分析中,前部拱墙、后部拱墙和前部拱顶的弹性模量变化对洞室变形的影响并不显著,尤其是在后部拱墙和前部拱顶区域,散点数据的分布未呈现出明显的趋势。这可能是因为这些区域的弹性模量变化对整体结构的刚度影响相对较小,导致其对洞室变形的贡献有限。相比之下,前部拱墙的弹性模量变化对洞室墙壁的变形影响较为显著,表明该区域的岩层刚度变化对结构的稳定性有一定的影响。然而,后部拱顶和掌子面背面区域的弹性模量变化对洞室变形的影响却十分明显。在这两个区域,所有监测点的数据点呈现出较为明显的趋势,尤其是掌子面背面区域,对洞室变形的影响最为突出。这种现象可能与该区域的岩层结构、爆破施工过程中的应力集中以及地质条件等因素密切相关,表明这些区域在地下洞室的施工和运营过程中较为脆弱,容易受到较大程度的变形和损伤。值得特别注意的是,在地下洞室的爆破施工过程中,后部拱顶和掌子面背面区域通常是最先受到影响的区域,且这些区域的损伤程度往往较大。因此,在地下洞室的计算和施工过程中,必须高度关注这两个区域的岩层形态及其弹性模量变化,提前进行充分的分析和评估,并采取有效的加固措施,以预防地下洞室在开挖过程中出现严重的变形失控现象。这不仅有助于提高施工安全性,也能有效延长地下洞室的使用寿命。
4. 地下洞室爆破施工损伤区物理参数的神经网络预测模型
神经网络预测模型采用BP神经网络,网络结构包括一个4维度的输入层、5维度的输出层以及20层的隐藏层[29] (如图7所示)。模型的训练采用贝叶斯神经网络推理,能够为预测提供置信区间或不确定性评估,通过引入先验分布,对网络权重进行正则化,有助于避免过拟合。
Figure 7. Schematic diagram of neural network structure
图7. 神经网络结构示意图
Figure 8. Training results of the neural network prediction model
图8. 神经网络预测模型的训练结果
图8和图9展示了神经网络预测模型在训练过程中的表现,通过目标值(弹性模量折损系数)从0到1的变化,可以清晰地观察到数据点在预测模型中的分布特征。
Figure 9. Test results of the neural network prediction model
图9. 神经网络预测模型的测试结果
随着目标值的逐步变化,所有数据点的分布呈现出类似于X染色体的交叉形态,这种分布表明数据的模式具有一定的复杂性和挑战性。具体来说,数据点被划分为两部分,两部分之间有一定的交叉重叠区域,同时又保持着相对明显的线性分布趋势。这样的分布特征表明,尽管存在一定程度的噪声或不确定性,模型依然能够识别出潜在的规律性。尽管存在交叉,数据分布大体上仍呈现线性关系。这表明弹性模量折损系数的变化与输入特征之间的某种线性或近似线性依赖。尽管数据存在噪声或其他扰动,神经网络能够有效捕捉到这些模式。从训练数据集和测试数据集的误差𝑅可以看出,训练集和测试集的R均在0.75以上。R值是衡量模型预测精度的一个重要指标,值越接近1,模型的预测能力越强。0.75以上的R值表明,模型能够较好地预测目标变量的变化,并且能够有效地捕捉到数据中的关键特征。值得注意的是,训练集和测试集的误差表现接近,说明该神经网络模型具有良好的泛化能力,能够在新的数据集上表现出稳定的预测性能。
尽管模型的预测精度较高,但交叉分布的数据结构可能表明存在不同的隐含模式,为了进一步分析和分类数据结构。如图10绘制了预测模型对每一个输出变量的预测误差统计图。可以发现后部拱顶和掌子面背面的预测误差很大程度地集中在20%以内,表明对后部拱顶和掌子面背面两者的预测精度较高。前部拱墙的预测误差集中程度一般,后部拱墙和前部拱顶两块区域的误差集中程度很差,0%~50%内均有较为明确的分布。结合前面分析发现,后部拱墙和前部拱顶的弹性模量折损对洞室变形的影响并不显著,另外地下洞室爆破施工对后部拱墙和前部拱顶的影响也较为微弱。
基于此考虑剔除后部拱墙和前部拱顶,仅保留前部拱墙、后部拱顶和掌子面背面作为模型的输出。如图11、图12所示,剔除后部拱墙和前部拱顶两个输出项后,数据点的分布显著地集中在拟合线两侧,X状交叉分布消失,取而代之的是更加紧密且规则的线性分布。
表明模型在剔除部分输出项后,能够更好地捕捉到数据的核心规律,减少了原本存在的噪声和复杂性。同时,训练误差R达到0.98以上,测试误差也提高至0.97,显示该模型在预测精度上取得了显著提升,具有非常高的预测准确性和稳定性。
通过该训练好的模型,可以利用现场监测点位获取的实际变形数据,反向推算并精确预测开挖施工过程中对周围岩层的影响程度。该模型预测的影响范围主要集中在后部拱顶、掌子面背面以及前部拱墙区域,具体包括爆破面正前方和正上方的区域。这一预测结果与实际工程中的经验观察高度一致,验证了模型不仅在理论上具有较高的精度,而且能够成功映射到实际工程中的应用场景,为实际工程决策提供了可靠的依据。
Figure 10. Error distribution of the prediction model
图10. 预测模型的误差分布图
Figure 11. The training results of the prediction model after removing the rear arch wall and the front arch
图11. 剔除后部拱墙和前部拱顶后预测模型的训练结果
Figure 12. Test results of the prediction model after removing the rear arch wall and the front arch
图12. 剔除后部拱墙和前部拱顶后预测模型的测试结果
5. 模型对比与评估
如图13所示,基于SHAP值对五个输出变量:前部拱墙、后部拱墙、前部拱顶、后部拱顶及掌子面处的弹性模量折减,分别与四个输入变量(洞室顶部、洞室墙壁、掌子面中心及掌子面顶部的位移)进行了相关性分析。分析结果表明,后部拱顶与掌子面背部区域的弹性模量折减与围岩变形具有较强的相关性,说明这些区域对围岩稳定性影响显著。前部拱墙与围岩变形的相关性居中,而后部拱墙和前部拱顶的弹性模量折减对围岩稳定性的影响相对较弱。进一步来看,后部拱顶的材料强度对掌子面顶部围岩稳定性具有明显影响;前部拱墙与掌子面材料强度则对洞室顶部的围岩稳定性影响较大。SHAP分析的结论与神经网络预测模型结果基本一致,均表明钻爆施工影响主要集中在后部拱顶、掌子面背面及前部拱墙区域,尤其是掌子面正前方及正上方的围岩区域。
SHAP分析量化了各输入变量对弹性模量折减的影响强弱,明确了不同部位围岩变形对结构响应的敏感性区域。该方法为地下洞室钻爆施工引起的围岩扰动机制提供了更直观、可解释的量化依据,有助于优化结构设计与施工控制策略。
(1) 前部拱墙
(2) 后部拱墙
(3) 前部拱顶
(4) 后部拱顶
(5) 掌子面
Figure 13. SHAP analysis results of the neural network model
图13. 神经网络模型的SHAP分析结果
为更全面评估不同回归模型在预测地下洞室爆破施工损伤区域物理参数中的表现,本文选取了BP神经网络、支持向量回归(SVR)、随机森林(RF)、K近邻(KNN)和XGBoost五种模型进行对比,分别采用决定系数(R2)、均方根误差(RMSE)与平均绝对误差(MAE)三种指标进行评价。如图14所示,柱状图量化了各模型的具体得分,其中BP神经网络在R2上取得最优,XGBoost则在RMSE和MAE上表现突出,显示出强大的误差控制能力。相对而言,KNN模型在各项指标中表现稍弱,可能不适合处理该类具有复杂非线性关系的地下工程问题。雷达图(图15)进一步反映了模型在各评价指标下的综合性能,图形越接近外围表示表现越佳。从图中可以看出,BP神经网络在所有指标中表现最为均衡,尤其在R2和误差控制方面更具优势,显示出良好的拟合能力与泛化性能。综合考虑模型性能与适用性,本文最终选用BP神经网络作为损伤区弹性模量折减预测的核心方法。该模型不仅在拟合精度上表现突出,而且能够有效揭示输入变量与目标响应之间的非线性关联性,为地下洞室爆破损伤评估提供了高效且可靠的技术手段。
Figure 14. Histogram of model performance
图14. 模型性能柱状图
Figure 15. Model performance radar chart
图15. 模型性能雷达图
6. 结论
为提高地下洞室施工损伤区物理参数的预测精度,本文提出了一种基于拉丁超立方体采样(LHS)和神经网络的损伤区物理参数预测模型。通过拉丁超立方体采样方法结合有限元计算,生成了高效的训练样本集,并利用神经网络模型对数据集进行训练,实现了对损伤区弹性模量变化的精确预测。研究结果表明:
(1) 基于LHS和神经网络的预测模型能够有效捕捉地下洞室爆破施工过程中损伤区岩体的弹性模量变化,与传统方法相比,具有更高的预测精度。
(2) 通过对目标值(弹性模量折损系数)的变化及模型训练过程的分析发现,剔除后部拱墙和前部拱顶两个输出项后,模型的预测精度显著提升,训练误差和测试误差分别达到0.98和0.97以上,表明后部拱墙和前部拱顶岩层性能变化对整体影响较小。
(3) 后部拱顶和掌子面背面区域的弹性模量变化对洞室变形的影响十分明显,在地下洞室的施工和运营过程中较为脆弱,容易受到较大程度的变形和损伤。
综上所述,本文提出的损伤区物理参数神经网络模型不仅能够有效捕捉开挖施工的影响规律,还可以为实际工程提供了可靠的预测工具,为优化施工方案和保障工程安全提供了科学工具。
基金项目
中国电建五局科研项目,基于稳定控制的高边墙地下洞室开挖施工技术研究2021-03-034。
NOTES
*第一作者。
#通讯作者。