1. 引言
金属的疲劳度是指材料在承受交变应力或循环应力时,能够承受的最大应力值、是机械部件设计和失效分析所需的最重要和最基本的数据,超过这个值,材料将发生疲劳破坏。随着人们对静力破坏规律的了解,材料结构因超过极限强度而出现的破坏已较为少见,而有80%~90%的工程结构破坏是由金属疲劳引起[1]。而钢作为一种广泛应用于建筑业、工业、机械制造业以及日常生活中的金属,其疲劳强度受多种因素影响,包括材料成分、冶炼和加工工艺、表面状态以及应力幅值和频率。但由于疲劳测试的成本(和时间)极高,并且疲劳失效往往会造成衰弱的后果,因此准确预测钢的疲劳强度在材料科学中对一些先进技术应用具有特别重要的意义[2]。
多年来在工程应用中积累了大量关于工艺-性能关系的数据。虽然这些数据无助于理解疲劳的基本过程,但可用于在有限材料范围内对性能进行插值预测。随着计算机性能的快速提高和软件的发展,几十年来提出了许多机器学习算法。在传统方法中,我们必须从众多算法中选择合适的学习算法来求解一个问题,并从数据库中的许多特征中选择解释变量。这种传统方法在各个领域都取得了成功的预测。
国内外现已有如下结合了机器学习算法对钢疲劳进行预测的研究:张旭泽等人通过引入GB、RF和SVM算法,尝试提出一种基于机器学习的疲劳寿命预测方法[3]。申建国等人基于有限元模拟结果结合神经网络模型对试验钢的疲劳寿命进行预测[4]。Agrawal等人使用Weka软件建立了一个机器学习模型来预测高强度钢的性能[5]。Yu通过贝叶斯推理计算了高强度钢的材料参数[6]。Zhang等人采用神经模糊网络预测了不锈钢的疲劳强度[7]。胡等人将贝叶斯方法与高斯过程回归结合,评估了钢的概率疲劳裂纹扩展情况[8]。Amiri等人利用人工神经网络(ANN)预测了低碳钢点焊接头的抗拉强度和疲劳行为[9]。Yang等人对合金钢材料进行了特征选择,并建立了包含Mn、Ni、Cr和Si等元素的模型,以优化疲劳强度,提供用于在线预测钢合金疲劳强度的数据驱动模型[10]。
尽管大量实验已经证明了机器学习在预测钢疲劳工作中的成功,但疲劳强度的预测精度低于抗拉强度和硬度等其他力学性能的预测精度。这可以通过以下事实来解释:疲劳涉及比静态机械性能更复杂的微观结构、应力和环境之间的相互作用。而且当样本数量不足或在使用大量热处理工艺参数、成分来预测疲劳强度等极值特性却缺乏记录时,这些方法很难建立准确的钢疲劳度预测模型。疲劳预测需要一种更复杂并且准确的方法。
BRB是Yang [11]等人提出的一种模型,它有效地利用了来自工程实践的小规模数据[12],并结合定性专家知识与定量数据,展示了强大的建模能力。BRB是一种非线性建模方法,可以表达各种形式的不确定信息,包括随机性和无知性。BRB是一种基于IF-THEN [13]规则的建模方法,具有较强的因果推理能力。这种方法融合数据驱动模型和白盒模型的优点,可以提供可靠且可解释的预测结果[14]。现已广泛应用于航空航天[15]、安全评估[16]、故障检测[17]等各个领域。
本文合理设计BRB的多层结构,提出一种基于多层BRB (Multilayer Belief Rule Base, MBRB)的钢疲劳预测模型。
2. 问题描述
本文提出一种多层BRB (Multilayer Belief Rule Base, MBRB)的钢疲劳预测模型的方法适用于钢的疲劳度预测。主要解决了以下问题:
数据稀缺是材料科学与工程的一个主要问题[18]。疲劳建模领域的可用数据通常特别稀缺、异质且不完整,因为时间和成本密集型表征工作使用不同的基础测试标准。此外,模型的泛化性被认为是在各种专业领域应用ML技术的另一个主要限制[18]。因此本文建立了结合专家知识的多层MBRB钢疲劳预测模型。对影响钢疲劳的要素数据集进行主成分分析,分别选取了钢材化学成分、上游加工细节、热处理条件中影响因素最大的数个特征,并建立了合适的MBRB模型进行钢疲劳的预测。推理过程如(1)所示。
(1)
其中
表示多层BRB性能分析的结果,
代表上一层子BRB的结果,
表示多层BRB系统中的参数集,
为最后一层BRB的融合函数。
3. 基于MBRB的钢疲劳预测模型
随着工业发展和需求的提高,钢疲劳度对于建筑业、工业、制造业安全具有重大意义,具有可解释性的钢疲劳预测模型,能够有效预测钢疲劳度,以避免潜在危险的发生。
在本章中,3.1节定义了多层MBRB的钢疲劳模型,3.2节使用了P-CMA-ES对钢疲劳预测模型的参数进行了优化,3.3节描述了钢疲劳预测模型的推理过程。
3.1. 定义多层MBRB的钢疲劳模型
BRB的规则通常由领域专家基于经验知识和系统模型的历史数据确定,专家通过确定带有置信分布若干条规则重要参数的初始值,将专家知识镶嵌到规则中组成置信规则库。多层BRB系统是由若干个子规则库组成,每个子规则库由一定数量的规则组成,其中规则基本结构如[19]:
(2)
式中:
表示第e个子规则库的第k条规则;
为属性输入;
表示属性输入参考值(
);y表示输出结果,作为下一层的输入信息;
表示输出结果的参考等级;
表示相对于参考等级的置信度(
);
表示规则权重;
表示属性权重。
多层BRB模型结构图如图1所示,将系统的所有输入属性划分为n个子规则库,
表示为在第j个规则库
中第i个属性输入,
表示为在第j个规则库的输出,子规则库的输出作为下一层规则库的输出,不断迭代直至到达状态
[20]。
3.2. 参数优化
在BRB中参考值的最优情况下,参数(包括规则权重、置信度和属性权重)的优化至关重要。即使这
Figure 1. Structural diagram of the multi-layer BRB model
图1. 多层BRB模型结构图
些参数稍有差异,也会显著影响BRB的预测精度。在目前的研究阶段,许多高性能算法被用模型的优化过程。本文采用带有可解释性的P-CMA-ES算法将MBRB参数进行优化[21],进一步提高了模型的精度。本文中的优化算法为基于投影算子的协方差矩阵自适应优策略,P-CMA-ES是在原始CMA-ES智能的优化算法的一种改进算法,通过生成初始种群,在约束条件下选择,生成子种群不断迭代寻找最优解,它在高维非线性优化的方面表现良好,能够利用较少的样本快速收敛到全局最优点。
3.3. 基于MBRB的钢疲劳预测模型的推理过程
作为灰盒模型的MBRB,它引入了在对钢疲劳度的影响因素的长期探索中获得的专家知识。MBRB的主要构成有知识库、推理引擎和优化模型。在预测过程中存在固有的模糊性和不确定性,需要将指标数据转换为定量描述不确定性的统一形式。鉴于此,本文采用分析性证据推理(ER)算法进行推理,有效整合多指标信息对复杂系统进行评估,为不确定条件下信息的定量和定性表达提供支持。首先,需要计算激活权重,然后使用ER。该算法集成了激活规则,具体步骤分为以下四个步骤。
步骤1:需要计算输入样本信息与信念规则之间的匹配程度,即规则的适应程度。第i个输入下第n条规则的规则适应程度计算方式如下:
(3)
其中,
表示第i个输入的第n个参考值,
是
对应的匹配度。
步骤2:计算第n条规则的规则激活权重
。激活权重可以按以下方式计算:
(4)
其中,
表示第i个评估指标的属性权重。
步骤3:最终的置信度
是利用ER分析算法的规则推理得到的。计算方式如下所示:
(5)
(6)
步骤4:计算预期的效用值并获得最终输出:
(7)
其中,
表示由置信分布组成的集合,
表示实际的输入向量,
表示
的效用,
是最终的期望效用,y为最终的置信分布,可以表示为:
(8)
4. 案例研究
4.1. 数据预处理
本文使用了美国国家材料科学研究所(NIMS) MatNavi的钢疲劳数据集,该数据包含炼钢过程中的各种实验条件,其中涉及到的化学成分特征有9个,上游加工细节有3个,热处理条件有5个。但部分特征标准差为0,也就是说他们的数值是保持不变的,这导致了他们无法被用来预测钢疲劳,因此需要从中删除这些特征,此外由于不同特征具有不同的重要程度,因此进行了主成分分析,计算每个属性的基于相关性的特征排名,并选取了化学成分中相关性排名最高的碳(C)和铬(Cr),热处理排名中相关性排名最高的回火温度(TT),上游加工细节中相关性最高的减速比(Reduction Ratio)作为模型的输入属性,并进行数据归一化处理。最终数据集包括186个数据点。在本文中,每次实验随机抽取数据集的2/3作为训练集,1/3作为测试集。在机器学习领域,这种训练集与测试集的比例划分是经过广泛研究和实践验证的。当数据集规模适中时,2/3和1/3的比例在平衡模型训练效果和泛化能力评估方面表现出色。它既能保证模型在训练过程中有足够的学习素材,又能在测试阶段对模型的真实性能进行较为客观的衡量,避免过拟合或欠拟合等问题对评估结果的影响。
4.2. 建模过程
多层模型共有2层,下层为2个子规则库,第一个子规则库SubBrb1的2个输入指标分别是的
(碳元素含量),
(铬元素含量),第二个子规则库SubBrb2的2个输入指标为y (回火温度),z (减速比)。并将两个子规则库的输出
和
作为主规则库MainBrb的输入。在基于MBRB的钢疲劳预测中,参考值由专家提供。这些专家知识是通过实际研究钢疲劳相关因素积累的。通过分析数据特征,为每个指标设置了7个参考值,共定义了49条置信规则。子规则库的参考值见表1。
主规则库MainBrb的参考值如表2。
4.3. 结果分析
精度分析
在精度分析中,本节使用了RMSE作为评价指标。MBRB结合KStar、SVM、ANN、REPTree、LinearRegression。结果如表3所示,预测值的真实值的拟合程度如图2所示。
Table 1. Sub rule library reference values
表1. 子规则库参考值
|
参考点 |
L1 |
L2 |
L3 |
L4 |
L5 |
L6 |
L7 |
SubBrb1 |
x1 |
0 |
0.009 |
0.081 |
0.099 |
0.22 |
0.77 |
1 |
x2 |
0 |
0.14 |
0.4 |
0.62 |
0.68 |
0.92 |
1 |
SubBrb2 |
y |
0 |
0.63 |
0.66 |
0.69 |
0.72 |
0.91 |
1 |
z |
0 |
0.27 |
0.53 |
0.66 |
0.8 |
0.9 |
1 |
Table 2. Main rule library reference values
表2. 主规则库参考值
|
参考点 |
L1 |
L2 |
L3 |
L4 |
L5 |
L6 |
L7 |
MainBrb |
a1 |
0 |
0.41 |
0.63 |
0.67 |
0.69 |
0.75 |
1 |
a2 |
0 |
0.27 |
0.53 |
0.66 |
0.71 |
0.73 |
1 |
Table 3. Comparison between MBRB and other models
表3. MBRB与其他模型比较
No. |
Method |
RMSE |
1 |
MBRB-e |
0.0435 |
2 |
KStar |
0.0857 |
3 |
SVM |
0.0580 |
4 |
ANN |
0.0470 |
5 |
REPTree |
0.0542 |
6 |
LinearRegression |
0.0581 |
Figure 2. The fitting degree of the predicted values of MBRB to the true values
图2. MBRB预测值的真实值的拟合程度
由表3可以看出MBRB的预测精度优于其他机械学习的模型。
在相同数量的数据集下,MBRB模型相比于基于数据驱动的ANN和Kstar模型具有以下特点:首先,MBRB模型具有透明的推理过程,而ANN和Kstar等数据驱动模型的内部结构是不可见的。其次,MBRB模型基于规则建模,能够合理解释输出结果,而数据驱动模型无法解释输入与输出之间的关系。此外,MBRB模型能够有效利用专家知识构建模型,这有助于人们充分理解模型,而数据驱动模型则不具备这种能力。最后,MBRB模型对样本依赖性较低,即使在小样本情况下也能保证精度,而数据驱动模型对样本依赖性较高,在小样本情况下精度较低。
5. 结语
准确预测钢疲劳是一项艰巨的任务。本文在BRB的基础上构建了MBRB模型,提出了一种基于多层置信规则库预测模型,采用主成分分析对关键特征进行筛选,利用具有可解释性约束的投影协方差矩阵自适应进化策略对模型参数进行优化,为钢疲劳预测提供了一种高度准确和可信的方法。这一成就不仅强调了置信规则库和专家知识在预测钢疲劳方面的有效性,而且强调了通过创新方法解决一些材料科学问题的潜力。
MBRB模型已经被证明能够有效地处理钢疲劳预测问题,但这有一定的局限性。我们计划在未来继续进行以下方面的研究:
我们将搜集更多的钢疲劳相关的数据集,以增强预测结果并提高准确率。本研究证明了利用四个特征预测钢疲劳强度的有效性,证明他们确实是预测钢疲劳的可靠变量。然而,未知的数据质量对用于疲劳预测的人工智能模型也起到一定的影响,重要的是继续研究和审查其他潜在的变量和特征,对相关数据进行更深层次的探索,以获得更准确和可靠的钢疲劳预测结果。
现有的关于金属疲劳的建模分为五个应用场景:疲劳寿命预测、疲劳裂纹、疲劳损伤诊断、疲劳强度和疲劳负荷。本文仅将MBRB模型应用于钢疲劳强度预测,后续将继续疲劳建模研究,将MBRB模型应用于更多场景。
我们研究出MBRB模型在钢疲劳预测方面的意义,并证明了它优于传统的深度学习算法。通过置信规则库和专家系统的协同作用,为克服材料科学应用,尤其是疲劳预测领域的稀缺、异构和不完整的数据构成的重大挑战提供了新方法,为人工智能与材料科学相结合的未来开创了新思路。
基金项目
黑龙江省自然科学基金项目(LH2021F037)资助;黑龙江省高等教育教学改革项目(SJGY20180259, SJGY20200368)资助;哈尔滨市科技局科技创新人才研究专项项目(2017RAQXJ050)资助;哈尔滨师范大学博士科研启动基金项目(XKB201901)资助;哈尔滨师范大学研究生培养质量提升工程项目(HSDYJSJG2019006)资助;哈尔滨师范大学教学改革项目(XJGRYK2022017, XJGYFW2022038);哈尔滨师范大学计算机学院教学改革项目(JKYJGY202209);装备智能运用教育部重点实验室开放基金课题资助(AAIE-2023-0102)。
NOTES
*通讯作者。