基于决策树——遗传算法双驱动的多目标火力规划研究
Multi-Objective Firepower Planning Research Based on Dual-Driven Decision Tree Genetic Algorithm
摘要: 本文构建“射程筛选–智能分类–优化求解”的分层理论框架,融合欧氏距离模型、决策树与改进遗传算法,通过数学建模与智能算法实现目标可打击性评估、威胁分类及火力分配优化。仿真验证表明,该方法在经济代价、弹药利用率与收敛速度上显著优于传统模式,为炮兵智能化指挥决策提供了理论研究思路。
Abstract: Fire planning faces challenges such as data overload, decision-making complexity in modern informatized battlefields. The paper proposes a hierarchical theoretical framework “range screening, intelligent classification, priority ranking, and optimization solving”, integrating Euclidean distance models, decision trees, and an improved genetic algorithm. Through mathematical modeling and intelligent algorithms, the method enables assessable target strike feasibility, threat classification, and optimized firepower allocation. Simulation results demonstrate its significant superiority over traditional approaches in cost efficiency, ammunition utilization, and convergence speed, offering a theoretical foundation for intelligent artillery command and decision-making.
文章引用:刘庆林, 刘悦宝. 基于决策树——遗传算法双驱动的多目标火力规划研究[J]. 建模与仿真, 2025, 14(7): 121-127. https://doi.org/10.12677/mos.2025.147521

1. 引言

当前,炮兵火力仍是主要的火力输出,其优势主要体现在以下几个方面:一是火力强大、射程远,可对敌纵深目标实施有效压制;二是射击精度高,结合现代侦察与校射手段,能实现精确打击;三是机动能力强,可适应复杂地形快速部署;四是反应速度快,能够迅速组织火力突击,对敌形成突然猛烈的火力打击。在火力分配求解的问题上,众多学者采取各种算法模型对其进行研究。从优化算法来看,既有传统的分支定界法、割平面法和列生成方法等传统精确算法,也有贪婪搜索、禁忌搜索算法、模拟退火算法、大规模邻域搜索算法、粒子群优化算法、遗传算法[1]、蚁群优化算法等启发式算法,以及多种启发式算法结合的混合智能算法[2]等。大多数火力分配问题,都采取将目标和武器进行统一分配的模式。在处理覆盖范围广、规模大且目标类型与防御武器种类繁杂的火力分配算法问题时,若采用一体化的目标与武器分配处理模式,虽能够得到全局最优解,然而该模式存在显著的计算量瓶颈。即便引入性能卓越的智能优化算法,伴随问题规模的不断扩大,解算时长仍会呈现急剧增长的态势[3]。此外,尽管相关文献均表明各自所提出的算法具备良好的收敛特性,但实际情况中,算法的收敛速度与收敛效果在很大程度上受制于初始参数的选取情况。本文提出一种“射程筛选–智能分类–优化求解”的分层理论框架求解方法,与传统方法相比,具有更好的收敛性、经济代价低、弹药利用率更高。

2. 理论与数学模型

2.1. 火力打击分层理论

火力打击分层理论原理如图1所示。首先通过设计合适的层级筛选,使失能的数据提前排除在火力分配矩阵之外,而后通过目标优先排序,将武器弹药优先分配给战略价值高的目标,符合实战需求,最后通过改进的遗传算法,输出火力计划,提高算法的寻优能力。

Figure 1. Layered theory of firepower strike

1. 火力打击分层理论原理

2.2. 物理空间可打击性数学模型

对于一个包含m个武器单元的武器系统,可分为k类,其可打击目标坐标可表示为(Xi, Yi),其中i = 1, 2, …m。含有n个打击目标的坐标可用(Xj, Yj)表示,其中i = 1, 2, …n。

物理空间可打击性评估需融合打击目标坐标,武器可打击目标坐标以及战术调整阈值等参数,判断武器能否对目标实施有效打击。其中打击目标坐标与武器可打击目标坐标距离用欧式距离模型表示:

D ij = ( X i X j )+( Y i Y j ) (1)

武器与目标间的空间距离可用于判断目标是否在有效射程内。而在实际场景环境中,武器射程Ri受到地形、气象等因素的影响,因此需引入战术调整阈值α对其射程进行修正:

R i c = R i +α (2)

其中 R i c 为校正后第i个武器射程。为了能将武器与目标的空间距离信息转化为直观的逻辑判断结果,引入0-1判断矩阵模型D∈Rm × n,矩阵D元素可定义为:

d ij ={ 1 D ij < R i c 0 otherwise (3)

当矩阵元素值为1时,表示目标处于武器有效射程内,可纳入后续火力规划考虑范畴;值为0则直接排除。这种二元化的筛选机制,极大提升了目标筛选的效率与准确性,避免了无效目标对后续分类和分配过程造成干扰。

除物理距离外,还需结合目标威胁等级Tj (1~5级,数值越大威胁越高)、价值系数Vj (0~100,数值越大越重要)、易损性系数Sj (0~1,数值越小越难毁伤)综合判断。

武器性能参数:第k类武器最大射程为Rk,单发弹药成本为Ck,毁伤概率为Pk,j (对目标j毁伤概率) [4]

2.3. 基于C4.5决策树的目标威胁分类模型

决策树研究的数据集中含有多个属性,分为一般属性和分类结果属性。决策树由根节点、一般属性分支和叶子节点组成。叶子结点即为实例所属的分类结果属性,其他节点对应于待分类问题的一般属性。利用决策树,可以实现对数据的归纳分类[5]

C4.5算法在决策树构建过程中,以信息增益率作为特征选择的标准,有效规避了ID3算法中偏向于取值较多特征的问题[6]。信息增益率IG_ratio (A)的计算公式为:

IG_ratio( A )= IG( A ) IV( A ) (4)

其中,信息增益IG(A)衡量划分前后数据集纯度的提升程度,计算公式为:

IG( A )=Entropy( D ) v=1 V | D v | | D | Entropy( D v ) (5)

固有值IV(A)用于惩罚取值较多的特征,其计算方式为:

IV( A )= v=1 V | D v | | D | log 2 | D v | | D | (6)

通过该方式,C4.5算法能够更合理地选择对分类贡献度高的特征,确保决策树结构的合理性与泛化能力。

使用悲观误差剪枝(PEP)方法能够有效降低决策树的复杂度,减少过拟合现象,提升模型在实际场景数据中的分类准确性与鲁棒性。PEP方法基于训练集进行剪枝操作,其核心思想是通过统计训练集上的误差率来评估子树的预测性能。在剪枝过程中,若某子树T的预测误差率e (T)高于剪枝后替换为叶节点的误差率e (L),则删除该子树并替换为叶节点。子树T的误差率计算为:

e( T )= i=1 | T | e i | T | (7)

其中ei为子树T中第i个样本的分类误差,|T|为子树样本总数。通过这种自底向上的剪枝策略,PEP方法能够有效降低决策树的复杂度,减少过拟合现象,提升模型在实际场景数据中的分类准确性与鲁棒性。

假设在某场景中,通过各种侦察手段获取300个地面目标的多维异构数据,包含坐标、功能属性、电磁辐射强度等信息。通过C4.5算法构建决策树,首先以“功能属性”作为根节点进行划分。例如,在指挥控制类目标中,某棵子树将战略级指挥所(低辐射)和战术级雷达站(强辐射)进一步分类时,将该子树剪枝替换为叶节点后,在训练集上的预测误差率从20%降至8%,符合PEP剪枝优化条件,因此执行剪枝操作。最终形成的决策树模型能够快速将目标分类为高价值隐蔽目标(A类)、高暴露目标(A类)等不同威胁等级,为后续火力分配提供精准的目标优先级依据,有效减少了火力资源的错配。

2.4. 改进遗传算法火力分配优化理论

2.4.1. 火力分配问题建模

以最小化经济代价为核心,同时兼顾目标价值与威胁性,构建火力分配目标函数如下:

i=1 m j=1 n x ij C ij T j V j (7)

通过上述目标函数,能够在满足约束条件的基础上,以量化方式平衡场景资源投入与目标打击收益,为火力分配优化提供明确的数学导向。

其中,Cij表示火炮i打击目标j所需的经济成本(包含弹药消耗、装备损耗等),Tj为目标j的威胁等级(1~5级,数值越大威胁越高),Vj为目标j的价值系数(0~100,数值越大越重要)。通过将威胁等级与价值系数的比值纳入计算,使高威胁、低价值目标在分配火力时需付出更高的“代价权重”,从而引导算法优先打击高价值、高威胁目标,平衡效益与经济成本。

求解目标函数约束条件可分为火力分配约束、目标打击约束和可打击性约束:

火力分配约束:每门火炮i分配的目标数不超过最大射速Li,即 j=1 n x ij L i;由于每门火炮射速Li = 1

发/分钟,这意味着单门火炮在单位时间内最多打击1个目标。

目标打击约束:每个目标j至少被打击kj次(根据威胁等级设定,如A类目标kj = 2),即 i=1 m x ij k j

例如高威胁的A类目标需至少被2门火炮打击,以确保毁伤效果。

可打击性约束:仅能分配可打击目标,即xij dij (dij为0-1判断矩阵元素)。只有当dij = 1,即目标在火炮射程范围内时,才考虑对其分配火力。

2.4.2. 改进遗传算法设计

改进遗传算法首先生成若干随机的解作为初始种群,每个个体通过编码方式(如二进制、实数或符号串)来表示一个潜在的解。随后计算每个个体的适应度(Fitness),适应度反映了个体解决问题的好坏。其中最关键的是适应度函数的设计,其直接影响到算法的优化效果,根据适应度值选择个体进行繁殖,如轮盘赌选择、锦标赛选择等。为了防止早熟收敛,还可改进选择方式,避免高适应度个体过早占据种群。对选中的个体进行基因交换,通过交叉操作生成新的个体(子代),以一定的概率对个体的基因进行随机变异,增加种群的多样性,防止算法陷入局部最优。最后选择适应度更高的个体替换掉适应度低的个体,形成新的种群。重复上述步骤,直到满足终止条件。

采用二进制编码xij∈{0, 1},表示火炮i是否打击目标j。选择二进制编码是因为其简洁直观,便于实现交叉、变异等遗传操作,且与0-1判断矩阵和整数规划问题的解空间高度契合。

融合毁伤效益、弹药利用率( i,j x ij i L i )与收敛速度等构造适应度函数,可表示为:

Fitness= i,j x ij V j ( 1 S j ) i,j x ij ( 1+ 1 1+ e t ) (9)

其中t为迭代次数。引入弹药利用率指标,是为了避免算法陷入单纯追求毁伤效益而过度消耗资源的局

部最优解;而指数函数 ( 1+ 1 1+ e t ) 随着迭代次数增加逐渐趋近于2,能够动态提升后期收敛效率,平衡

算法的全局搜索与局部寻优能力。

在遗传算法计算过程中,利用精英保留机制,使每代保留前5%的最优个体直接进入下一代。这是因为在进化过程中,优质解可能因交叉、变异操作被破坏,精英保留机制能够确保优秀基因得以延续,加速算法收敛速度并防止过早陷入局部最优。

交叉概率可表示为:

p c = p c_max ( p m_max p m_min )( f f avg ) f max f avg (10)

随个体适应度f增加而降低。高适应度个体通常包含较优解结构,降低交叉概率可减少对其破坏;而低适应度个体则需更高交叉概率以探索新的解空间。

变异概率可表示为:

p m = p m_min + ( p m_max p m_min )( f max f ) f max f avg (11)

随个体适应度增加而提升。当算法陷入局部最优时,高适应度个体集中,提高变异概率有助于跳出局部最优,增强算法全局搜索能力。

4. 仿真验证与理论效能分析

4.1. 实验场景构建

使用蒙特卡洛方法生成动态场景,场景各参数如下:

1) 火炮参数:54门自行火炮,射程Ri~U (10, 150) km,射速Li = 1发/分钟;

2) 目标参数:100个地面目标,威胁等级Tj~U (1, 5),价值Vj~Normal (50, 20),易损性Sj~U (0, 1);

3) 动态扰动:每5分钟随机新增3个目标,模拟态势变化。

遗传算法参数固定设置:种群规模100,最大迭代次数200,精英保留比例5%,初始交叉概率0.6,初始变异概率0.2;

决策树输入特征:包含8个连续特征和5个分类特征,均经过标准化处理。

4.2. 评价指标对比

以经济代价、弹药利用率、收敛速度3项指标进行对比,结果见表1

Table 1. Comparison results between improved methods and traditional methods

1. 改进方法与传统方法对比结果

指标

传统方法

改进方法

提升幅度

经济代价

12000单位

8500单位

−29.2%

弹药利用率

72.1%

89.3%

+23.9%

收敛速度(迭代次数)

150次

90次

40%

经济代价降低机理:改进方法通过C4.5决策树精准划分目标威胁等级,并在目标函数中引入“代价权重”机制,使算法优先选择性价比高的打击方案。相比传统经验式分配或者单纯的智能算法,改进方法有效避免了对低价值目标的过度打击,大幅降低了经济成本。例如,传统方法可能因缺乏对目标价值与威胁的综合评估,对一些低价值、低威胁目标进行不必要的打击,而改进方法通过量化计算,将火力集中在高价值、高威胁目标上,减少了弹药和装备的无效消耗。

弹药利用率优化本质:融合弹药利用率的适应度函数与目标函数的经济代价约束形成双重引导,精英保留与自适应算子确保算法快速收敛到最优解,减少无效火力投放,实现“精准用弹”与“经济节省”的平衡。在实际仿真中,改进方法能够根据目标的易损性和价值,合理分配弹药数量,避免出现弹药浪费或因弹药不足导致目标未被有效毁伤的情况。

收敛速度提升原因:改进遗传算法的自适应交叉、变异概率动态调整搜索策略,前期高交叉概率快速探索解空间,后期高变异概率跳出局部最优;精英保留机制则加速优质解的积累,相比传统固定参数算法,大幅缩短决策时间,满足时效性要求。在处理54门火炮和100个目标的大规模问题时,传统算法可能因参数固定,在搜索过程中陷入局部最优,导致收敛缓慢,而改进算法通过动态调整策略,能够更快地找到全局最优解。

动态扰动场景下改进方法仍保持稳定性能,验证了对场景态势变化的适应性,但传统方法因缺乏动态优化能力,经济代价与资源浪费随目标数量增加显著上升。在每5分钟新增3个目标的动态环境中,改进算法能够快速重新评估目标威胁和经济代价,调整火力分配方案。传统方法则可能因依赖预先设定的规则,无法及时响应变化,导致效益下降。

5. 结论与应用启示

本文构建“射程筛选–智能分类–优化求解”的分层理论框架,实现从数据到方案的系统化转化;通过欧氏距离模型筛选可打击目标,C4.5决策树进行威胁分类,改进遗传算法完成火力分配,形成完整的火力分配链条。融合欧氏距离模型的快速筛选能力、决策树的逻辑分类优势与遗传算法的全局优化特性,形成跨学科解决方案;将数学模型与智能算法相结合,为炮兵火力规划提供了新的理论和技术途径。

为仿真验证模型在动态场景中的有效性,将本文模型应用在包含54门火炮和100个动态目标的仿真场景中,改进方法在经济代价、弹药利用率和收敛速度等方面均优于传统方法,证明了其实际应用价值,为工程化应用提供了理论支撑。

NOTES

*第一作者。

#通讯作者。

参考文献

[1] 李梦杰, 常雪凝, 石建迈, 等. 武器目标分配问题研究进展: 模型、算法与应用[J]. 系统工程与电子技术, 2023, 45(4): 1049-1071.
[2] Li, S., He, X., Xu, X., et al. (2023) Weapon-Target Assignment Strategy in Joint Combat Decision-Making Based on Multi-Head Deep Reinforcement Learning. IEEE Access, 11, 113740-113751.
[3] 范啸晨, 王军, 张贤椿. 基于聚类分析的二次火力分配方法[J]. 指挥与控制学报, 2024, 10(4): 516-520.
[4] 董朝阳, 路遥, 王青. 改进的遗传算法求解火力分配优化问题[J]. 兵工学报, 2016, 37(1): 97-102.
[5] 杨瑞朋, 蒋里强, 王纯. 基于决策树的空中目标威胁分类研究[J]. 火力与指挥控制, 2017, 42(5): 103-107+111.
[6] 黄智濒. 现代决策树模型及其编程实践: 从传统决策树到深度决策树[M]. 北京: 机械工业出版社, 2022..