基于人工神经网络的单核子分离能研究
Research on Single-Nucleon Separation Energy Based on Artificial Neural Networks
摘要: 本研究基于三个具有代表性的理论模型:相对论连续谱Hartree-Bogoliubov (RCHB)理论,相对论平均场(RMF)理论,Skyrme-Hartree-Fock-Bogoliubov (SHFB)模型,首先介绍了人工神经网络(ANN)方法,计算出了三个模型的单核子分离能的理论预测值。随后利用神经网络对单核子分离能的理论值进行了优化训练,降低了单核子分离能的理论预测值与实验值之间的均方根偏差(RMSD),并在此基础上进行了两种分区优化,分别为质子和中子的幻数分区,分区优化训练后进一步降低了RMSD。单核子分离能分区训练后的RMSD比整体直接训练的效果更好,特别能显著降低轻核区的RMSD,单中子分离能进行中子幻数分区训练的效果更好,单质子分离能进行质子幻数分区训练的效果更好。
Abstract: This research is based on three representative theoretical models: the Relativistic Continuum Hartree-Bogoliubov (RCHB) theory, Relativistic Mean Field (RMF) theory, and Skyrme-Hartree-Fock-Bogoliubov (SHFB) model. First, the Artificial Neural Network (ANN) method was introduced to calculate theoretical predictions of single-nucleon separation energies for these three models. Subsequently, the neural network was employed to optimize and train the theoretical values of single-nucleon separation energies, reducing the root mean square deviation (RMSD) between theoretical predictions and experimental values. Two partitioning optimization schemes were then implemented: proton magic number partitioning and neutron magic number partitioning. The partitioned optimization training further reduced RMSD values. The partitioned training of single-nucleon separation energies demonstrated better performance than direct global training, particularly in significantly reducing RMSD in the light nuclei region. Specifically, neutron magic number partitioning showed superior effectiveness for optimizing single-neutron separation energies, while proton magic number partitioning yielded better results for single-proton separation energies.
文章引用:张锦衍. 基于人工神经网络的单核子分离能研究[J]. 应用物理, 2025, 15(4): 278-283. https://doi.org/10.12677/app.2025.154031

1. 引言

原子核分离能是核物理领域重要的基本物理量之一。核结构通过核子分离能在质量系统学中表现出来,分离能的精度在一定程度上反映了模型的精度。目前,实验室已经测量了2500多种核素[1],但还有很多核素的基本性质是未知的。分离能的预测值对于研究原子核的性质至关重要,通过核子分离能可以有效判断原子核内中子和质子的壳层结构。分离能也可以作为测试壳层闭合的直接方法,这有助于发现超重核的稳定岛位置[2] [3]。在天体物理学和宇宙学上,分离能也具有重要意义[4]

分离能的理论预测可以通过原子核的理论模型得出。理论模型能够反映原子核基态性质的系统变化,描述和预言已知实验数据区域外核素的基态物理量。分离能的均方根误差(Root-Mean-Square Deviation, RMSD)从BW模型的3 MeV [5]到WS模型的300 KeV [6],但仍不足以准确研究核结构。以原子核的理论模型为基础,通过神经网络可以使理论模型的精度进一步提高。神经网络方法早在20世纪40年代就被提出,它具有强大的学习、预测能力与适应能力,可以应对多种复杂问题。

神经网络方法在核物理学中有许多成功的应用,例如贝叶斯神经网络(Bayesian Neural Network, BNN)预测核质量[7]β衰变寿命[8],人工神经网络(Artificial Neural Network, ANN)预测电荷半径[9],BP神经网络(Back Propagation Neural Network, BPNN)研究原子核低激发谱[10],前馈神经网络(Feedforward Neural Network, FNN)预测α衰变半衰期[11]等。在分离能方面比较多的先预测核质量或结合能,再以他们为基础计算出分离能[12]。直接训练分离能能使训练的误差更有针对性,使分离能的预测结果更准确,也能反向印证核质量和结合能的预言结果。

在本文中对于单核子分离能使用了三个理论模型:相对论连续谱Hartree-Bogoliubov (Relativistic continuum Hartree-Bogoliubov, RCHB)理论[13] [14],相对论平均场(Relativistic Mean Field, RMF)理论[15] [16],Skyrme-Hartree-Fock-Bogoliubov (SHFB)模型[1]。使用了人工神经网络方法训练模型,进一步提高对单核子分离能的预测能力。在本文的第二节中描述了使用的人工神经网络方法,具体选取的参数和分区方式。在第三节中讨论了单核子分离能的均方根偏差在两种不同分区下训练前后的结果。

2. 方法描述

人工神经网络是目前广泛应用的神经网络模型之一,工作方式模拟人脑神经元,能够利用非线性激活函数来建模复杂的数据关系,通过学习大量数据来自适应地调整内部的权重和偏置,从而改进性能,具有层次化结构和良好的泛化能力[17] [18]。人工神经网络是一个由输入层、隐藏层和输出层组成的多层神经网络。输入层负责接收外部输入信号,多层隐藏层作为中间层处于输入层和输出层之间,输出层输出最终结果。每一层神经网络都由被称为节点的简单处理单元组成,节点处理数据的过程如下式所示:

y= f 2 [ φ 2 f 1 ( φ 1 x+ b 1 )+ b 2 ] (1)

x是输入的数据,y是输出层的结果, f 1 f 2 是隐藏层和输出层的激活函数, φ 1 φ 2 是隐藏层和输出层的权重,b1b2是隐藏层和输出层的阈值。在传递过程中,信号传递前向传播,先通过输入层,再到隐藏层,最后到输出层。误差则反向传播,先通过输出层,再进入隐藏层,最后到输入层。人工神经网络便以此优化权重和偏差,使计算值和目标值之间的误差越来越小。

在本人工神经网络中,选取的激活函数为ReLU (Rectified Linear Unit)函数,学习过程通过随机梯度下降(Stochastic Gradient Descent, SGD)的方法最小化损失函数。神经网络具有2个隐藏层,每个隐藏层有20个神经元,使用4个特征值(Z, N, |ZZ0|, |NN0|)作为输入单元,其中ZN分别为给定核的质子数和中子数。Z0 (8, 20, 50, 82, 126)和N0 (8, 20, 50, 82, 126)是质子和中子的幻数,当ZN处于两个幻数之间时,分别算出两个|ZZ0|和|NN0|值后,选用更小的值。

分离能的实验值根据国际原子质量评估(AME, Atomic Mass Evaluation) 2020年数据表中的结合能得出[19]。在AME2020表的原子核数据中选取原子核质子数满足Z ≥ 8的数据,以这些数据的结合能(B)为基础,根据下式:

S n ( N,Z )=B( N,Z )B( N1,Z ) (2)

S p ( N,Z )=B( N,Z )B( N,Z1 ) (3)

分别计算出单中子分离能(Sn),单质子分离能(Sp)作为实验数据。用同样的方式计算出RCHB、RMF和SHFB模型的单核子分离能作为理论预测值。使用人工神经网络训练理论预测值与实验值的差值,然后将训练后的差值与模型的预测值相加得到最终的原子核分离能计算结果。

单核子分离能在幻数附近会出现显著变化,因此在神经网络的基础上增加了两种分区训练方式,分别为质子幻数分区(8 ≤ Z < 20, 20 ≤ Z < 50, 50 ≤ Z < 82, Z ≥ 82),中子幻数分区(8 ≤ N < 20, 20 ≤ N < 50, 50 ≤ N < 82, 82 ≤ N < 126, N ≥ 126)。最后结果以分离能的预测值和实验值之间的均方根偏差(Root-Mean-Square Deviation, RMSD)作为判断标准。

3. 结果与讨论

3.1. 单中子分离能

Sn整体的RMSD如表1所示,分别为原始的RMSD,不分区神经网络直接训练后的RMSD,Z幻数分区训练后的RMSD和N幻数分区训练后的RMSD。从表1中可以看出Sn的RMSD在不分区直接训练的情况下比原始RMSD降低了2.94%~33.30%。Z幻数分区训练后的Sn的RMSD比不分区直接训练的RMSD降低了10.15%~37.52%,比原始的RMSD降低了12.79%~58.32%。N幻数分区训练后的Sn的RMSD比不分区直接训练的RMSD降低了13.61%~37.69%,比原始的RMSD降低了16.14%~58.44%。

经过神经网络训练后能够降低模型Sn原始的RMSD。再将数据集按幻数分区分别通过神经网络训练,分区后得到RMSD乘以各区数据个数,全部相加后除以数据集总个数,得到分区后的整体RMSD,如下式所示:

σ= i=1 k σ i * n i n (4)

σ 为整体的RMSD, σ i 为第i个分区的RMSD, n i 为第i个分区的个数, n 为数据集的总个数,k为分区个数,中子分区个数k为5。

通过分区训练后,Sn的RMSD被进一步降低了。从表1也能看出,N幻数分区的效果对Sn来说更好。

Table 1. RMSD (keV) of Sn for RCHB, RMF, and SHFB models: original RMSD, trained RMSD without partitioning, trained RMSD with Z magic number partitioning, and trained RMSD with N magic number partitioning

1. RCHB、RMF和SHFB模型的Sn的RMSD (keV),分别为原始的RMSD,不分区直接训练后的RMSD,Z幻数分区训练后的RMSD和N幻数分区训练后的RMSD

模型

原始

不分区

Z幻数分区

N幻数分区

RCHB

871

581

363

362

RMF

645

556

472

446

HFB

477

463

416

400

具体神经网络分区训练后的Sn的RMSD结果如表2表3所示,表2Z幻数分区的结果,表3N幻数分区的结果。从表2表3中可以看出,Sn的RMSD在训练前后都是在重核区更低。在轻核区,通过分区训练的方法能更大幅度地降低RMSD,绝大多数降幅超过50%。

Table 2. RMSD (keV) of Sn in the Z magic number region: original RMSD (σ1) and trained RMSD (σ1’) for RCHB; original RMSD (σ2) and trained RMSD (σ2’) for RMF; original RMSD (σ3) and trained RMSD (σ3’) for SHFB

2. Z幻数分区的Sn的RMSD (keV),分别为RCHB原始的RMSD (σ1)和训练后的RMSD (σ1’),RMF原始的RMSD (σ2)和训练后的RMSD (σ2’),SHFB原始的RMSD (σ3)和训练后的RMSD (σ3’)

分区

σ1

σ1

σ2

σ2

σ3

σ3

8 ≤ Z < 20

1239

467

1011

594

952

649

20 ≤ Z < 50

832

388

763

594

529

507

50 ≤ Z < 82

883

358

526

380

312

299

Z ≥ 82

703

267

437

341

382

331

Table 3. RMSD (keV) of Sn in the N magic number region: original RMSD (σ1) and trained RMSD (σ1’) for RCHB; original RMSD (σ2) and trained RMSD (σ2’) for RMF; original RMSD (σ3) and trained RMSD (σ3’) for SHFB

3. N幻数分区的Sn的RMSD (keV),分别为RCHB原始的RMSD (σ1)和训练后的RMSD (σ1’),RMF原始的RMSD (σ2)和训练后的RMSD (σ2’),SHFB原始的RMSD (σ3)和训练后的RMSD(σ3’)

分区

σ1

σ1

σ2

σ2

σ3

σ3

8 ≤ N < 20

1375

239

1086

431

1035

421

20 ≤ N < 50

925

490

844

636

667

626

50 ≤ N < 82

742

296

610

391

349

300

82 ≤ N < 126

877

354

501

377

329

309

N ≥ 126

741

304

477

358

374

333

3.2. 单质子分离能

Sp整体的RMSD如表4所示,分别为原始的RMSD,不分区神经网络直接训练后的RMSD,Z幻数分区训练后的RMSD和N幻数分区训练后的RMSD。从表4中可以看出Sp的RMSD在不分区直接训练的情况下比原始RMSD降低了7.27%~39.27%。Z幻数分区训练后的Sp的RMSD比不分区直接训练的RMSD降低了15.76%~35.46%,比原始的RMSD降低了31.53%~59.73%。N幻数分区训练后的Sp的RMSD比不分区直接训练的RMSD降低了18.03%~30.42%,比原始的RMSD降低了24.28%~57.74%。

经过神经网络训练后能够降低模型Sp原始的RMSD。通过分区训练后,如式(4),质子分区个数k为4,得到整体的RMSD,Sp的RMSD被进一步降低了。从表4也能看出,Z幻数分区的效果对Sp来说更好。

Table 4. RMSD (keV) of Sn for RCHB, RMF, and SHFB models: original RMSD, trained RMSD without partitioning, trained RMSD with Z magic number partitioning, and trained RMSD with N magic number partitioning

4. RCHB、RMF和SHFB模型的Sn的RMSD (keV),分别为原始的RMSD,不分区直接训练后的RMSD,Z幻数分区训练后的RMSD和N幻数分区训练后的RMSD

模型

原始

不分区

Z幻数分区

N幻数分区

RCHB

904

549

364

382

RMF

812

660

556

541

HFB

523

485

313

396

具体神经网络分区训练后的Sp的RMSD如表5表6所示,表5Z幻数分区的结果,表5N幻数分区的结果。从表5表6中可以看出,Sp的RMSD和Sn同样在训练前后都是在重核区更低,但在轻核区训练的效果更好,大部分RMSD的降幅超过50%。

Table 5. RMSD (keV) of Sp in the Z magic number region: original RMSD (σ1) and trained RMSD (σ1’) for RCHB; original RMSD (σ2) and trained RMSD (σ2’) for RMF; original RMSD (σ3) and trained RMSD (σ3’) for SHFB

5. Z幻数分区的Sp的RMSD (keV),分别为RCHB原始的RMSD (σ1)和训练后的RMSD (σ1’),RMF原始的RMSD (σ2)和训练后的RMSD (σ2’),SHFB原始的RMSD (σ3)和训练后的RMSD (σ3’)

分区

σ1

σ1

σ2

σ2

σ3

σ3

8 ≤ Z < 20

1307

320

1122

329

1047

432

20 ≤ Z < 50

770

433

844

693

610

308

50 ≤ Z < 82

1016

352

686

518

342

285

Z ≥ 82

623

265

867

432

377

326

Table 6. RMSD (keV) of Sp in the N magic number region: original RMSD (σ1) and trained RMSD (σ1’) for RCHB; original RMSD (σ2) and trained RMSD (σ2’) for RMF; original RMSD (σ3) and trained RMSD (σ3’) for SHFB

6. N幻数分区的Sp的RMSD (keV),分别为RCHB原始的RMSD (σ1)和训练后的RMSD (σ1’),RMF原始的RMSD (σ2)和训练后的RMSD (σ2’),SHFB原始的RMSD (σ3)和训练后的RMSD (σ3’)

分区

σ1

σ1

σ2

σ2

σ3

σ3

8 ≤ N < 20

1384

451

1100

255

1173

323

20 ≤ N < 50

961

534

875

685

734

615

50 ≤ N < 82

754

297

795

608

378

316

82 ≤ N < 126

955

401

746

483

338

305

N ≥ 126

690

300

787

292

389

339

4. 总结

本文使用人工神经网络方法对RCHB、RMF和HFB模型进行了训练来预测分离能,选取特征值(Z, N, |ZZ0|, |NN0|),优化后Sn和Sp的RMSD都得到了改善,并且RMSD在ZN幻数分区优化后得到了进一步的降低。三个模型Sn的RMSD在神经网络分区优化后平均降低了250 keV左右,Sp的RMSD平均降低了350 keV左右。分区训练的结果比整体训练的结果更好,能有效应用在分离能的预测上。

通过幻数分区,能发现单核子分离能的RMSD随着ZN的增加而降低,分区训练也能显著降低本来较高的轻核区的RMSD。整体上Sn的RMSD都在N幻数分区上较好,而Sp的RMSD则在Z幻数分区上较好。

参考文献

[1] Goriely, S., Chamel, N. and Pearson, J.M. (2016) Further Explorations of Skyrme-Hartree-Fock-Bogoliubov Mass Formulas. XVI. Inclusion of Self-Energy Effects in Pairing. Physical Review C, 93, Article 034337.
https://doi.org/10.1103/physrevc.93.034337
[2] Hofmann, S. and Münzenberg, G. (2000) The Discovery of the Heaviest Elements. Reviews of Modern Physics, 72, 733-767.
https://doi.org/10.1103/revmodphys.72.733
[3] Lunney, D., Pearson, J.M. and Thibault, C. (2003) Recent Trends in the Determination of Nuclear Masses. Reviews of Modern Physics, 75, 1021-1082.
https://doi.org/10.1103/revmodphys.75.1021
[4] Arnould, M. and Takahashi, K. (1999) Nuclear Astrophysics. Reports on Progress in Physics, 62, 395-462.
https://doi.org/10.1088/0034-4885/62/3/003
[5] Kirson, M.W. (2008) Mutual Influence of Terms in a Semi-Empirical Mass Formula. Nuclear Physics A, 798, 29-60.
https://doi.org/10.1016/j.nuclphysa.2007.10.011
[6] Wang, N., Liu, M., Wu, X. and Meng, J. (2014) Surface Diffuseness Correction in Global Mass Formula. Physics Letters B, 734, 215-219.
https://doi.org/10.1016/j.physletb.2014.05.049
[7] 娄月申, 郭文军. 贝叶斯深度神经网络对于核质量预测的研究[J]. 物理学报, 2022, 71(10): 163-172.
[8] 李伟峰, 张晓燕, 牛中明. 贝叶斯神经网络方法对原子核β衰变寿命的研究[J]. 核技术, 2023, 46(8): 126-133.
[9] 董潇旭, 耿立升. 机器学习方法研究原子核的电荷半径[J]. 原子能科学技术, 2023, 57(4): 679-695.
[10] 王逸夫, 牛中明. 多任务神经网络对原子核低激发谱的研究[J]. 原子核物理评论, 2022, 39(3): 273-280.
[11] 卜炫德, 吴迪, 白春林. 基于神经网络预测重核α衰变半衰期[J]. 中国科学: 物理学, 力学, 天文学, 2022, 52(5): 51-56.
[12] 李佳星, 赵天亮, 马娜娜, 等. 神经网络方法在核质量中的应用[J]. 原子能科学技术, 2023, 57(4): 696-703.
[13] Xia, X.W., Lim, Y., Zhao, P.W., Liang, H.Z., Qu, X.Y., Chen, Y., et al. (2018) The Limits of the Nuclear Landscape Explored by the Relativistic Continuum Hartree-Bogoliubov Theory. Atomic Data and Nuclear Data Tables, 121, 1-215.
https://doi.org/10.1016/j.adt.2017.09.001
[14] Meng, J. (1998) Relativistic Continuum Hartree-Bogoliubov Theory with Both Zero Range and Finite Range Gogny Force and Their Application. Nuclear Physics A, 635, 3-42.
https://doi.org/10.1016/s0375-9474(98)00178-x
[15] Peña-Arteaga, D., Goriely, S. and Chamel, N. (2016) Relativistic Mean-Field Mass Models. The European Physical Journal A, 52, Article No. 320.
https://doi.org/10.1140/epja/i2016-16320-x
[16] Geng, L., Toki, H., Sugimoto, S. and Meng, J. (2003) Relativistic Mean Field Theory for Deformed Nuclei with Pairing Correlations. Progress of Theoretical Physics, 110, 921-936.
https://doi.org/10.1143/ptp.110.921
[17] 董军, 胡上序. 混沌神经网络研究进展与展望[J]. 信息与控制, 1997, 26(5): 360-368.
[18] Mnih, V., Kavukcuoglu, K., Silver, D., Rusu, A.A., Veness, J., Bellemare, M.G., et al. (2015) Human-Level Control through Deep Reinforcement Learning. Nature, 518, 529-533.
https://doi.org/10.1038/nature14236
[19] Wang, M., Huang, W.J., Kondev, F.G., Audi, G. and Naimi, S. (2021) The AME 2020 Atomic Mass Evaluation (II). Tables, Graphs and References. Chinese Physics C, 45, Article 030003.
https://doi.org/10.1088/1674-1137/abddaf