-
为了使用多任务神经网络的方法来预测原子核的低激发谱,我们采用四层的BP神经网络。图1展示了该BP神经网络的结构,它包含了输入层、隐藏层和输出层。其中隐藏层包含1层共享层和1层任务层,样本数据提供的输入量经过共享层和任务层的矩阵运算以及激活函数的变换后,再由优化器根据损失函数进行优化得到最优解。
本文共享层神经元个数取为35个,两个输出变量对应任务层中的神经元个数均取为4个,激活函数为Sigmoid函数,其表达式为
$$ S(x) = \frac{1}{{1 + {{\text{e}}^{ - x}}}}。 $$ (1) BP 神经网络通过损失函数来调整网络的模型参数,使 BP 神经网络的误差达到最小化。本文采用的损失函数为均方根误差函数,其表达式为
$$ \text{loss}(x)=\frac{1}{n}{\displaystyle \sum _{i=1}^{n}{\left({y}^{}_{i}-{o}^{}_{i}\right)}^{2}}\text{,} $$ (2) 其中
$ n $ 为样本数据的个数;$ {o}_{i} $ 为输入变量。研究发现,通过加入更多能够描述输出变量的重要输入变量,神经网络的预测能力可以显著提升[38]。由于原子核的低激发能对于壳效应非常敏感,在本工作中,除Z和N外,在输入变量中加入了由Casten等在文献[48]中提出的变量P,其表达式为
$$ P=\frac{{v}_{\text{p}}\boldsymbol\cdot {v}_{\text{n}}}{{v}_{\text{p}}+{v}_{\text{n}}}\text{,} $$ (3) 其中
${v_{\text{p}}}$ 和${v_{\text{n}}}$ 分别是原子核的价中子数和价质子数,${v_{\text{p}}}\boldsymbol\cdot {v_{\text{n}}}$ 和${v_{\text{p}}} + {v_{\text{n}}}$ 分别用于反映价质子—中子相互作用和配对相互作用强度,所以变量P估计了价核子与其他类型核子的平均相互作用,常被用于描述原子核的集体性和壳效应[48]。综上,本文采用BP神经网络研究原子核的
$ {2}_{1}^{+}\mathrm{和}{4}_{1}^{+} $ 激发能量,即$ {E(2}_{1}^{+}) $ 和$ {E(4}_{1}^{+}) $ ,为了在确定神经网络的最优参数时,对各种激发能量给予相似的权重,网络输出设置为激发能量的常用对数,选取Adam优化器来最小化损失函数,在此基础上构建了两种输入层不同的神经网络,分别是输入变量为Z、N的BP-ZN网络和输入变量为Z、N、P的BP-ZNP网络。激发能的实验数据取自美国原子核数据中心[15],并且只保留具有确定宇称和自旋的实验值,$ {2}_{1}^{+} $ 和$ {4}_{1}^{+} $ 激发能实验数据总数分别为629和594个。 -
为了研究BP神经网络方法的可行性,图2展示了不同方法计算的
$ {2}_{1}^{+} $ 和$ {4}_{1}^{+} $ 的log10E与实验数据的均方根偏差。从$ {2}_{1}^{+} $ 和$ {4}_{1}^{+} $ 实验数据中随机选取60个激发能量作为验证集,剩余的569个和534个$ {2}_{1}^{+} $ 和$ {4}_{1}^{+} $ 实验激发能量作为学习数据集。作为比较,图2还给出了5DCH方法相应的均方根偏差。从图2(a)可以明显看出,两种BP神经网络都很好地拟合了学习集中的激发能量,尤其是BP-ZNP网络。相比5DCH模型,BP-ZNP网络对$ {2}_{1}^{+} $ 和$ {4}_{1}^{+} $ 的log10E的均方根偏差分别减少约76%和78%。对于验证集,两种BP神经网络的均方根偏差相比于学习集均略有增大,但是仍然小于5DCH的均方根偏差,这表明本文采用的BP神经网络对于原子核的$ {2}_{1}^{+} $ 和$ {4}_{1}^{+} $ 低激发能量具有较好的预言能力。无论对于学习集还是验证集,BP-ZNP网络的均方根偏差都小于BP-ZN网络,说明加入与原子核集体性相关的输入变量P,神经网络可以更好地预言原子核的低激发态能量。为了更好地提取原子核的物理特征来获得更高的预言精度,之后将使用所有的实验数据训练BP神经网络。图3中展示了BP-ZNP神经网络方法通过拟合原子核的
$ {E(2}_{1}^{+}) $ 和$ {E(4}_{1}^{+}) $ 获得的结果,并与5DCH方法的理论值进行比较。可以发现,BP-ZNP网络方法在0.1 MeV到数MeV的能量范围内很好地拟合了低激发态的能量。BP-ZNP网络方法对$ {2}_{1}^{+}\mathrm{和}{4}_{1}^{+} $ 的计算结果与实验log10E的均方根偏差分别为0.041 1和0.041 8,相比于5DCH方法分别减少了约80%和75%,这与单任务神经网络的改进程度基本一致,其对$ {2}_{1}^{+}\mathrm{和}{4}_{1}^{+} $ 方均根偏差的减少量分别约75%和79%[47]。5DCH方法也较好地再现了相应的实验值,但是对部分核的计算出现了较大的偏差,例如图4中的40Ca、100Sr、 188Pb、208Po,5DCH对这4个核$ {E(2}_{1}^{+}) $ 和$ {E(4}_{1}^{+}) $ 的计算结果与实验值的均方根偏差分别为2.95和3.88 MeV,而BP-ZNP网络方法对这些核的计算结果更好地符合了实验数据,相应的均方根偏差显著降低,分别为0.010 3和0.013 1 MeV。这说明可以使用多任务神经网络实现多种激发能量的统一精确计算。由于多任务神经网络可以通过共享层模拟输出变量之间的关联性,相比单任务神经网络,可能具有更好的外推能力。此外,需要指出,本工作中使用的5DCH结果是采用PC-PK1有效相互作用计算得到的[49],PC-PK1是通过拟合60个选定球形核的基态性质来确定,不像神经网络那样直接拟合低激发实验数据,因此,BP-ZNP网络方法应该取得比5DCH模型更高的数值精度。相比于BP-ZNP网络方法,尽管5DCH模型精度较差,但是它具有更清晰的物理基础,而且可以描述除低激发能之外的各种低激发性质,因此通常被认为具有更好的外推能力,在实验数据未知区域,其结果可以作为神经网络的重要参考。图 4 BP-ZNP网络方法计算的40Ca、100Sr、188Pb、208Po的
$ {2}_{1}^{+} $ 、$ {4}_{1}^{+} $ 激发能量,与相应5DCH的计算结果以及实验值的比较(在线彩图)由于
$ {2}_{1}^{+} $ 和$ {4}_{1}^{+} $ 的实验数据量不一致,其中一些原子核目前只有单个激发态的实验值,使用BP神经网络可以预测所有原子核的$ {2}_{1}^{+} $ 和$ {4}_{1}^{+} $ 低激发能量,因此,我们使用BP神经网络预测了部分没有实验数据的低激发能,可以作为未来实验的参考。为了更具体地比较不同方法预言的低激发能的同位素趋势,图5展示了5DCH、BP-ZN网络和BP-ZNP网络计算的Mg、Ca、Kr、Sm、Pb同位素的低激发能量。从图5可见,5DCH方法较为合理地描述了这些同位素链的低激发能,但对部分核素的预言仍然出现较大偏差,这些较大偏差主要出现在传统中子幻数附近,例如40Ca的$ {E(2}_{1}^{+}) $ 和$ {E(4}_{1}^{+}) $ 、86Kr和144Sm的$ {E(4}_{1}^{+}) $ 。另外,5DCH还整体高估了Mg同位素链的$ {E(4}_{1}^{+}) $ 。表1给出了不同方法计算的Mg、Ca、Kr、Sm、Pb同位素的低激发能量与实验数据的均方根偏差,由表可见,BP-ZN网络对Ca和Pb同位素链的计算结果与实验激发能存在较大的均方根偏差,这主要是由于BP-ZN网络严重低估了双幻原子核48Ca和208Pb的激发能,而BP-ZNP网络的结果与实验激发能量非常符合,很好地再现了低激发能量的同位素趋势,甚至包括在幻数处由于壳效应导致的激发能急剧增加,这很大程度上是由于BP-ZNP网络加入了一个与原子核集体性相关的输入变量P,这一输入对描述幻数原子核的激发能具有重要作用。此外,从图中可见,当外推到没有实验数据的区域时,BP-ZNP网络结果的演化趋势和5DCH的结果类似。表 1 不同方法计算的Mg、Ca、Kr、Sm、Pb同位素的低激发能量与实验数据的均方根偏差
同位素 激发能量 5DCH /MeV BP-ZN /MeV BP-ZNP /MeV Mg $ E\left({2}_{1}^{+}\right) $ 0.432 3 0.002 8 0.001 5 $ {E(4}_{1}^{+}) $ 2.229 7 0.014 5 0.004 1 Ca $ E\left({2}_{1}^{+}\right) $ 1.391 5 0.807 2 0.090 5 $ {E(4}_{1}^{+}) $ 1.934 3 0.478 2 0.018 1 Kr $ E\left({2}_{1}^{+}\right) $ 0.052 9 0.040 8 0.003 1 $ {E(4}_{1}^{+}) $ 0.279 9 0.035 3 0.037 4 Sm $ {E(2}_{1}^{+}) $ 0.049 0 0.012 6 0.001 5 $ {E(4}_{1}^{+}) $ 0.319 1 0.013 7 0.010 5 Pb $ E\left({2}_{1}^{+}\right) $ 0.608 9 0.598 0 0.041 5 $ {E(4}_{1}^{+}) $ 1.360 2 0.488 6 0.036 7 低激发态
$ {4}_{1}^{+} $ 和$ {2}_{1}^{+} $ 的能量比值R42是辨别原子核属于轴对称形变转子(R42 = 3.33)、球形振动核(R42 = 2.0)还是三轴形变转子(R42 = 2.5)的常用手段。从图5可见,5DCH虽然高估了Mg同位素链的$ {E(4}_{1}^{+}) $ ,但很好地描述了Mg的R42。由于32Mg是典型的反转岛核,因此即便它的中子数是传统幻数20,其R42大约是2.6而不是球形核的2.0。对于中子数大于20的丰中子Mg同位素,R42大约是3.0,这意味它们的集体性进一步增强。两种BP网络都很好地反映了这些位于原子核反转岛核区的复杂物理现象,显著优于5DCH模型。5DCH还低估了Kr和Pb的缺中子核区的$ {E(2}_{1}^{+}) $ ,因此其预言的这一核区的R42与实验数据存在较大偏差,BP-ZN网络的结果在Kr和Pb同位素链中也出现了一些较大的偏差,而BP-ZNP网络较好地再现了Kr和Pb同位素链R42的实验数据。对于Sm同位素,众所周知,存在从近球形核146Sm(N = 84)到长椭形变核154Sm(N = 92)的一级形状相变,临界点在152Sm(N = 90)附近[50]。R42在该区域的急速增加反映了该区域的一级形状相变,BP-ZNP和5DCH都很好地再现了该形状相变过程。对于实验R42未知的130Sm,BP-ZN网络预言了过大的R42,与5DCH的结果具有很大差异,相比而言,BP-ZNP网络的预测结果与5DCH的结果较为接近,这可能暗示BP-ZNP网络具有相对可靠的外推能力。通过在核素图上展示理论值与实验值的差,可以更直观地了解神经网络对不同质量区原子核激发能的预言能力。鉴于BP-ZNP网络对原子核低激发能有更好的学习能力和外推能力,图6中展示了BP-ZNP网络得到的log10E和R42,与相应的实验值以及BNN理论值[47]之间的差值。从图可见,BP-ZNP网络很好地拟合了从轻核、中重核到重核的实验激发能,其计算的log10E和实验数据的差别基本在0.05以下。
$ {R}_{42}^{\mathrm{E}\mathrm{X}\mathrm{P}} $ 与$ {R}_{42}^{\mathrm{B}\mathrm{P}-\mathrm{Z}\mathrm{N}\mathrm{P}} $ 之间较大的差值主要集中在中重核区域。BNN方法的结果在轻核区以及部分丰质子核区与实验数据存在较大偏差,而BP-ZNP网络与实验数据在这些区域的偏差相对较小,说明BP-ZNP网络比BNN更好地再现了轻核区以丰质子核区的低激发能。图 6 BP-ZNP神经网络得到的log10E和
$ {R}_{42}^{} $ ,与相应实验值以及BNN理论值[47]之差(在线彩图)
-
摘要: 原子核低激发谱对深入理解原子核结构具有重要作用。采用多任务反向传播(Back Propagation,BP)的神经网络方法系统研究了原子核
$ {2}_{1}^{+} $ 和$ {4}_{1}^{+} $ 的激发能量。除了质子数和中子数外,通过在网络输入层增加一个有关原子核集体性的物理量,BP神经网络在0.1 MeV到数MeV的能量范围内很好地拟合了原子核的低激发能。相比五维集体哈密顿量(Five-Dimensional Collective Hamiltonian,5DCH)方法,BP神经网络更好地再现了原子核低激发能的同位素趋势,以及由壳效应导致的幻数原子核低激发能的突然增大,并且将$ {2}_{1}^{+} $ 和$ {4}_{1}^{+} $ 激发能的预言精度分别提高了约80%和75%,该预言精度与单任务神经网络基本一致,但是改进了对轻核区与缺中子核区低激发谱的学习能力,这说明多任务神经网络可以实现多种激发能量的统一精确计算。Abstract: The nuclear low-lying excitation spectra are very important for understanding nuclear structure. The excitation energies of$ {2}_{1}^{+} $ and$ {4}_{1}^{+} $ states are systematically studied by using the multi-task Back Propagation(BP) neural network method. The BP neural network can well fit the low-lying excitation energies in a large energy range from about 0.1 MeV to about several MeV, by including a physical quantity related to nuclear collectivity on input layer besides proton and neutron numbers. Compared with the five-dimensional Collective Hamiltonian(5DCH) method, BP neural network can better reproduce the isotope trend of low excitation energy of nuclei, including the rapid increase of low excitation energy of magic nuclei caused by shell effect. The prediction accuracy for$ {2}_{1}^{+} $ and$ {4}_{1}^{+} $ states is improved by about 80% and 75%, respectively, which are similar to those of single-task neural network, while the learning ability for low excitation spectra in light and neutron-deficient nuclei is improved, indicating that multi-task neural network can achieve a unified and precise calculation of multiple excitation energies. -
图 6 BP-ZNP神经网络得到的log10E和
$ {R}_{42}^{} $ ,与相应实验值以及BNN理论值[47]之差(在线彩图)表 1 不同方法计算的Mg、Ca、Kr、Sm、Pb同位素的低激发能量与实验数据的均方根偏差
同位素 激发能量 5DCH /MeV BP-ZN /MeV BP-ZNP /MeV Mg $ E\left({2}_{1}^{+}\right) $ 0.432 3 0.002 8 0.001 5 $ {E(4}_{1}^{+}) $ 2.229 7 0.014 5 0.004 1 Ca $ E\left({2}_{1}^{+}\right) $ 1.391 5 0.807 2 0.090 5 $ {E(4}_{1}^{+}) $ 1.934 3 0.478 2 0.018 1 Kr $ E\left({2}_{1}^{+}\right) $ 0.052 9 0.040 8 0.003 1 $ {E(4}_{1}^{+}) $ 0.279 9 0.035 3 0.037 4 Sm $ {E(2}_{1}^{+}) $ 0.049 0 0.012 6 0.001 5 $ {E(4}_{1}^{+}) $ 0.319 1 0.013 7 0.010 5 Pb $ E\left({2}_{1}^{+}\right) $ 0.608 9 0.598 0 0.041 5 $ {E(4}_{1}^{+}) $ 1.360 2 0.488 6 0.036 7 -
[1] BOHR A, MOTTELSSON B M. Nuclear Structure[M]. New York: Benjamin, 1975. [2] RING P, SCHUCK P. The Nuclear Many-Body Problem[M]. Heidelberg: Springer-Verlag, 1980. [3] CEJNAR P, JOLIE J, CASTEN R F. Review of Modern Physics, 2010, 82(3): 2155. doi: 10.1103/RevModPhys.82.2155 [4] LI Z P, SONG B Y, YAO J M, et al. Physics Letters B, 2013, 726(4-5): 866. doi: 10.1016/j.physletb.2013.09.035 [5] TOGASHI T, TSUNODA Y, OTSUKA T, et al. Physical Review Letters, 2016, 117(17): 172502. doi: 10.1103/PhysRevLett.117.172502 [6] QUAN S, LI Z P, VRETENAR D, et al. Physical Review C, 2018, 97(3): 031301(R). doi: 10.1103/PhysRevC.97.031301 [7] HEYDE K, WOOD J L. Review of Modern Physics, 2011, 83(4): 1467. doi: 10.1103/RevModPhys.83.1467 [8] FLAVIGNY F, GILLIBERT A, NALPAS L, et al. Physical Review Letters, 2013, 110(12): 122503. doi: 10.1103/PhysRevLett.110.122503 [9] GOTTARDO A, VERNEY D, DELAFOSSE C, et al. Physical Review Letters, 2016, 116(18): 182501. doi: 10.1103/PhysRevLett.116.182501 [10] XIANG J, LI Z P, LONG W H, et al. Physical Review C, 2018, 98(5): 054308. doi: 10.1103/PhysRevC.98.054308 [11] OTSUKA T, GADE A, SORLIN O, et al. Review of Modern Physics, 2020, 92(1): 015002. doi: 10.1103/RevModPhys.92.015002 [12] TSHOO K, SATOU Y, BHANG H, et al. Physical Review Letters, 2012, 109(2): 022501. doi: 10.1103/PhysRevLett.109.022501 [13] TANIUCHI R, SANTAMARIA C, DOORNENBAL P, et al. Nature, 2019, 569: 53. doi: 10.1038/s41586-019-1155-x [14] LIU H N, OBERTELLI A, DOORNENBAL P, et al. Physical Review Letters, 2019, 122(7): 072502. doi: 10.1103/PhysRevLett.122.072502 [15] NNDC National Nuclear Data Center, Brookhaven National Laboratory[EB/OL]. [2020-10-20]. http://www.nndc.bnl.gov/. [16] BREE N, WRZOSEK-LIPSKA K, PETTS A, et al. Physical Review Letters, 2014, 112(16): 162701. doi: 10.1103/PhysRevLett.112.162701 [17] STEPPENBECK D, YONEDA K, LEE J, et al. Physical Review Letters, 2015, 114(25): 252501. doi: 10.1103/PhysRevLett.114.252501 [18] PAUL N, CORSI A, OBERTELLI A, et al. Physical Review Letters, 2017, 118(3): 032501. doi: 10.1103/PhysRevLett.118.032501 [19] CRAWFORD H L, FALLON P, MACCHIAVELLI A O, et al. Physical Review Letters, 2019, 122(5): 052501. doi: 10.1103/PhysRevLett.122.052501 [20] CAURIER E, MARTÍNEZ-PINEDO G, NOWACKI F, et al. Review of Modern Physics, 2004, 77(2): 427. doi: 10.1103/RevModPhys.77.427 [21] LENZI S M, NOWACKI F, POVES A, et al. Physical Review C, 2010, 82(5): 054301. doi: 10.1103/PhysRevC.82.054301 [22] TSUNODA Y, OTSUKA T, SHIMIZU N, et al. Physical Review C, 2014, 89(3): 031301(R). doi: 10.1103/PhysRevC.89.031301 [23] NOWACKI F, POVES A, CAURIER E, et al. Physical Review Letters, 2016, 117(2): 272501. doi: 10.1103/PhysRevLett.117.272501 [24] UTSUNO Y, OTSUKA T, BROWN B A, et al. Physical Review C, 2012, 86(5): 051301(R). doi: 10.1103/PhysRevC.86.051301 [25] BENDER M, HEENEN P H, REINHARD P G, et al. Review of Modern Physics, 2003, 75(1): 121. doi: 10.1103/RevModPhys.75.121 [26] VRETENAR D, AFANASJEV A V, LALAZISSIS G A, et al. Physics Reports, 2005, 409(3-4): 101. doi: 10.1016/j.physrep.2004.10.001 [27] MENG J, TOKI H, ZHOU S G, et al. Progress in Particle and Nuclear Physics, 2006, 57(2): 470. doi: 10.1016/j.ppnp.2005.06.001 [28] STONE J R , REINHARD P G. Progress in Particle and Nuclear Physics, 2007, 58(2): 587. doi: 10.1016/j.ppnp.2006.07.001 [29] QUAN S, CHEN Q, LI Z P, et al. Physical Review C, 2017, 95(5): 054321. doi: 10.1103/PhysRevC.95.054321 [30] 庞龙刚, 周凯, 王新年. 原子核物理评论, 2020, 37(3): 720. doi: 10.11804/NuclPhysRev.37.2019CNPC41 PANG Longgang, ZHOU Kai, WANG Xinnian. Nuclear Physics Review, 2020, 37(3): 720. (in Chinese) doi: 10.11804/NuclPhysRev.37.2019CNPC41 [31] GAZULA S, CLARK J W, BOHR H. Nuclear Physics A, 1992, 540(1): 26. doi: 10.1016/0375-9474(92)90191-L [32] WU X H, ZHAO P W. Physical Review C, 2020, 101(5): 051301(R). doi: 10.1103/PhysRevC.101.051301 [33] WU X H, GUO L H, ZHAO P W. Physics Letters B, 2021, 819: 136387. doi: 10.1016/j.physletb.2021.136387 [34] COSTIRIS N J, MAVROMMATIS E, GERNOTH K A, et al. Physical Review C, 2009, 80(4): 044332. doi: 10.1103/PhysRevC.80.044332 [35] BAI J H, NIU Z M, SUN B Y, et al. Physics Letters B, 2021, 815: 136147. doi: 10.1016/j.physletb.2021.136147 [36] LASSERI R D, REGNIER D, EBRAN J P, et al. Physical Review Letters, 2020, 124: 162502. doi: 10.1103/PhysRevLett.124.162502 [37] NEAL R. Bayesian Learning of Neural Network[M]. New York: Springer, 1996. [38] UTAMA R, PIEKAREWICZ J, PROSPER H B. Physical Review C, 2016, 93(1): 014311. doi: 10.1103/PhysRevC.93.014311 [39] NIU Z M, LIANG H Z. Physics Letters B, 2018, 778: 48. doi: 10.1016/j.physletb.2018.01.002 [40] NEUFCOURT L, CAO Y C, NAZAREWICZ W, et al. Physical Review C, 2018, 98(3): 034318. doi: 10.1103/PhysRevC.98.034318 [41] NIU Z M, FANG J Y, NIU Y F. Physical Review C, 2019, 100(5): 054311. doi: 10.1103/PhysRevC.100.054311 [42] NIU Z M, LIANG H Z, SUN B H, et al. Physical Review C, 2019, 99(6): 064307. doi: 10.1103/PhysRevC.99.064307 [43] UTAMA R, CHEN W C, PIEKAREWICZ J. Journal of Physics G: Nuclear and Particle Physics, 2016, 43(11): 114002. doi: 10.1088/0954-3899/43/11/114002 [44] NEUFCOURT L, CAO Y, NAZAREWICZ W, et al. Physical Review Letters, 2019, 122(6): 062502. doi: 10.1103/PhysRevLett.122.062502 [45] WANG Z A, PEI J C, LIU Y. Physical Review Letters, 2019, 123(12): 122501. doi: 10.1103/PhysRevLett.123.122501 [46] 王子澳, 强雨, 裴俊琛. 原子核物理评论, 2020, 37(4): 918. doi: 10.11804/NuclPhysRev.37.2020027 WANG Ziao, QIANG Yu, PEI Junchen. Nuclear Physics Review, 2020, 37(4): 918. (in Chinese) doi: 10.11804/NuclPhysRev.37.2020027 [47] WANG Y F, ZHANG X Y, NIU Z M et al. Physics Letters B, 2022, 830: 137154. doi: 10.1016/j.physletb.2022.137154 [48] CASTEN R F, BRENNER D S, HAUSTEIN P E. Physical Review Letters, 1987, 58(7): 658. doi: 10.1103/PhysRevLett.58.658 [49] ZHAO P W, LI Z P, YAO J M, et al. Physical Review C, 2010, 82(5): 054319. doi: 10.1103/PhysRevC.82.054319 [50] CASTEN R F, ZAMFIR N V. Physical Review Letters, 2001, 87(5): 052503. doi: 10.1103/PhysRevLett.87.052503