基于神经网络模型的原子核基态自旋分布的随机相互作用研究

刘登; ALAMNoor A; 肖越; 雷杨; 覃珍珍

doi:10.11804/NuclPhysRev.41.2023CNPC13

基于神经网络模型的原子核基态自旋分布的随机相互作用研究

doi: 10.11804/NuclPhysRev.41.2023CNPC13

刘登^1,,
ALAMNoor A¹,
肖越¹,
雷杨^2, ,,
覃珍珍¹

1.
西南科技大学数理学院，四川绵阳 621010
2.
西南科技大学国防科技学院，四川绵阳 621010

基金项目: 国家自然科学基金资助项目(12105234)

详细信息

作者简介:
刘登(1998–)，男，四川泸州人，硕士研究生，从事原子核结构理论研究；E-mail: 1990404867@qq.com

通讯作者: 雷杨，E-mail: leiyang19850228@gmail.com

中图分类号: O571.53

Random Interaction Study on Angular-momentum Distribution of Nuclear Ground State with Neural Networks

1.
School of Mathematics and Physics, Southwest University of Science and Technology, Mianyang, 621010, Sichuan, China
2.
School of Defense and Technology, Southwest University of Science and Technology, Mianyang, 621010, Sichuan, China

Funds: National Natural Science Foundation of China (12105234)

More Information

Corresponding author: E-mail: leiyang19850228@gmail.com

摘要: 利用神经网络模型学习、模拟随机两体系综(TBRE)下的原子核基态自旋分布，并对学习后的模型输入特征进行了分析。这是核物理中利用神经网络模型进行分类的典型应用。研究表明，采用本工作的单隐藏层神经网络模型，精确地描述每个随机相互作用系综内的样本仍比较困难。然而，神经网络模型却能够相对较好地描述基态自旋的统计性质，这可能是因为神经网络模型学习到了TBRE中基态自旋分布的经验规律。
- 神经网络 /
- 随机两体系综 /
- 原子核基态自旋
Abstract: The neural network model is used to learn and simulate the ground state spin distribution of the nucleus under stochastic two-system ensemble (TBRE), and the input characteristics of the learned model are analyzed. This is a typical application of classification using neural network models in nuclear physics. We show that it is still difficult to accurately each the sample within random interaction ensemble using the single hidden layer neural network model in this paper. However, the NN model describes the statistical properties of the ground state spins reasonably well, probably because the NN model learned the empirical law of the ground state spin distribution in TBRE.
- neural network /
- two-body random ensemble /
- angular-momentum distribution of nuclear ground state

图 1 本文神经网络分类模型示意图

下载: 全尺寸图片幻灯片

图 2 在$(f_{7/2}^{})^4$空间中，神经网络模型预测准确率随着单隐藏层神经元数目的变化情况

下载: 全尺寸图片幻灯片

图 3 单隐藏层神经网络模型中使用$N$个神经元和$2N$个神经元的预测准确率差异

下载: 全尺寸图片幻灯片

图 4 在一个隐藏层拥有64个神经元的神经网络模型在不同激活函数(Sigmoid、Tanh和ReLU)下的预测准确率

下载: 全尺寸图片幻灯片

图 5 $(h_{11/2}^{})^4$模型空间中LBFGS、SGD、Adam三种不同优化算法的损失函数值随迭代次数的演化曲线

下载: 全尺寸图片幻灯片

图 6 不同的优化算法下的预测准确率

下载: 全尺寸图片幻灯片

图 7 不同的阈值特征选择下的预测准确率

下载: 全尺寸图片幻灯片

图 8 6个模型空间中，神经网络模型对基态自旋预测准确率与空间维数之间的负相关性

下载: 全尺寸图片幻灯片

图 9 $(f_{7/2}^{})^4$、$(h_{11/2}^{})^4$、$^{18}{\rm{Ne}}$、$^{20}{\rm{Ne}}$、$^{22}{\rm{Ne}}$、$^{46}{\mathrm{Ca}}$6个模型空间中神经网络对基态自旋预测的混淆矩阵。纵轴表示神经网络模型预测的基态自旋($I_{\rm{NN}}^{}$)，横轴表示壳模型计算得到的基态自旋($I_{\rm{SM}}^{}$)，其中的灰度深浅代表，在神经网络预测为基态自旋为$I_{\rm{NN}}^{}$的验证样本中，壳模型计算所得基态自旋为$I_{\rm{SM}}^{}$的概率的大小

下载: 全尺寸图片幻灯片

图 10 TBRE中，对于$(f_{7/2}^{})^4$、$(h_{11/2}^{})^4$、$^{18}{\rm{Ne}}$、$^{20}{\rm{Ne}}$、$^{22}{\rm{Ne}}$、$^{46}{\rm{Ca}}$6个模型空间，壳模型及神经网络模型所给出的不同自旋$I$作为基态自旋的概率$P_{{I}}^{}$，以及相应的经验规则预测结果(在线彩图)

黑色方块表示壳模型计算的基态自旋分布，红色圆圈表示神经网络模型预测的基态自旋分布，蓝色三角形使用壳模型利用经验规则给出的基态自旋分布，橄榄色菱形表示神经网络模型利用经验规则结出的基态自旋分布。

下载: 全尺寸图片幻灯片

表 1 6个模型空间所对应的TBRE样本量和神经网络模型输入输出参数

模型空间	TBRE 样本量	输入层神经元数 (两体矩阵元数)	输出层神经元数 (基态自旋数)
$(f_{7/2}^{})^4$	130 000	4	5
$(h_{11/2}^{})^4$	80 000	6	10
$^{18}{\rm{Ne}}$	90 000	30	5
$^{20}{\rm{Ne}}$	90 000	30	7
$^{22}{\rm{Ne}}$	100 000	30	8
$^{46}{\rm{Ca}}$	140 000	94	13

下载: 导出CSV

表 2 在只有每层隐藏层神经元数目均为64的情况下，$^{18}{\rm{Ne}}$，$^{20}{\rm{Ne}}$，$^{22}{\rm{Ne}}$和$^{46}{\rm{Ca}}$模型空间中，具有$n-1$层隐藏层和$n$层隐藏层的模型之间的预测准确率差值(最大的预测准确率差值用粗体表示)

隐藏层数	1	2	3
$^{18}{\rm{Ne}}$	16.15	1.61	−1.73
$^{20}{\rm{Ne}}$	10.82	3.70	−0.70
$^{22}{\rm{Ne}}$	8.92	2.77	−0.63
$^{46}{\rm{Ca}}$	2.28	−0.68	−0.13

下载: 导出CSV

表 3 使用四种不同的神经网络模型在6个模型空间上的预测准确率

NN类型	$(f_{7/2}^{})^4$	$(h_{11/2}^{})^4$	$^{18}{\rm{Ne}}$	$^{20}{\rm{Ne}}$	$^{22}{\rm{Ne}}$	$^{46}{\rm{Ca}}$
本文NN	97.78	97.54	85.68	68.87	78.94	55.74
BNN	97.11	96.65	84.70	68.31	79.63	56.09
CNN	96.63	82.29	85.32	62.74	73.04	54.35
RNN	96.58	97.37	85.91	68.61	80.23	55.71

下载: 导出CSV

表 4 $(f_{7/2}^{})^4$和$(h_{11/2}^{})^4$空间中，壳模型与神经网络模型基于经验规则所得两体矩阵元$G^J$与自旋$I$之间的关联。此处$G^J$代表两体相互作用矩阵元$G^J_{jj;\,jj}$(见式(1))，表中数字代表对应当$G^J=-1$，而其它矩阵元为0时，两模型得到的或预测的基态自旋$I_{g.s.}^{}$

空间	模型	$G^{0}$	$G^{2}$	$G^{4}$	$G^{6}$	$G^{8}$	$G^{10}$
$(f_{7/2}^{})^4$	壳模型	0	4	2	8
$(f_{7/2}^{})^4$	神经网络	0	4	2	8
$(h_{11/2}^{})^4$	壳模型	0	4	0	4	8	16
$(h_{11/2}^{})^4$	神经网络	0	4	0	4	8	16

下载: 导出CSV

表 5 神经网络模型的预测准确率和壳模型和神经网络模型基于经验规则预测的基态自旋$I$的一致率。

模型空间	$(f_{7/2}^{})^4$	$(h_{11/2}^{})^4$	$^{18}{\rm{Ne}}$	$^{20}{\rm{Ne}}$	$^{22}{\rm{Ne}}$	$^{46}{\rm{Ca}}$
预测准确率 (%)	98	97	86	68	80	56
$G$的个数	4	6	30	30	30	94
预测$I$正确个数	4	6	30	18	24	70
预测$I$一致率 (%)	100	100	100	60	80	74

下载: 导出CSV

表 6 针对$^{18}{\mathrm{Ne}}$、$^{20}{\mathrm{Ne}}$、$^{22}{\mathrm{Ne}}$空间，以$G^J_{j_1^{}j_2^{};\,j_3^{}j_4^{}}$表示两体相互作用的矩阵元，其中下标$j_1^{}, \, j_2^{}, \, j_3^{}, \, j_4^{}$简记为1、2、3，分别对应$sd$壳中的$s_{1/2}^{}$、$d_{3/2}^{}$、$d_{5/2}^{}$轨道。$I=0 \sim 4$表示壳模型中自旋为0、1、2、3、4的多重简并态(基于神经网络模型和壳模型的经验规则预测的基态自旋$I$不一致的情况以粗体突出显示)

$G^J_{j_1^{}j_2^{};j_3^{}j_4^{}}$	$^{18}{\rm{Ne}}$		$^{20}{\rm{Ne}}$		$^{22}{\rm{Ne}}$
$G^J_{j_1^{}j_2^{};j_3^{}j_4^{}}$	SM	NN	SM	NN	SM	NN
$G^{0}_{1111}$	0	0	0~4	0	0~6	0
$G^{0}_{1122}$	0	0	0,2,4	0	0,2,4	0
$G^{0}_{1133}$	0	0	0	0	0,2	0
$G^{0}_{2222}$	0	0	0,2~4	0	0~5	0
$G^{0}_{2233}$	0	0	0	0	0	0
$G^{0}_{3333}$	0	0	0	0	0~2	0
$G^{1}_{1212}$	1	1	1	0	0	0
$G^{1}_{1223}$	1	1	2	0	0	0
$G^{1}_{2323}$	1	1	0	0	0	3
$G^{2}_{1212}$	2	2	0,2	0	0	0
$G^{2}_{1213}$	2	2	2	0	2	2
$G^{2}_{1222}$	2	2	1~4	0	0~6	0
$G^{2}_{1223}$	2	2	0	0	0	2
$G^{2}_{1233}$	2	2	0	0	0	0
$G^{2}_{1313}$	2	2	4	2	0,2,4	2
$G^{2}_{1322}$	2	2	0	0	0	0
$G^{2}_{1323}$	2	2	0	2	0	0
$G^{2}_{1333}$	2	2	2	2	0~4	2
$G^{2}_{2222}$	2	2	0	0	0,2~4	0
$G^{2}_{2223}$	2	2	2	0	2,3	0
$G^{2}_{2233}$	2	2	0	0	0	0
$G^{2}_{2323}$	2	2	2	0	0	0
$G^{2}_{2333}$	2	2	0	0	0	0
$G^{2}_{3333}$	2	2	2	0	0	0
$G^{3}_{1313}$	3	3	5	2	0,2,4	3
$G^{3}_{1323}$	3	3	4	0	3	0
$G^{3}_{2323}$	3	3	0	0	0	0
$G^{4}_{2323}$	4	4	6	6	6	6
$G^{4}_{2333}$	4	4	4	0	2,3	0
$G^{4}_{3333}$	4	4	4	4	0	0

下载: 导出CSV

表 7 同表6，但针对$^{46}$Ca空间。下标$j_1^{}, \, j_2^{}, \, j_3^{}, \, j_4^{}$简记为1、2、3、4，分别对应$pf$壳中的$p_{1/2}^{}$、$p_{3/2}^{}$、$f_{5/2}^{}$和$f_{7/2}^{}$轨道

$G^J_{j_1^{}j_2^{};j_3^{}j_4^{}}$	SM	NN	$G^I_{j_1^{}j_2^{};j_3^{}j_4^{}}$	SM	NN	$G^I_{j_1^{}j_2^{};j_3^{}j_4^{}}$	SM	NN
$G^{0}_{1111}$	0~10	0	$G^{2}_{2223}$	1,2,4,5	0	$G^{3}_{2334}$	0	0
$G^{0}_{1122}$	0~10	0	$G^{2}_{2224}$	0	0	$G^{3}_{2424}$	0	0
$G^{0}_{1133}$	0,2~6	0	$G^{2}_{2233}$	0,2~4,6	0	$G^{3}_{2434}$	0	0
$G^{0}_{1144}$	0~4	0	$G^{2}_{2234}$	0	0	$G^{3}_{3434}$	0,10	0
$G^{0}_{2222}$	0~10	0	$G^{2}_{2244}$	0,2~4	0	$G^{4}_{1414}$	0,2,4~6,8	8
$G^{0}_{2233}$	0,2,4,6	0	$G^{2}_{2323}$	0	0	$G^{4}_{1423}$	2	0
$G^{0}_{2244}$	0	0	$G^{2}_{2324}$	0	0	$G^{4}_{1424}$	6	0
$G^{0}_{3333}$	0~6	0	$G^{2}_{2333}$	0,2~4,6	0	$G^{4}_{1433}$	0	0
$G^{0}_{3344}$	0	0	$G^{2}_{2334}$	0,10	0	$G^{4}_{1434}$	1	0
$G^{0}_{4444}$	0~4	0	$G^{2}_{2344}$	0	0	$G^{4}_{1444}$	0~4	0
$G^{1}_{1212}$	0	0	$G^{2}_{2424}$	0,9	0	$G^{4}_{2323}$	6	0
$G^{1}_{1223}$	0	0	$G^{2}_{2433}$	0	0	$G^{4}_{2324}$	2	0
$G^{1}_{1234}$	0,9	0	$G^{2}_{2434}$	0	0	$G^{4}_{2333}$	1~6	0
$G^{1}_{2323}$	0	0	$G^{2}_{2444}$	0	0	$G^{4}_{2334}$	0,9	0
$G^{1}_{2334}$	0	0	$G^{2}_{3333}$	0	0	$G^{4}_{2344}$	4	0
$G^{1}_{3434}$	1,8	0	$G^{2}_{3334}$	0	0	$G^{4}_{2424}$	0	0
$G^{2}_{1212}$	0	0	$G^{2}_{3344}$	0	0	$G^{4}_{2433}$	0	0
$G^{2}_{1213}$	2	0	$G^{2}_{3434}$	4	0	$G^{4}_{2434}$	3	0
$G^{2}_{1222}$	0~10	0	$G^{2}_{3444}$	0	0	$G^{4}_{2444}$	0,2~4	0
$G^{2}_{1223}$	0,4,6	0	$G^{2}_{4444}$	2	2	$G^{4}_{3333}$	0	0
$G^{2}_{1224}$	0	0	$G^{3}_{1313}$	0,2,4	3	$G^{4}_{3334}$	0	0
$G^{2}_{1233}$	0	0	$G^{3}_{1314}$	3	0	$G^{4}_{3344}$	0,10	0
$G^{2}_{1234}$	0,9	0	$G^{3}_{1323}$	3	0	$G^{4}_{3434}$	0	0
$G^{2}_{1244}$	0	0	$G^{3}_{1324}$	4	0	$G^{4}_{3444}$	0	0
$G^{2}_{1313}$	0,2,4	2	$G^{3}_{1334}$	4	0	$G^{4}_{4444}$	4	4
$G^{2}_{1322}$	0,2,4,6	0	$G^{3}_{1414}$	0,2,4~8	2	$G^{5}_{2424}$	10	9
$G^{2}_{1323}$	0	0	$G^{3}_{1423}$	0	0	$G^{5}_{2434}$	0	0
$G^{2}_{1324}$	0	0	$G^{3}_{1424}$	0	0	$G^{5}_{3434}$	1	0
$G^{2}_{1333}$	0~8	0	$G^{3}_{1434}$	0	0	$G^{6}_{3434}$	12	10
$G^{2}_{1334}$	2	0	$G^{3}_{2323}$	3	0	$G^{6}_{3444}$	0	0
$G^{2}_{1344}$	2	0	$G^{3}_{2324}$	0	2	$G^{6}_{4444}$	6	6
$G^{2}_{2222}$	0~6	0

下载: 导出CSV

[1]	WEIDENMÜLLER H A, MITCHELL G E. Rev Mod Phys, 2009, 81: 539. doi: 10.1103/RevModPhys.81.539
[2]	BOHIGAS O, GIANNONI M J, SCHMIT C. Phys Rev Lett, 1984, 52: 1. doi: 10.1103/PhysRevLett.52.1
[3]	WONG S, FRENCH J B. Nucl Phys A, 1972, 198(1): 188. doi: 10.1016/0375-9474(72)90779-8
[4]	BOHIGAS O, FX J F. Phys Lett B, 1971, 34(4): 261. doi: 10.1016/0370-2693(71)90598-3
[5]	FRENCH J B, WONG S. Phys Lett B, 2001, 33(7): 449. doi: 10.1016/0370-2693(71)90424-2
[6]	MAYER M G. Phys Rev, 1948, 74(3): 235. doi: 10.1103/PhysRev.74.235
[7]	HAXEL O, JENSEN H, SUESS H E. Phys Rev, 1949, 75(11): 1766. doi: 10.1103/PhysRev.75.1766.2
[8]	ZELEVINSKY V, BROWN B A, FRAZIER N, et al. Physics Reports, 1996, 276(2-3): 85. doi: 10.1016/S0370-1573(96)00007-5
[9]	GUHR T, MÜLLER-GROELING A, WEIDENMÜLLER H. Physics Reports, 1998, 299: 198. doi: 10.1016/S0370-1573%2897%2900088-4
[10]	KOTA V. Physics Reports, 2001, 347(3): 223. doi: 10.1016/S0370-1573(00)00113-7
[11]	ZELEVINSKY V, VOLYA A. Physics Reports, 2004, 391(3): 311.
[12]	JOHNSON C W, BERTSCH G F, DEAN D J. Phys Rev Lett, 1998, 80(13):2749. doi: 10.1103/PhysRevLett.80.2749
[13]	JOHNSON C W, BERTSCH G F, DEAN D J, et al. Phys Rev C, 1999, 61: 01431.
[14]	BIJKER R, FRANK A. Phys Rev Lett, 2000, 84(3): 420. doi: 10.1103/PhysRevLett.84.420
[15]	KUSNEZOV D, ZAMFIR N V, CASTEN R F. Phys Rev Lett, 2000, 85(7): 1396. doi: 10.1103/PhysRevLett.85.1396
[16]	BIJKER R, FRANK A, PITTEL S. Phys Rev C, 1999, 60(2): 021302 . doi: 10.1103/PhysRevC.60.021302
[17]	MULHALL D, VOLYA A, ZELEVINSKY V. Phys Rev Lett, 2000, 85(19): 4016. doi: 10.1103/PhysRevLett.85.4016
[18]	ZHAO Y, ARIMA A. Phys Rev C, 2001, (4): 64. doi: 10.1103/PhysRevC.64.041301
[19]	KUSNEZOV D. Phys Rev Lett, 2000, 85(18): 3773. doi: 10.1103/PhysRevLett.85.3773
[20]	BIJKER R, FRANK A. Phys Rev C, 2001, 64(6): 061303. doi: 10.1103/PhysRevC.64.061303
[21]	BIJKER R, FRANK A. Phys Rev C, 2002, 65: 044316. doi: 10.1103/PhysRevC.65.044316
[22]	KAPLAN L, PAPENBROCK T, JOHNSON C W. Phys Rev C, 2000, 63(1): 014307. doi: 10.1103/PhysRevC.63.014307
[23]	KAPLAN L, PAPENBROCK T. Phys Rev Lett, 2000, 84(20): 4553. doi: 10.1103/PhysRevLett.84.4553
[24]	DROZDZ S, WOJCIK M. Physica A Statal Mechanics & Its Applications, 2001, 301(1): 291.
[25]	沈佳杰. 原子核物理评论, 2020, 37(3): 7. doi: 10.11804/NuclPhysRev.37.2019CNPC15 SHEN Jiajie. Nuclear Physics Review, 2020, 37(3): 7. (in Chinese) doi: 10.11804/NuclPhysRev.37.2019CNPC15
[26]	CHAU HUU-TAI P, FRANK A, SMIRNOVA N A, et al. Phys Rev C, 2002, 66: 061302. doi: 10.1103/PhysRevC.66.061302
[27]	ZHAO Y M, ARIMA A, YOSHINAGA N. Physics Reports, 2004, 400: 1. doi: 10.1016/j.physrep.2004.07.004
[28]	GAZULA S, CLARK J W, BOHR H. Nuclear Physics A, 1992, 540(1-2): 1. doi: 10.1016/0375-9474(92)90191-L
[29]	HE W, LI Q, MA Y, et al. Science China Physics, Mechanics & Astronomy, 2023, 66(8): 282001. doi: 10.1007/s11433-023-2116-0
[30]	UTAMA R, PIEKAREWICZ J, PROSPER H B. Phys Rev C, 2016.93: 014311. doi: 10.1103/PhysRevC.93.014311
[31]	NIU Z, LIANG H. Phys Lett B, 2018, 778: 48. doi: 10.1016/j.physletb.2018.01.002
[32]	田大川, 陈寿万, 牛中明. 中国科学: 物理学、力学、天文学, 2022, 52(5): 252007. doi: 10.1360/SSPMA-2021-0301 TIAN D C, Chen S W, NIU Z M. Sci Sin-Phys Mech Astron, 2022, 52(5): 252007. (in Chinese) doi: 10.1360/SSPMA-2021-0301
[33]	赵天亮, 张鸿飞. 中国科学: 物理学、力学、天文学, 2022, 52(5): 252008. doi: 10.1360/SSPMA-2021-0304 ZHAO T L, ZHANG H F. Sci Sin-Phys Mech Astron, 2022, 52(5): 252008. (in Chinese) doi: 10.1360/SSPMA-2021-0304
[34]	UTAMA R, CHEN W C, PIEKAREWICZ J. Journal of Physics G Nuclear & Particle Physics, 2016, 43(11): 114002. doi: 10.1088/0954-3899/43/11/114002
[35]	王逸夫, 牛中明. 原子核物理评论, 2022, 39(3): 273. doi: 10.11804/NuclPhysRev.39.2022043 WANG Yifu, NIU Zhongming. Nuclear Physics Review, 2022, 39(3): 273. (in Chinese) doi: 10.11804/NuclPhysRev.39.2022043
[36]	WANG Y, ZHANG X, NIU Z, et al. Phys Lett B, 2022, 830: 137154. doi: 10.1016/j.physletb.2022.137154
[37]	卜炫德, 吴迪, 白春林. 中国科学: 物理学、力学、天文学, 2022, 52(5): 252005. doi: 10.1360/SSPMA-2021-0312 BU X D, WU D, BAI C L. Sci Sin-Phys Mech Astron, 2022, 52(5): 252005. (in Chinese) doi: 10.1360/SSPMA-2021-0312
[38]	李鹏, 白景虎, 牛中明, 等. 中国科学: 物理学、力学、天文学, 2022, 52(5): 252006. doi: 10.1360/SSPMA-2021-0299 LI P, BAI J H, NIU Z M, et al. Sci Sin-Phys Mech Astron, 2022, 52(5): 252006. (in Chinese) doi: 10.1360/SSPMA-2021-0299
[39]	NIU Z, NIU Y, LIANG H, et al. Phys Lett B, 2013,723(1): 172. doi: 10.1016/j.physletb.2013.04.048
[40]	彭丹, 魏慧玲, 普洁, 等. 中国科学: 物理学、力学、天文学, 2022, 52(5): 252012. doi: 10.1360/SSPMA-2021-0298 Peng D, Wei H L, Pu J, et al. Sci Sin-Phys Mech Astron, 2022, 52(5): 252012. (in Chinese) doi: 10.1360/SSPMA-2021-0298
[41]	易佳怡, 乔春源, 裴俊琛, 等. 中国科学: 物理学、力学、天文学, 2022, 52(5): 252013. doi: 10.1360/SSPMA-2021-0340 YI J Y, QIAO C Y, PEI J C, et al. Sci Sin-Phys Mech Astron, 2022, 52(5): 252013. (in Chinese) doi: 10.1360/SSPMA-2021-0340
[42]	温湖峰, 尚天帅, 李剑, 等. 物理学报, 2023, 72(15): 152101. doi: 10.7498/aps.72.20230530 WEN H F, SHANG T S, LI J, et al. Acta Phys. Sin., 2023, 72(15): 152101. doi: 10.7498/aps.72.20230530
[43]	LECUN Y, BENGIO Y, HINTON G. Nature, 2015, 521(7553): 436. doi: 10.1038/nature14539
[44]	MOUNT J. The Equivalence of Logistic Regression and Maximum Entropymodels[EB/OL].[2023-06-15]. https://api.sem-anticscholar-.org/CorpusID:8034169
[45]	GLOROT X, BORDES A, BENGIO Y. Deep Sparse Rectifier Neural Networks[C/OL]//International Conference on Artificial Intelligence and Statistics. 2011. https://api.semanticscholar.org/CorpusID:2239473.
[46]	GLOROT X, BORDES A, BENGIO Y. Journal of Machine Learning Research, 2011, 15: 315.
[47]	WILLIAMS C K I, BARBER D. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1999, 20(12): 1342. doi: 10.1109/34.735807
[48]	KINGMA D P, BA J. Adam: A Method for Stochastic Optimization [C/OL]//BENGIO Y, LECUN Y. 3rd International Conference on Learning Representations, ICLR 2015, San Diego, CA, USA, May 7- 9, 2015, Conference Track Proceedings. 2015. http://arxiv.org/abs/1412.6980.
[49]	LAWSON R D. Theory of the Nuclear Shell Model[M]. Washington D C: U.S. Department of Energy, 1980.
[50]	DUBEY S R, SINGH S K, CHAUDHURI B B. Neurocomputing, 2022, 503: 92. doi: 10.1016/j.neucom.2022.06.111
[51]	SEDGWICK P. BMJ, 2012,345: e4483. doi: 10.1136/bmj.e4483

点击查看大图

图(10) / 表 (7)

计量

文章访问数: 52
HTML全文浏览量: 16
PDF下载量: 6
被引次数: 0

全文HTML

0. 引言

原子核是一个典型的复杂多体量子系统。原子核在随机相互作用系综内的规律性鲁棒特征为量子多体问题研究提供了另一种途径。随机相互作用研究可以追溯到随机矩阵的研究^[1]。在这类研究中，随机数被作为核多体哈密顿量矩阵元。对角化这样的随机矩阵得到的能谱统计性质可以与实验进行对比，并进一步与量子混沌现象联系起来^[2]。20世纪70年代，文献[3–5]将这类使用随机数作为核理论输入的想法引入壳模型(Shell Model, SM)^[6–7]，即使用随机数的两体相互作用矩阵元作为壳模型输入，以观察这种虚拟核的能谱统计特征，以定量方式说明原子核中的量子混沌现象^{[5, 8–11]}。这样的大样本虚拟核数据集就形成了随机两体系综(two-body random ensemble, TBRE)。

上述工作的持续深入使人们意识到，原子核的许多能谱统计相关的特征与构成粒子之间的相互作用细节可能并没有必然联系。因此，TBRE就可以成为探索原子核与相互作用细节无关的内禀特征的适用平台。受上述思想的启发，Johnson等^[12–13]在TBRE中针对原子核低激发态性质进行统计，获得一系列与核子相互作用无关的原子核低激发态鲁棒特征。这其中最典型的特征是，在TBRE中，偶偶核的基态自旋为0的概率远远大于自旋为0的基矢在全空间中所占比重。这就被称为原子核基态零自旋占优现象(predominance of I = 0 ground state)。随后该现象也在玻色子体系中被发现^[14–15]。

实验上，偶偶核的基态自旋的确均为零。但是通常一般认为这是核力短程性所形成对力驱使核子配对的一种直接体现。然而，在TBRE中，两体相互作用矩阵元全部是随机的。对力在其中并不占优。原子核基态零自旋占优现象之所以值得注意，是因为它违反了人们的朴素认知：“零自旋基态源自于核子配对”。在TBRE中，就算相互作用没有对力，也有很大概率得到零自旋基态。

基态零自旋占优现象的发现是颠覆性的，但是理解它则极具挑战。因为解释这种现象，相当于要从数学上计算各种自旋作为基态的概率分布。而核模型是典型的非线性系统，难以适用统计推断理论。一直以来，学者们就尝试唯象地使用多种可计算量来理解TBRE中原子核基态自旋的分布，如每个自旋的最低特征值的分布^[14]和分布宽度^[16]，自旋耦合的几何混沌性^[17]，最大和最小的对角线矩阵元^[18]，在TBRE玻色子体系尝试给出不同自旋的最低本征值极限表示及与之对应基态概率^[19–21]，不同自旋基态的波函数特征^[22–23]，不同自旋基态的能量尺度特征^[24]，沈佳杰等^[25]使用真实的剩余两体相互作用作为随机两体矩阵元分布的中心值，发现基态零自旋的概率与两体矩阵元分布的中心值具有很大的相关性，等等。

在上述探索基础上，一些经验规则被提出以预测基态自旋概率分布，如，Kusnezov等^[19]使用随机多项式方法可以先验地给出$ sp $玻色子的概率分布，其结果与Bijker等^[20–21]利用平均场方法，通过考虑哈密顿函数的势能面与几何形状之间的关系所得到的结果是一致的；Chau等^[26]讨论了d玻色子系统和$ f_{7/2}^{} $壳层4个费米子的情况，说明特定自旋基态与原子核特征量所决定的几何形状之前的关联，进而预测相应自旋基态存在的概率；Zhao等^[27]指出TBRE中偶偶核基态零自旋占优现象可能与某些特定两体相互作用矩阵元相关，进而提出了一套较为普适的经验规则来预测基态自旋分布。需要指出的是，经验规则相当于将基态自旋零占优的决定因素归结为某些具体两体矩阵元，有利于从微观机制出发解释这一现象，因此，这个规则也被应用于全文分析中。

但上述前人工作均受困于核模型的复杂性。为解决这一困境，可以使用一种可被理解的简单模型来模拟壳模型行为，以此找到基态自旋分布与相互作用之间的具体关联，从而为最终解释基态零自旋占优现象提供方法学支撑。神经网络模型(Neural Networks, NN)可以被看作是这种简单模型的候选方法。它具有强大的学习、预测能力与适应能力^[28]，以应对多种复杂问题，如语言翻译、语音识别、计算机视觉、自动驾驶乃至一些复杂物理系统。就基态自旋分布问题而言，可以将TBRE样本中的相互作用矩阵元作为NN的输入，基态自旋作为输出，利用这样的NN模型来学习TBRE中的壳模型的基态自旋行为，从而得到一种结构相对比较简单，可用于分析相互作用与基态自旋之间关联的壳模型近似。TBRE可以为NN学习提供巨量甚至是无限不重复的数据集，有利于提升NN的泛化能力，使其能够更有效地模拟壳模型基态自旋特征。这也是使用NN分析TBRE中的原子核鲁棒行为的一大优势。

近年来，低能核结构研究中已经引入多种神经网络模型^[29]，用来预测原子核的各种性质以辅助分析核实验数据。如，改进核质量的描述和预言^[30–33]、预测核电荷半径^[34]、研究原子核低激发谱^[35–36]、描述α衰变半衰期^[37]、描述β衰变寿命^[38–39]、预测核散裂反应中产物截面^[40]、评价核裂变碎片产额分布^[41]等等。但是这些工作主要关注了神经网络模型的拟合能力。而预测TBRE样本的基态自旋本质是一种分类问题^[42]。将NN的分类能力应用于低能核结构研究仍是不多见的。本文的神经网络模型的架构可能为这方面的应用提供参考。

3. 结论

本论文旨在利用神经网络模型研究随机两体相互作用系综下原子核的基态自旋分布。尝试使用Softmax分类神经网络模型，在TBRE中，模拟壳模型所隐含的相互作用矩阵元与基态自旋之前的关联，预测基态概率分布，从模型预测准确率与经验规则两个方面验证了该模型的可靠性。

需要注意的是，此前核物理中神经网络模型的应用更多的是借助其强大的拟合能力，而分析TBRE中的基态自旋分布是神经网络分类能力的具体应用，在当前核物理研究中是不多见的。另一方面，TBRE可为神经网络训练提供巨量数据集，使神经网络模型天然地适用于TBRE中的原子核鲁棒性分析。

研究发现，量子多体系统问题仍然相当复杂，使用本文的单隐藏层神经网络模型来精确地描述它仍比较困难。未来期望有更专门的神经网络结构能够用于精确分析原子核基态自旋的确定性因素。但是神经网络模型能够合理地描述原子核基态自旋相关的一些整体统计性质，如基态自旋分布、混淆矩阵的对角主导特征。这可能是因为神经网络模型具有学习和重现原子核基态自旋的简单经验规则的能力，从而能够从统计上弥补对个体样本理解的偏差。因此，神经网络模型在描述量子多体系统的统计性质与鲁棒性质方面可能具有一定的潜力，进一步研究和发展更专门的神经网络结构来模拟复杂的量子多体系统值得关注。

参考文献 (51)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于神经网络模型的原子核基态自旋分布的随机相互作用研究

doi: 10.11804/NuclPhysRev.41.2023CNPC13

作者简介:
刘登(1998–)，男，四川泸州人，硕士研究生，从事原子核结构理论研究；E-mail: 1990404867@qq.com

通讯作者: 雷杨，E-mail: leiyang19850228@gmail.com

Random Interaction Study on Angular-momentum Distribution of Nuclear Ground State with Neural Networks

Corresponding author: E-mail: leiyang19850228@gmail.com

计量

基于神经网络模型的原子核基态自旋分布的随机相互作用研究

doi: 10.11804/NuclPhysRev.41.2023CNPC13

1. 西南科技大学数理学院，四川绵阳 621010

2. 西南科技大学国防科技学院，四川绵阳 621010

作者简介:
刘登(1998–)，男，四川泸州人，硕士研究生，从事原子核结构理论研究；E-mail: 1990404867@qq.com

通讯作者: 雷杨，E-mail: leiyang19850228@gmail.com

English Abstract

Random Interaction Study on Angular-momentum Distribution of Nuclear Ground State with Neural Networks

1. School of Mathematics and Physics, Southwest University of Science and Technology, Mianyang, 621010, Sichuan, China

2. School of Defense and Technology, Southwest University of Science and Technology, Mianyang, 621010, Sichuan, China

Corresponding author: E-mail: leiyang19850228@gmail.com

全文HTML

1.1. 随机两体系综

1.2. 分类神经网络

1.3. 网络结构优化

2.1. 模型预测准确性的分析

2.2. 经验规则的分析

目录

留言板

基于神经网络模型的原子核基态自旋分布的随机相互作用研究

doi: 10.11804/NuclPhysRev.41.2023CNPC13

作者简介: 刘登(1998–)，男，四川泸州人，硕士研究生，从事原子核结构理论研究；E-mail: 1990404867@qq.com

通讯作者: 雷杨，E-mail: leiyang19850228@gmail.com

Random Interaction Study on Angular-momentum Distribution of Nuclear Ground State with Neural Networks

Corresponding author: E-mail: leiyang19850228@gmail.com

计量

出版历程

基于神经网络模型的原子核基态自旋分布的随机相互作用研究

doi: 10.11804/NuclPhysRev.41.2023CNPC13

1. 西南科技大学数理学院，四川 绵阳 621010 2. 西南科技大学国防科技学院，四川 绵阳 621010

作者简介: 刘登(1998–)，男，四川泸州人，硕士研究生，从事原子核结构理论研究；E-mail: 1990404867@qq.com

通讯作者: 雷杨，E-mail: leiyang19850228@gmail.com

English Abstract

Random Interaction Study on Angular-momentum Distribution of Nuclear Ground State with Neural Networks

1. School of Mathematics and Physics, Southwest University of Science and Technology, Mianyang, 621010, Sichuan, China 2. School of Defense and Technology, Southwest University of Science and Technology, Mianyang, 621010, Sichuan, China

Corresponding author: E-mail: leiyang19850228@gmail.com

全文HTML

1.1. 随机两体系综

1.2. 分类神经网络

1.3. 网络结构优化

2.1. 模型预测准确性的分析

2.2. 经验规则的分析

目录

作者简介:
刘登(1998–)，男，四川泸州人，硕士研究生，从事原子核结构理论研究；E-mail: 1990404867@qq.com

1. 西南科技大学数理学院，四川绵阳 621010

2. 西南科技大学国防科技学院，四川绵阳 621010

作者简介:
刘登(1998–)，男，四川泸州人，硕士研究生，从事原子核结构理论研究；E-mail: 1990404867@qq.com

1. School of Mathematics and Physics, Southwest University of Science and Technology, Mianyang, 621010, Sichuan, China

2. School of Defense and Technology, Southwest University of Science and Technology, Mianyang, 621010, Sichuan, China