高级检索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于机器学习的多中子探测技术

杜泽宇 黄思维 杨再宏 李奇特 边佳伟

杜泽宇, 黄思维, 杨再宏, 李奇特, 边佳伟. 基于机器学习的多中子探测技术[J]. 原子核物理评论, 2024, 41(1): 402-408. doi: 10.11804/NuclPhysRev.41.2023CNPC64
引用本文: 杜泽宇, 黄思维, 杨再宏, 李奇特, 边佳伟. 基于机器学习的多中子探测技术[J]. 原子核物理评论, 2024, 41(1): 402-408. doi: 10.11804/NuclPhysRev.41.2023CNPC64
Zeyu DU, Siwei HUANG, Zaihong YANG, Qite LI, Jiawei BIAN. Multi-neutron Detection Based on Machine Learning[J]. Nuclear Physics Review, 2024, 41(1): 402-408. doi: 10.11804/NuclPhysRev.41.2023CNPC64
Citation: Zeyu DU, Siwei HUANG, Zaihong YANG, Qite LI, Jiawei BIAN. Multi-neutron Detection Based on Machine Learning[J]. Nuclear Physics Review, 2024, 41(1): 402-408. doi: 10.11804/NuclPhysRev.41.2023CNPC64

基于机器学习的多中子探测技术

doi: 10.11804/NuclPhysRev.41.2023CNPC64
基金项目: 国家重点研发计划项目(2022YFA1605100, 2023YFE0101500);国家自然科学基金资助项目(12275006);北京大学核物理与核技术国家重点实验室自主科研课题资助项目(NPT2022ZZ02)和开放课题资助项目(NPT2020KFY06)
详细信息
    作者简介:

    杜泽宇 (2001−),男,山东潍坊人,博士研究生,从事实验核物理研究;E-mail: duzeyu@pku.edu.cn

    通讯作者: 杨再宏,E-mail: zaihong.yang@pku.edu.cn
  • 中图分类号: O571.53

Multi-neutron Detection Based on Machine Learning

Funds: National Key Research and Development Program (2022YFA1605100, 2023YFE0101500); National Natural Science Foundation of China (12275006); State Key Laboratory of Nuclear Physics and Technology, Peking University (NPT2022ZZ02, NPT2020KFY06)
More Information
  • 摘要: 中子滴线区的丰中子原子核结构是当前放射性核束物理研究的前沿热点之一。通过直接探测这些不稳定原子核衰变中发射的中子,不仅能提取核内部的多中子关联,也为丰中子核物质的性质研究提供重要的线索。为满足开展多中子探测实验的需求,本工作发展了基于机器学习的多中子识别算法,以大量的模拟数据作为训练样本,构建深度神经网络来逐事件判定反应的中子数,并进一步挑选出真实中子。本工作的结果表明,机器学习算法的四中子探测效率为~15%,传统算法为~1%,机器学习算法能将四中子探测效率显著提升10倍以上,有望应用到多中子探测实验中。
  • 图  1  丰中子核反应实验的典型实验布局

    图  2  单中子反应道的中子棒打火数分布

    图  3  (a) 第一类串扰信号的排除判据,(b) 单中子反应道中两个信号的时间差与位置分布(在线彩图)

    图  4  (a) 第二类串扰信号的排除判据,(b) 单中子反应道$ \beta_{01}/\beta_{12} $与$ Q_1 $分布(在线彩图)

    图  5  第一步深度神经网络工作原理

    图  6  (a)双中子反应道 (b)四中子反应道(对机器学习的统计做了1/10的调整)的重建能谱(在线彩图)

    图  7  两种算法给出的四中子探测效率随相对能变化的曲线

    表  1  神经网络采用的超参数

    超参数 第一步 第二步
    输入层特征数 2 086 14
    隐藏层数目 3 12
    隐藏层神经元数量 1 024, 256, 128 200
    隐藏层激活函数 relu relu
    输出层激活函数 sigmoid sigmoid
    优化算法 Adagrad Adagrad
    损失函数 交叉熵 交叉熵
    学习率 0.003 0.001
    epoch 2 5
    batch size 1 000 1 000
    下载: 导出CSV

    表  2  两种多中子识别算法的串扰排除率与多中子误判率

    传统算法 机器学习算法
    2n串扰排除率/% 98.43 99.40
    2n误判率/% 3.83 1.33
    4n串扰排除率/% 99.53 99.69
    4n误判率/% 18.34 13.75
    下载: 导出CSV
  • [1] 核物理与等离子体物理发展战略研究编写组. 核物理与等离子体物理: 学科前沿及发展战略(上册: 核物理卷)[M]. 北京:科学出版社, 2017.

    The Research and Development Strategy Team for Nuclear Physics and Plasma Physics. Frontiers and Development Strategies in Nuclear and Plasma Physics: Nuclear Physics Volume[M]. Beijing: Science Press, 2017. (in Chinese)
    [2] 马余刚. 《原子核物理新进展》[M]. 上海: 上海交通大学出版社, 2021.

    MA Yugang. New Developments in Atomic Nuclear Physics[M]. Shanghai: Shanghai Jiaotong University Press, 2021. (in Chinese)
    [3] YANG Z, HUANG S. Science Bulletin, 2021, 66(20): 2054. doi:  10.1016/j.scib.2021.07.009
    [4] HUANG S, YANG Z. Frontiers in Physics, 2023, 11: 1233175. doi:  10.3389/fphy.2023.1233175
    [5] JOHANSSON H, AKSYUTINA Y, AUMANN T, et al. Nuclear Physics A, 2010, 847(1): 66. doi:  10.1016/j.nuclphysa.2010.07.002
    [6] KOHLEY Z, LUNDERBERG E, DEYOUNG P A, et al. Phys Rev C, 2013, 87: 011304. doi:  10.1103/PhysRevC.87.011304
    [7] SPYROU A, KOHLEY Z, BAUMANN T, et al. Phys Rev Lett, 2012, 108: 102501. doi:  10.1103/PhysRevLett.108.102501
    [8] KONDO Y, NAKAMURA T, TANAKA R, et al. Phys Rev Lett, 2016, 116: 102503. doi:  10.1103/PhysRevLett.116.102503
    [9] LUNDERBERG E, DEYOUNG P A, KOHLEY Z, et al. Phys Rev Lett, 2012, 108: 142503. doi:  10.1103/PhysRevLett.108.142503
    [10] CAESAR C, SIMONIS J, ADACHI T, et al. Phys Rev C, 2013, 88: 034313. doi:  10.1103/PhysRevC.88.034313
    [11] LAURENT B, MARQUÉS F M, ANGULO C, et al. Journal of Physics G: Nuclear and Particle Physics, 2019, 46(3): 03LT02. doi:  10.1088/1361-6471/ab02c3
    [12] KUBOTA Y, CORSI A, AUTHELET G, et al. Phys Rev Lett, 2020, 125: 252501. doi:  10.1103/PhysRevLett.125.252501
    [13] MARQUÉS F M, LABICHE M, ORR N A, et al. Phys Rev C, 2001, 64: 061301. doi:  10.1103/PhysRevC.64.061301
    [14] AKSYUTINA Y, AUMANN T, BORETZKY K, et al. Phys Rev Lett, 2013, 111: 242501. doi:  10.1103/PhysRevLett.111.242501
    [15] HOFFMAN C R, BAUMANN T, BROWN J, et al. Phys Rev C, 2011, 83: 031303. doi:  10.1103/PhysRevC.83.031303
    [16] JONES M D, FRANK N, BAUMANN T, et al. Phys Rev C, 2015, 92: 051306. doi:  10.1103/PhysRevC.92.051306
    [17] 黄思维. 多中子关联探测与轻丰中子核结构研究[D]. 北京: 北京大学, 2022.

    HUANG Siwei. Study on Multi-neutron Correlation Detection and Neutron-rich Light Nuclei Structure[D]. Beijing: Peking University, 2022. (in Chinese)
    [18] KONDO Y, ACHOURI N, FALOU H, et al. Nature, 2023, 623: E13 . doi:  10.1038/s41586-023-06815-w
    [19] DUER M, AUMANN T, GERNHÄUSER R, et al. Nature, 2022, 606(7915): 678. doi:  10.1038/s41586-022-04827-6
    [20] HUANG S, YANG Z, MARQUÉS F, et al. Few-Body Systems, 2021, 62(4): 102. doi:  10.1007/s00601-021-01691-4
    [21] BORETZKY K, GAŠPARIĆ I, HEIL M, et al. Nucl Instr and Meth A, 2021, 1014: 165701. doi:  10.1016/j.nima.2021.165701
    [22] NAKAMURA T, KONDO Y. Nucl Instr and Meth B, 2016, 376: 156. doi:  10.1016/j.nimb.2016.01.003
    [23] BAUMANN T, BOIKE J, BROWN J, et al. Nucl Instr and Meth A, 2005, 543: 517. doi:  10.1016/j.nima.2004.12.020
    [24] SHIM H, LEE J W, HONG B, et al. Nucl Instr and Meth A, 2019, 927: 280. doi:  10.1016/j.nima.2019.02.064
    [25] ALLISON J, AMAKO K, APOSTOLAKIS J, et al. Nucl Instr and Meth A, 2016, 835: 186. doi:  10.1016/j.nima.2016.06.125
    [26] ALLISON J, AMAKO K, APOSTOLAKIS J, et al. IEEE Transactions on Nuclear Science, 2006, 53(1): 270. doi:  10.1109/TNS.2006.869826
    [27] AGOSTINELLI S, ALLISON J, AMAKO K, et al. Nucl Instr and Meth A, 2003, 506(3): 250. doi:  10.1016/S0168-9002(03)01368-8
    [28] BRUN R, RADEMAKERS F. Nucl Instr and Meth A, 1997, 389(1): 81. doi:  10.1016/S0168-9002(97)00048-X
    [29] WANG Z A, PEI J, LIU Y, et al. Phys Rev Lett, 2019, 123: 122501. doi:  10.1103/PhysRevLett.123.122501
    [30] NIU Z M, LIANG H Z. Phys Rev C, 2022, 106: L021303. doi:  10.1103/PhysRevC.106.L021303
    [31] KNÖLL M, WOLFGRUBER T, AGEL M L, et al. Phys Lett B, 2023, 839: 137781. doi:  10.1016/j.physletb.2023.137781
    [32] DOUCET E, BROWN T, CHOWDHURY P, et al. Nucl Instr and Meth A, 2020, 954: 161201. doi:  10.1016/j.nima.2018.09.036
    [33] KUCHERA M, RAMANUJAN R, TAYLOR J, et al. Nucl Instr and Meth A, 2019, 940: 156. doi:  10.1016/j.nima.2019.05.097
    [34] HE W, LI Q, MA Y, et al. Science China Physics, Mechanics & Astronomy, 2023, 66: 282001. doi:  10.1007/s11433-023-2116-0
    [35] CHOLLET F. Keras, GitHub Repository[EB/OL].[2023-08-01].https://keras.io/.
    [36] ABADI M, AGARWAL A, BARHAM P, et al. arXiv: 1603.04467, 2016.
    [37] AKSYUTINA Y, JOHANSSON H, AUMANN T, et al. Phys Lett B, 2009, 679(3): 191. doi:  10.1016/j.physletb.2009.07.044
    [38] NAKAMURA T, SAKURAI H, WATANABE H. Progress in Particle and Nuclear Physics, 2017, 97: 53. doi:  10.1016/j.ppnp.2017.05.001
    [39] KISAMORI K, SHIMOURA S, MIYA H, et al. Phys Rev Lett, 2016, 116: 052501. doi:  10.1103/PhysRevLett.116.052501
    [40] LAZAUSKAS R, HIYAMA E, CARBONELL J. Phys Rev Lett, 2023, 130: 102501. doi:  10.1103/PhysRevLett.130.102501
  • 加载中
图(7) / 表 (2)
计量
  • 文章访问数:  31
  • HTML全文浏览量:  7
  • PDF下载量:  6
  • 被引次数: 0
出版历程
  • 收稿日期:  2023-08-31
  • 录用日期:  2024-02-26
  • 修回日期:  2024-02-23
  • 网络出版日期:  2024-03-15
  • 刊出日期:  2024-03-20

基于机器学习的多中子探测技术

doi: 10.11804/NuclPhysRev.41.2023CNPC64
    基金项目:  国家重点研发计划项目(2022YFA1605100, 2023YFE0101500);国家自然科学基金资助项目(12275006);北京大学核物理与核技术国家重点实验室自主科研课题资助项目(NPT2022ZZ02)和开放课题资助项目(NPT2020KFY06)
    作者简介:

    杜泽宇 (2001−),男,山东潍坊人,博士研究生,从事实验核物理研究;E-mail: duzeyu@pku.edu.cn

    通讯作者: 杨再宏,E-mail: zaihong.yang@pku.edu.cn
  • 中图分类号: O571.53

摘要: 中子滴线区的丰中子原子核结构是当前放射性核束物理研究的前沿热点之一。通过直接探测这些不稳定原子核衰变中发射的中子,不仅能提取核内部的多中子关联,也为丰中子核物质的性质研究提供重要的线索。为满足开展多中子探测实验的需求,本工作发展了基于机器学习的多中子识别算法,以大量的模拟数据作为训练样本,构建深度神经网络来逐事件判定反应的中子数,并进一步挑选出真实中子。本工作的结果表明,机器学习算法的四中子探测效率为~15%,传统算法为~1%,机器学习算法能将四中子探测效率显著提升10倍以上,有望应用到多中子探测实验中。

English Abstract

杜泽宇, 黄思维, 杨再宏, 李奇特, 边佳伟. 基于机器学习的多中子探测技术[J]. 原子核物理评论, 2024, 41(1): 402-408. doi: 10.11804/NuclPhysRev.41.2023CNPC64
引用本文: 杜泽宇, 黄思维, 杨再宏, 李奇特, 边佳伟. 基于机器学习的多中子探测技术[J]. 原子核物理评论, 2024, 41(1): 402-408. doi: 10.11804/NuclPhysRev.41.2023CNPC64
Zeyu DU, Siwei HUANG, Zaihong YANG, Qite LI, Jiawei BIAN. Multi-neutron Detection Based on Machine Learning[J]. Nuclear Physics Review, 2024, 41(1): 402-408. doi: 10.11804/NuclPhysRev.41.2023CNPC64
Citation: Zeyu DU, Siwei HUANG, Zaihong YANG, Qite LI, Jiawei BIAN. Multi-neutron Detection Based on Machine Learning[J]. Nuclear Physics Review, 2024, 41(1): 402-408. doi: 10.11804/NuclPhysRev.41.2023CNPC64
    • 随着放射性核束物理实验技术发展,核物理研究逐步从稳定线附近迈向更广阔的不稳定核区域,发现了许多奇特结构现象(比如晕、集团结构、传统幻数的消失和新幻数的出现等)[13]。这些不稳定原子核的结构信息为检验核子-核子相互作用、发展理论模型提供了重要依据。同时,位于中子滴线以外的丰中子核以发射单个甚至多个中子的形式进行衰变,通过对衰变中子的直接探测,能提取核内部的中子关联信息,这对深入理解不稳定原子核的奇特结构至关重要,这些原子核也是研究丰中子核物质(如中子星)的理想实验室[4]

      近些年来,双中子关联的研究已取得较大的进展(如$ ^{10}\rm He $[5]、$ ^{13}\rm Li $[56]、$ ^{16}\rm Be $[7]、$ ^{26}\rm O $[810]、$ ^8\rm He $[11]、$ ^{11}\rm Li $[12]、$ ^{14}\rm Be $[1314]、$ ^{24}\rm O $[1516])。但对滴线外更丰中子的体系(如四中子非束缚核$ ^{7}\rm H $[17]和$ ^{28}\rm O $[18]以及四中子态[19]等)的结构及其多中子关联的研究需要对衰变产生的多个中子直接探测,实验研究极其困难,目前已报道的四中子探测实验仅有$ ^{28}\rm O $[18]。多中子探测面临的挑战主要包括以下两个方面:首先,中子为电中性粒子,其很难与探测器灵敏材料发生反应,因此中子的探测效率通常比较低,而且探测效率随着中子数目的增加而迅速减小;此外,中子会在中子探测阵列中产生大量串扰信号(crosstalk),影响对真实中子信号的识别,需要发展专门的实验技术予以排除,但在串扰排除过程中真实的中子信号也将不可避免地被误排。国际上已实现的最高四中子探测效率约为0.6%[20],基本处于当前实验能力的极限。

      利用放射性核束装置开展丰中子不稳定核反应研究的典型实验布局如图1所示(以在日本理化学研究所的RIBF装置开展的四中子探测实验为例[20],使用了德国GSI的NeuLAND[21]和日本RIBF的NEBULA[22]探测中子)。中高能(~150 MeV/u及以上)的丰中子不稳定原子核在靶上发生碎裂、敲出等核反应,衰变产物中的带电粒子被磁谱仪偏转、探测,而速度与束流粒子接近的中子被位于前角度的大型中子探测器阵列接收。中子探测器阵列通常由若干根塑料闪烁体棒多层排布构成。

      图  1  丰中子核反应实验的典型实验布局

      国际上主要的放射性束装置都在建造或升级多中子探测设备,以提高多中子探测能力,基本都采用模块化设计、以塑料闪烁体作为基本探测单元,典型的中子探测设备有德国GSI的NeuLAND[21]、日本RIBF的NEBULA[22]、美国FRIB的MoNA[23]、韩国RAON的NDA[24]等。本工作基于德国的NeuLAND和日本的NEBULA组合而成的探测阵列进行模拟研究,该探测阵列被用于我们此前开展的7H的四中子探测实验中[17, 20]

      为了满足开展多中子探测实验的要求,一方面需要建设大型的高效率、高分辨的中子探测器阵列,另一方面也需要发展先进的多中子识别算法以在大量的信号中排除串扰信号、准确识别出真实中子信号,从而提高多中子探测效率和能量分辨。本工作基于GEANT4软件[2527]对中子在中子探测器阵列的响应进行蒙特卡洛模拟,并据此研究了多中子识别算法。首先对国际常用的基于信号时空关联特征的多中子识别算法(以下简称“传统串扰排除算法”)进行了研究,同时发展了基于机器学习的多中子识别算法,最后对比和评估两种算法在模拟数据上的测试结果,验证了机器学习的可靠性和优势,为后续进一步发展多中子识别算法奠定了重要基础。

    • 入射中子会在某根中子棒“打火”产生初始信号(即真实中子信号),伴随该“打火”的次级带电粒子及γ射线会进一步与其它中子棒发生反应产生串扰信号。中子棒的信号记录了打火点的时间和位置信息,因此正确识别出初始信号对确定入射中子数目和精确重建中子的动量至关重要。本工作采用GEANT4,一方面快速生成与实际探测器响应一致的模拟数据,另一方面模拟数据中记录了每个信号的来源,从而可以研究串扰的特征和评估串扰排除算法。本工作使用ROOT软件包[28]对模拟数据进行了分析。

      基于图1所示探测器系统,首先进行了单个中子入射的模拟研究,模拟得到的中子棒打火数分布如图2所示。由于模拟中只有一个入射中子,因此多根中子棒打火(打火数大于1)的事件必定包含串扰信号,可以看出单个中子也能造成大量串扰信号的产生。对单中子入射的情形,可以通过挑选时间最快的信号来识别真实中子信号,这也在模拟中得到了验证。但该策略对多中子入射的情形不适用,此时真实中子信号与串扰信号的时序非常复杂,因此必须在数据分析中尽可能排除掉这些串扰信号,才能挑选出真实中子信号。

      图  2  单中子反应道的中子棒打火数分布

      此前完成的多中子探测实验已经建立了“传统串扰排除算法”,下文予以简单介绍。

      串扰信号通常分为两类,第一类是由次级粒子在初始信号的近邻中子棒造成的串扰信号,据此可以把时间和空间距离都很近的两个信号划分到同一个团簇(cluster),每个团簇中时间最快的信号被当作真实信号保留下来,其余信号则被当作串扰信号予以排除,原理如图3(a)所示。常见的一种团簇定义是:

      图  3  (a) 第一类串扰信号的排除判据,(b) 单中子反应道中两个信号的时间差与位置分布(在线彩图)

      $$ \sqrt{\left(\frac{{\mathrm{d}}t-{\mathrm{d}}t_0}{T}\right)^2+\left(\frac{{\mathrm{d}}r-{\mathrm{d}}r_0}{R}\right)^2}<1 , $$ (1)

      其中:${\mathrm{d}}r,\; {\mathrm{d}}t$分别是两个打火点的空间距离和时间差;${\mathrm{d}}t_0, \; {\mathrm{d}}r_0, \; T, \; R$是描述团簇大小的参数,它们取决于中子棒的尺寸和分辨,需要根据具体的物理目标,结合模拟和实验数据进行优化。图3(b)为单中子反应道模拟得到的两个信号的时间差(dt)-空间距离(dr)二维关联,由于只有一个中子入射,图中均为串扰信号,若两个信号的时间差与空间距离落在红圈内,它们会被划分到同一个团簇。

      第二类串扰是由于中子被散射后与其他位置的中子棒发生第二次反应产生的串扰信号,如图4(a)所示。相比入射中子,散射中子的速度会降低,此时入射中子与散射中子的运动学关系满足:

      图  4  (a) 第二类串扰信号的排除判据,(b) 单中子反应道$ \beta_{01}/\beta_{12} $与$ Q_1 $分布(在线彩图)

      $$ |\beta_{01}/\beta_{12}|>1 , $$ (2)

      其中:$ \beta_{01} $是根据靶上反应点和第一个信号的位置和时间计算得到的速度;$ \beta_{12} $是根据两个信号的位置和时间计算得到的速度。单中子反应道中的$ \beta_{01}/\beta_{12} $与第一个信号的能量沉积$ Q_1 $的二维关联如图4(b),可以看出绝大部分串扰信号分布在红线($ |\beta_{01}/\beta_{12}|=1 $)以外,可以被上述运动学判据(2)筛除。在排除两类串扰信号后,最终剩余的信号被认为是来自反应靶的入射中子产生的真实信号。据此,可以确定入射中子数,重建出每个中子的动量用于能谱及关联分析等。

      总的来说,传统串扰排除算法的优势在于理解和使用相对简单,能实现接近99%的串扰排除率,但是这种严格的判据也会造成很多真实中子信号被误排,导致四中子探测效率非常低(<1%),尤其在阈值附近(相对能接近0)会迅速下降。因此,为实现四中子乃至更多中子的实验探测,更加高效、精准的多中子识别算法至关重要。机器学习作为一种分析大数据和挖掘其内部规律的算法,在处理多个中子与中子探测器阵列反应产生的复杂信号时,具有很大的优势和潜力。

    • 机器学习(machine learning)近些年来在计算机科学领域得到了广泛应用,同时也被运用到了数学、物理等自然学科的研究中。在核物理研究中,机器学习在预测裂变碎片产额分布[29]、预测原子核质量[30]、预测基态能量[31]、塑料闪烁体中的粒子鉴别[32]、AT-TPC 中径迹的粒子鉴别[33]等理论和实验方面都发挥了重要作用[34]

      机器学习的目的是寻找能很好描述样本特性的函数,即输入特征值和理论输出值的映射。本工作采用有监督的机器学习,其工作流程首先是对训练集(training set)的所有样本进行训练和学习,训练中由算法不断调整模型的参数使得模型预测值与理论输出值差异最小,每轮训练后将模型用于验证集(validation set)对其评估并进一步优化超参数(包括隐藏层数目、神经元数量、学习率等),最终训练好的模型用于测试集(test set)的预测。机器学习根据目标任务,发展出了对应的算法,例如常用于图像识别的卷积神经网络(Convolutional Neural Network, CNN)、常用于分类问题的深度神经网络(Deep Neural Network, DNN)等。

      考虑到多中子识别的本质是为了区分真实中子信号和串扰信号,本研究采用全连接深度神经网络,其结构如图5所示,分为输入层、多个隐藏层和输出层。中子棒提取的信息为位置、飞行时间和沉积能量(x, y, z, t, Q),作为输入层的输入特征。每一层神经网络由若干个神经元(圆圈所示)组成,相邻层神经元之间互相连接(实线所示),层内神经元互不连接,并且下一层神经元连接上一层所有神经元,即全连接网络。每根连接都会被赋予权重和偏置,输入值经过激活函数转换后的输出值会传递给下一层。此外,隐藏层的数量和每层的神经元数目分别代表了神经网络的深度和宽度,是构建神经网络框架最基本的超参,直接影响该神经网络在数据集上的表现。

      图  5  第一步深度神经网络工作原理

      本研究将多中子识别的任务分解为两步神经网络。第一步是确定与中子探测器反应的中子数,对入射中子数确定的反应道,可进一步将复杂的多分类问题简化为二分类问题:只需判定在中子探测阵列中产生响应的中子数是否等于入射中子数。以图5所示的四中子反应道为例,训练集的标签1和0分别对应该事件四中子全产生响应和未全产生响应的情形,而神经网络的输出值是介于0到1的浮点数,通过设定合适的阈值来判定“是”或“不是”四中子事件,本研究的阈值设定为0.5。

      第二步神经网络以第一步判定结果为基础,将数据集缩小到判定是四中子的事件,目标是从大量的打火信号中挑选出四个真实的中子信号。我们首先参考传统串扰排除算法中划分团簇的思想,并定义物理量R值对这些团簇做排序:

      $$ R=-\lg \frac{|\beta^{\rm cluster}-\beta^{\rm beam}|}{E^{\rm cluster}_{\rm dep}}, $$ (3)

      其中:$ \beta^{\rm cluster},\, \beta^{\rm beam} $分别代表这个团簇中时间最快信号和束流的$ \beta $值;$ E^{\rm cluster}_{\rm dep} $代表了这个团簇的总沉积能量。经模拟验证,团簇的R值越大,其包含真实中子的可能性越大,反之亦然。对四中子情形,按照R值从大到小选出前9个团簇输入到神经网络进行处理,这样可以大大减少需要处理的信号数。与第一步类似,从团簇提取出的位置、飞行时间和沉积能量等物理量用于输入,标签1和0代表该团簇是否包含真实中子信号。需要说明的是,每个团簇是相互独立地输入到同一个神经网络进行训练或预测,再根据输出值从大到小排序选出前四个团簇,作为最终的四中子信号。

      本工作对双中子反应道5H→3H+2n和四中子反应道7H→3H+4n分别进行了研究,束流能量为250 MeV/u。数据集均来自GEANT4模拟,总训练样本为106个事件,按 9:1划分为训练集和验证集。对用于训练第一步神经网络的样本做了事件筛选,保证“是”和“不是”四中子反应的事件的数量均衡分布,这是为了避免神经网络在训练中受到不均衡样本的干扰。考虑训练样本规模庞大,若训练完所有数据再更新神经网络的参数,模型迭代的时间会很长,所以通常的策略是将数据集划分为多个相同大小的子集(batch),模型针对每一个子集做一次迭代,遍历完所有子集叫做一个世代(epoch)。这样不仅调用更少的内存,并且能显著提升算法的运行效率。本工作中子集容量固定为1 000。

      本工作采用基于Keras 2.1.6[35]的谷歌开源框架TensorFlow 1.6[36]来进行神经网络的训练和测试,分析平台为Python 3.6.9和ROOT。两步神经网络使用的超参数如表1所列,主要依据模型在训练集和验证集的表现对其进行优化。

      表 1  神经网络采用的超参数

      超参数 第一步 第二步
      输入层特征数 2 086 14
      隐藏层数目 3 12
      隐藏层神经元数量 1 024, 256, 128 200
      隐藏层激活函数 relu relu
      输出层激活函数 sigmoid sigmoid
      优化算法 Adagrad Adagrad
      损失函数 交叉熵 交叉熵
      学习率 0.003 0.001
      epoch 2 5
      batch size 1 000 1 000
    • 我们对双中子和四中子反应道的模拟数据分别进行训练,再使用训练好的神经网络对测试集预测,进而挑选出真实中子信号。利用传统串扰排除算法和本工作发展的机器学习算法分析了模拟数据(体系相对能固定1 MeV),定义串扰排除率和多中子误判率以对比两种算法的效果:

      $$ 串扰排除率=\frac{排除的串扰事件数}{初始串扰事件数} , $$ (4)
      $$ 多中子误判率=\frac{误判为多中子事件的事件数}{选出的多中子事件总数} , $$ (5)

      结果如表2所列,传统算法的串扰排除率在98%以上,使用严格的串扰排除判据可以将大部分串扰信号排除,但同时也丢失了大量真实中子信号,导致最终的探测效率降低。而机器学习算法的串扰排除率在99%以上,略高于传统算法,同时也保留了更多的真实中子信号,从而具有更高的多中子探测效率。对于2n和4n反应道,机器学习算法的多中子误判率也显著低于传统算法。

      表 2  两种多中子识别算法的串扰排除率与多中子误判率

      传统算法 机器学习算法
      2n串扰排除率/% 98.43 99.40
      2n误判率/% 3.83 1.33
      4n串扰排除率/% 99.53 99.69
      4n误判率/% 18.34 13.75

      挑选出真实中子信号后,可以利用所有末态粒子的四动量重建相对能能谱,即不变质量方法。假设某个体系衰变成多个产物如带电粒子或中子,$ E_i $和$\boldsymbol{P}_i$分别表示任意一个产物在实验室系的能量和动量。该体系的不变质量(invariant mass)$ M^* $[37]定义为

      $$ M^* = \sqrt{\left(\sum_i E_i \right)^2 - \left(\sum_i {{\boldsymbol{P}}_i}\right)^2} 。 $$ (6)

      相对能$ E_{\rm rel} $(relative energy)定义为该体系不变质量与所有衰变产物静止质量和之差:

      $$ E_{\rm rel}=M^*-\sum_i m_i 。 $$ (7)

      图6(a)是重建出的双中子反应道的相对能谱,该模拟中输入的相对能固定为1 MeV。对双中子反应道(3H+2n),两种算法得到的能谱峰位一致,验证了机器学习模型的合理性。能谱的总计数反映了双中子探测效率,传统算法约为19%,机器学习则提升至33%。能谱的半高宽(Full Widh of Half Maximum, FWHM)反映多中子识别算法能实现的能量分辨,传统算法为50 keV,而机器学习算法为100 keV。

      图  6  (a)双中子反应道 (b)四中子反应道(对机器学习的统计做了1/10的调整)的重建能谱(在线彩图)

      对于四中子反应道(3H+4n),两种算法重建得到的能谱如图6(b)所示,其中,基于机器学习的能谱只显示了1/10的统计。从四中子探测效率曲线(图7)来看,机器学习算法相较传统算法能显著提高四中子探测效率,尤其是在阈值附近——在相对能为0.1 MeV时提升约19倍,相对能为0.5 MeV时提升约14倍,相对能为1 MeV时提升约13倍。这是因为传统算法的效率在相对能很小时会急剧下降,而机器学习算法在很大程度上避免了传统串扰排除算法对真实中子信号的误排。而从能量分辨的角度来看,机器学习算法在相对能小于1 MeV时与传统算法相当,随着相对能增加至3 MeV,机器学习的能量分辨会稍差于传统算法,这主要是由于机器学习第二步挑选出的四中子信号中有更高比例的串扰信号所导致。

      图  7  两种算法给出的四中子探测效率随相对能变化的曲线

      传统算法利用运动学判据排除第二类串扰时充分考虑了两个团簇之间的因果关联(散射过程的运动学关联),而目前的第二步神经网络是对每个团簇单独进行训练和测试,团簇间隐藏的关联无法被机器学习找到,从而造成挑选中子出现错误。为解决这个问题,我们将在未来的工作中尝试其他的神经网络算法,在已实现的高重建效率基础上进一步发展多中子识别算法。

    • 对丰中子原子核的研究在过去几十年取得了显著的进展[38],很多关键科学问题仍有待回答,尤其是目前尚无定论的四中子共振态[19, 3940],迫切需要开展四中子直接探测实验来澄清其存在与否,并同时研究其内在关联。受到束流、靶和中子探测器等实验手段的限制,多中子的符合探测极其困难,为尽可能排除串扰信号和保留真实中子信号,先进的多中子识别算法至关重要。

      本工作初步发展了基于神经网络的多中子识别算法,相较传统算法显著提升四中子效率(>10倍),这对于多中子实验探测具有重要的意义。本工作的机器学习算法仍有很大的提升空间,尤其是更精确地挑选出真实中子,实现优于传统算法的能量分辨。新一代放射性核束大科学装置如即将建成的HIAF,为开展不稳定原子核研究提供了前所未有的机遇。未来将针对正在建设的高效率、高分辨的多中子谱仪,不断探索和优化其配套的多中子识别算法,并应用到多中子探测实验中,研究远离滴线的极端丰中子体系的奇特结构和多中子关联。

参考文献 (40)

目录

    /

    返回文章
    返回