高级检索

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

中子诱发裂变反应截面的贝叶斯神经网络预测模型

黄美容 黄永顺 王德鑫 张苏雅拉吐

黄美容, 黄永顺, 王德鑫, 张苏雅拉吐. 中子诱发裂变反应截面的贝叶斯神经网络预测模型[J]. 原子核物理评论, 2024, 41(1): 396-401. doi: 10.11804/NuclPhysRev.41.2023CNPC85
引用本文: 黄美容, 黄永顺, 王德鑫, 张苏雅拉吐. 中子诱发裂变反应截面的贝叶斯神经网络预测模型[J]. 原子核物理评论, 2024, 41(1): 396-401. doi: 10.11804/NuclPhysRev.41.2023CNPC85
Meirong HUANG, Yongshun HUANG, Dexin WANG, Suyalatu ZHANG. Bayesian Neural Network Prediction Models for Neutron-induced Fission Reaction Cross Sections[J]. Nuclear Physics Review, 2024, 41(1): 396-401. doi: 10.11804/NuclPhysRev.41.2023CNPC85
Citation: Meirong HUANG, Yongshun HUANG, Dexin WANG, Suyalatu ZHANG. Bayesian Neural Network Prediction Models for Neutron-induced Fission Reaction Cross Sections[J]. Nuclear Physics Review, 2024, 41(1): 396-401. doi: 10.11804/NuclPhysRev.41.2023CNPC85

中子诱发裂变反应截面的贝叶斯神经网络预测模型

doi: 10.11804/NuclPhysRev.41.2023CNPC85
基金项目: 国家自然科学基金项目(12365018, U2032146);内蒙古自然科学基金项目(2023MS01005);内蒙古自治区高等学校创新团队发展支持计划项目(NMGIRT2217); 内蒙古自治区高等学校青年科技英才支持计划项目(NJYT-18-B21);内蒙古自治区高校科研业务费(GXKY22061)
详细信息
    作者简介:

    黄美容(1981−),女,广西贵港人,副教授,博士,从事原子核物理研究;E-mail: huangmeirong05@163.com

    通讯作者: 黄永顺,E-mail: HuangYs402@163.com
  • 中图分类号: O571.432

Bayesian Neural Network Prediction Models for Neutron-induced Fission Reaction Cross Sections

Funds: National Natural Science Foundation of China (12365018, U2032146); Inner Mongolia National Science Foundation (2023MS01005); Program for Innovative Research Team in Universities of Inner Monglia Autonomous Region (NMGIRT2217); Program for Young Talents of Science and Technology in Universities of Inner Mongolia Autonomous Region ((NJYT-18-B21); Scientific Research Fund for Universities in Inner Mongolia Autonomous Region (GXKY22061).
More Information
  • 摘要: 核数据是核物理基础研究与核工程及核技术应用的基础数据。中子诱发核裂变反应截面是核数据的主要组成部分,在先进核能系统研发及核天体物理研究中具有重要应用。本工作基于贝叶斯理论,采用4层隐藏层每层200个神经元的前馈神经网络,利用马尔科夫链蒙特卡罗法(Markov Chain Monte Carlo simulation method, MCMC)和KL散度(Kullback–Leibler divergence, KL),针对238U、232Th和239Pu中子诱发裂变核反应截面数据,建立了以入射能量和裂变截面作为输入参数和输出参数的贝叶斯神经网络计算模型。选取中子能区为1~200 MeV的238U、232Th和1~100 MeV的239Pu裂变截面实验数据和评价数据进行模型训练,利用MCMC方法构建马尔科夫链来近似目标分布,结合KL散度约束方法对损失函数进行优化。研究结果表明,贝叶斯神经网络预测模型能够很好地再现1~200 MeV的238U、232Th和1~100 MeV的239Pu裂变截面数据,并对更高能量区间进行合理预测,为解决目前入射中子能量大于200 MeV的 238U、232Th和大于100 MeV的239Pu实验数据存在严重分歧问题及核数据评价提供重要参考。
  • 图  1  238U、232Th和239Pu的裂变截面数据对比(在线彩图)

    (a)~(c)依次表示为238U、232Th和239Pu的裂变截面数据(实验数据取自EXFOR数据库)。

    图  2  贝叶斯神经网络结构示意图(在线彩图)

    图  3  贝叶斯神经网络预测238U的裂变截面与实验和评价库对比(在线彩图)

    图  4  贝叶斯神经网络预测232Th的裂变截面与实验和评价库对比(在线彩图)

    图  5  贝叶斯神经网络预测239Pu裂变截面与实验和评价库对比(在线彩图)

    表  1  238U、232Th和239Pu裂变截面实验数据

    裂变核1 MeV以上实验测量数据
    实验家数实验点数
    238U162 000
    232Th142 200
    239Pu141 550
    下载: 导出CSV
  • [1] 葛智刚, 陈永静. 科学通报, 2015, (32): 12. doi:  10.1360/n972015-00694

    GE Zhigang, CHEN Yongjing. Chinese Science Bulletin, 2015, (32): 12. (in Chinese) doi:  10.1360/n972015-00694
    [2] 阮锡超. 中国科学: 物理学、力学、天文学, 2020, 50(5): 13. doi:  10.1360/SSPMA-2019-0231

    RUAN Xichao. SCIENTIA SINICA Physica, Mechanica & Astronomica, 2020, 50(5): 13. (in Chinese) doi:  10.1360/SSPMA-2019-0231
    [3] BODANSKY D. Nuclear Energy: Principles, Practices, and Prospects[M]. New York: Springer-Verlag, 2007: 25.
    [4] 刘双童. 14MeV能区中子诱发232Th裂变碎片截面测量[D]. 兰州: 兰州大学, 2016.

    LIU Shuangtong. Measurement of Fission Cross Sections for 232Th(n, f)X Reaction Induced by Neutrons Around 14 MeV[D]. Lanzhou: Lanzhou University, 2016. (in Chinese)
    [5] 张苏雅拉吐, 罗飞, 陈志强. 原子核物理评论, 2016, 33(3): 370. doi:  10.11804/NuclPhysRev.33.03.370

    ZHANG Suyalatu, LUO Fei, CHEN Zhiqiang. Nuclear Physics Review, 2016, 33(3): 370. (in Chinese) doi:  10.11804/NuclPhysRev.33.03.370
    [6] WANG Q, HAN Y, YANG L, et al. Nucl Instr and Meth B, 2020, 469: 28. doi:  10.1016/j.nimb.2020.02.023
    [7] 赵秋娟, 吴海成, 吴小飞, 等. 原子核物理评论, 2017, 34(3): 682. doi:  10.11804/NuclPhysRev.34.03.682

    ZHAO Qiujuan, WU Haicheng, WU Xiaofei, et al. Nuclear Physics Review, 2017, 34(3): 682. (in Chinese) doi:  10.11804/NuclPhysRev.34.03.682
    [8] 陈鹏, 周波, 严睿, 等. 核技术, 2020, 43(10): 68. doi:  10.11889/j.0253-3219.2020.hjs.43.00602

    CHEN Peng, ZHOU Bo, YAN Rui, et al. Nuclear Techniques, 2020, 43(10): 68. (in Chinese) doi:  10.11889/j.0253-3219.2020.hjs.43.00602
    [9] BROWN D A, CHADWICK M B, CAPOTE R, et al. Nuclear Data Sheets, 2018, 148: 1. doi:  10.1016/j.nds.2018.02.001
    [10] PLOMPENPL A J M, CABELLOS O, DE SAINT JEAN C, et al. Eur Phys J A, 2020, 56(7): 1. doi:  10.1140/epja/s10050-020-00141-9
    [11] IWAMOTO O, IWAMOTO N, KUNIEDA S, et al. J Nucl Sci Technol, 2023, 60(1): 1. doi:  10.1080/00223131.2022.2141903
    [12] BLOKHINBL A I, GAI E V, IGNATYUK A V, et al. Yad Reak Konst, 2016, 2(2): 62.
    [13] GE Z, XU R, WU H, et al. EPJ Web of Conferences. EDP Sciences, 2020, 239: 09001.
    [14] ZHOU Z H. Machine Learning[M]. Beijing: Tsinghua University Press, 2021: 10.
    [15] WANG Z A, PEI J, LIU Y, et al. Phys Rev Let, 2019, 123(12): 122501. doi:  10.1103/PhysRevLett.123.122501
    [16] UTAMA R, PIEKAREWICZ J, PROSPER H B. Phys Rev C, 2016, 93(1): 014311. doi:  10.1103/PhysRevC.93.014311
    [17] UTAMA R, CHEN W C, PIEKAREWICZ J. J Phys G: Nucl Part Phys, 2016, 43(11): 114002. doi:  10.1088/0954-3899/43/11/114002
    [18] NIU Z M, LIANG H Z, SUN B H, et al. Phys Rev C, 2019, 99(6): 064307. doi:  10.1103/PhysRevC.99.064307
    [19] SHI M, FANG J Y, NIU Z M. Chin Phys C, 2021, 45(4): 044103. doi:  10.1088/1674-1137/abdf42
    [20] 邹方磊. 中子诱发235U(239Pu)裂变反应和质子引发6Li反应相关物理量研究[D]. 桂林: 广西师范大学, 2023.

    ZOU Fanglei. Studies of the Observables for Neutron-induced 235U(239Pu) Fission Reaction and Proton-induced 6Li Reaction[D]. Guilin: Guangxi Normal University, 2023. (in Chinese)
    [21] 邢康. 平行相移深度神经网络模型及算法研究[D]. 桂林: 广西师范大学, 2023.

    XING Kang. Research on Parallel Phase Shift Deep Neural Network Model and Algorithm[D]. Guilin: Guangxi Normal University, 2023. (in Chinese)
    [22] 田源, 续瑞瑞, 陶曦. 原子能科学技术, 2023, 57(04): 805. doi:  10.7538/yzk.2023.youxian.0048

    TIAN Yuan, XU Ruirui, TAO Xi, et al. Atomic Energy Science and Techology, 2023, 57(04): 805. (in Chinese) doi:  10.7538/yzk.2023.youxian.0048
    [23] 王子澳, 强雨, 裴俊琛. 原子核物理评论, 2020, 37(4): 918. doi:  10.11804/NuclPhysRev.37.2020027

    WANG Ziao, QIANG Yu, PEI Junchen. Nuclear Physics Review, 2020, 37(4): 918. (in Chinese) doi:  10.11804/NuclPhysRev.37.2020027
    [24] ZERKIN V V, PRITYCHENKO B. Nucl Instr and Meth A, 2018, 888: 31. doi:  10.1016/j.nima.2018.01.045
    [25] NOLTE R, ALLIE M S, BROOKS F D, et al. Nucl Sci Eng, 2007, 156(2): 197. doi:  10.13182/NSE06-14
    [26] SHCHERBAKOV O, DONETS A, EVDOKIMOV A, et al. J Nucl Sci Technol, 2002, 39(sup2): 230. doi:  10.1080/00223131.2002.10875081
    [27] MILLER Z W. A Measurement of the Prompt Fission Neutron Energy Spectrum for 235U(n, f) and the Neutron-induced FIssion Cross Section for 238U(n, f)[M]. Lexington: University of Kentucky ProQuest Dissertations Publishing, 2015: 132.
    [28] VOROBYEV A S, GAGARSKI A M, SHCHERBAKOV O A, et al. Jept Lett, 2023, 117(8): 557. doi:  10.1134/S0021364023600787
    [29] TARRIO D, TASSAN-GOT L, DURAN I, et al. Phys Rev C, 2023, 107(4): 044616. doi:  10.1103/PhysRevC.107.044616
    [30] QIU Y, LAN C, CHEN Y, et al. Phys Rev C, 2023, 107(2): 024606. doi:  10.1103/PhysRevC.107.024606
    [31] TOVESSON F, HILL T S. Nucl Sci Eng, 2010, 165(2): 224. doi:  10.13182/NSE09-41
    [32] NEAL R M. Bayesian Learning for Neural Networks[M]. New York: Springer Science & Business Media, 2012: 3.
    [33] NIU Z M, LIANG H Z. Phys Lett B, 2018, 778: 48. doi:  10.1016/j.physletb.2018.01.002
    [34] ECKLE K, SCHMIDT-HIEBER J. Neural Networks, 2019, 110: 232. doi:  10.1016/j.neunet.2018.11.005
    [35] 杨鑫, 袁晓彤. 计算机应用与软件, 2021, 38(11): 300. doi:  10.3969/j.issn.1000-386x.2021.11.048

    YANG Xin, YUAN Xiaotong. Computer Applications and Software, 2021, 38(11): 300. (in Chinese) doi:  10.3969/j.issn.1000-386x.2021.11.048
    [36] KIM T, OH J, KIM N Y, et al. Proceedings of the Thirtieth International Joint Conference on Artificial Intelligence (IJCAI-21), 2021: 2628. doi:  10.24963/ijcai.2021/362
    [37] PASZKE A, GROSS S, MASSA F, et al. Advances in Neural Information Processing Systems, 2019: 32. doi:  10.48550/arXiv.1912.01703
    [38] NEAL R M. Technical Report: CRG-TR-93-1, 1993: 47. doi:  10.1007/0-387-22764-4_11
  • 加载中
图(5) / 表 (1)
计量
  • 文章访问数:  60
  • HTML全文浏览量:  8
  • PDF下载量:  8
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-01-12
  • 修回日期:  2024-02-20
  • 网络出版日期:  2024-03-15
  • 刊出日期:  2024-03-20

中子诱发裂变反应截面的贝叶斯神经网络预测模型

doi: 10.11804/NuclPhysRev.41.2023CNPC85
    基金项目:  国家自然科学基金项目(12365018, U2032146);内蒙古自然科学基金项目(2023MS01005);内蒙古自治区高等学校创新团队发展支持计划项目(NMGIRT2217); 内蒙古自治区高等学校青年科技英才支持计划项目(NJYT-18-B21);内蒙古自治区高校科研业务费(GXKY22061)
    作者简介:

    黄美容(1981−),女,广西贵港人,副教授,博士,从事原子核物理研究;E-mail: huangmeirong05@163.com

    通讯作者: 黄永顺,E-mail: HuangYs402@163.com
  • 中图分类号: O571.432

摘要: 核数据是核物理基础研究与核工程及核技术应用的基础数据。中子诱发核裂变反应截面是核数据的主要组成部分,在先进核能系统研发及核天体物理研究中具有重要应用。本工作基于贝叶斯理论,采用4层隐藏层每层200个神经元的前馈神经网络,利用马尔科夫链蒙特卡罗法(Markov Chain Monte Carlo simulation method, MCMC)和KL散度(Kullback–Leibler divergence, KL),针对238U、232Th和239Pu中子诱发裂变核反应截面数据,建立了以入射能量和裂变截面作为输入参数和输出参数的贝叶斯神经网络计算模型。选取中子能区为1~200 MeV的238U、232Th和1~100 MeV的239Pu裂变截面实验数据和评价数据进行模型训练,利用MCMC方法构建马尔科夫链来近似目标分布,结合KL散度约束方法对损失函数进行优化。研究结果表明,贝叶斯神经网络预测模型能够很好地再现1~200 MeV的238U、232Th和1~100 MeV的239Pu裂变截面数据,并对更高能量区间进行合理预测,为解决目前入射中子能量大于200 MeV的 238U、232Th和大于100 MeV的239Pu实验数据存在严重分歧问题及核数据评价提供重要参考。

English Abstract

黄美容, 黄永顺, 王德鑫, 张苏雅拉吐. 中子诱发裂变反应截面的贝叶斯神经网络预测模型[J]. 原子核物理评论, 2024, 41(1): 396-401. doi: 10.11804/NuclPhysRev.41.2023CNPC85
引用本文: 黄美容, 黄永顺, 王德鑫, 张苏雅拉吐. 中子诱发裂变反应截面的贝叶斯神经网络预测模型[J]. 原子核物理评论, 2024, 41(1): 396-401. doi: 10.11804/NuclPhysRev.41.2023CNPC85
Meirong HUANG, Yongshun HUANG, Dexin WANG, Suyalatu ZHANG. Bayesian Neural Network Prediction Models for Neutron-induced Fission Reaction Cross Sections[J]. Nuclear Physics Review, 2024, 41(1): 396-401. doi: 10.11804/NuclPhysRev.41.2023CNPC85
Citation: Meirong HUANG, Yongshun HUANG, Dexin WANG, Suyalatu ZHANG. Bayesian Neural Network Prediction Models for Neutron-induced Fission Reaction Cross Sections[J]. Nuclear Physics Review, 2024, 41(1): 396-401. doi: 10.11804/NuclPhysRev.41.2023CNPC85
    • 核数据是核物理基础研究与核工程及核技术应用的基础数据[1]。中子诱发核裂变反应截面是核数据的主要组成部分,在先进核能系统研发和核天体物理研究中具有重要应用[2]。人类开发和利用核能已有相当长的历史。作为一种安全、高效的清洁能源,核能在过去几十年中对满足人类的电力需求和减缓温室效应发挥了重大作用[3]。目前,核能发电主要采用的是重核裂变技术。传统的裂变反应堆采用铀基核材料,这种原材料在自然界中的储量有限,其转换效率低,而且产生的具有长寿命半衰期的放射性核素对环境造成极大损害[4]。对传统核反应堆优化体现在以下两方面:1) 优化铀基反应堆:利用反应堆产生的239Pu作为堆芯材料产生快中子[5],这些快中子与堆芯外围的再生区238U发生中子俘获反应生成239U,239U核素经过β衰变转变成239Pu,实现239Pu的增殖,从而提高了铀-钚(U-Pu)循环中铀的利用率[6];2) 开发新型反应堆:如使用钍基熔盐堆[7]代替传统铀基反应堆,即用钍替代铀作为原材料,利用中子与232Th发生核反应,通过一系列增殖反应将 232Th转化为可直接作为核燃料的233U[8]。在上述两类反应堆设计与运行过程中,238U、232Th和239Pu核素中子诱发裂变反应截面核数据至关重要。然而,当前美国ENDF/B-Ⅷ.0[9]、欧洲JEEF-3.3[10]、日本JENDL-5[11]、俄罗斯BROND-3.1[12]以及中国CENDL-3.2[13]核数据评价库的推荐值与实验数据存在较大分歧,这些差异导致这些数据仍不能满足高精度应用的需求。

      随着硬件性能的飞速提升、存储成本的降低以及云计算技术的兴起,当前正处于新一轮人工智能的热潮之中。机器学习(Machine Learning, ML)已经渗透到生活的各个领域,如图像识别、股票分析和医疗诊断等[14]。这类算法无需对数据分布做明确的假设,通过自动调整链接权重,能够学习到输入与输出之间复杂的映射关系。因此,它非常适用于处理多维度、多参数、多特征的数据。目前神经网络方法在核科学与核技术应用领域研究中取得了很大的成功,例如核数据评价[15]、原子核质量修正[16]、原子核电荷半径计算[17]、β半衰期预测[1819]等。最近,关于中子诱发锕系核素裂变截面核数据评价的研究方面,Zou等[20]通过理论模型对239Pu和铀链同位素进行多项式拟合,Xing等[21]采用深度神经网络DNN算法对共振区裂变截面进行深入研究,而Tian等[22]采用神经网络方法对U同位素链在2~20 MeV能量范围内的裂变截面数据进行分析,均取得了显著的效果。本文基于贝叶斯神经网络(Bayesian Neural Networks, BNN)[23],对反应堆关键核素238U、232Th和239Pu裂变核反应截面进行系统分析,在第一节中给出现有裂变截面实验数据,第2节对BNN模型进行描述,最后比较研究了BNN模型预测结果和现有数据。

    • 本研究首先从核反应实验数据库EXFOR[24]中系统地收集了1 MeV以上的238U、232Th和239Pu中子裂变截面测量数据,并对这些数据进行了物理特性的深入分析。表1图1中详细给出了中子诱发238U、232Th和239Pu裂变截面的实验数据,共涵盖45个实验测量机构,总计超过5 800个实验数据点。此外,图1中还给出了美国ENDF/B-Ⅷ.0[9]、欧洲JEEF-3.3[10]、日本JENDL-5[11]、俄罗斯BROND-3.1[12]以及中国CENDL-3.2[13]数据评价库推荐数据,以便与实验数据进行比较。

      表 1  238U、232Th和239Pu裂变截面实验数据

      裂变核1 MeV以上实验测量数据
      实验家数实验点数
      238U162 000
      232Th142 200
      239Pu141 550

      图  1  238U、232Th和239Pu的裂变截面数据对比(在线彩图)

      图1(a)可知,238U的裂变截面多家实验数据都给出入射中子最高能量到200 MeV,其中Nolte等[25]所测的实验数据在30~60 MeV范围内明显高于其他实验数据,而Shcherbakov等[26]的实验数据在中子能量大于20 MeV区间低于其他实验数据。然而,238U裂变截面中子能量大于200 MeV的实验数据仅有Miller等[27]和Vorobyev等[28]的两组实验数据,其中Miller等[27]所测的实数据具有上升的趋势,存在明显的分歧。图1(b)中的232Th裂变截面数据显示,不同机构测量的实验数据符合较好,呈现显著的集中趋势,仅有少量数据较为离散。在中子能量大于300 MeV的能区,只有Tarrio等[29]给出了高达1 GeV范围内的裂变截面测量结果。如图1(c),239Pu的裂变截面数据大多集中在100 MeV以下的低能区,并显示出较大的分歧。2023年最新实验数据显示,Qiu等[30]的结果明显高于其他文献数据。在100~200 MeV的能量范围内,仅有Tovesson等[31]和Shcherbakov等[26]的实验数据可供参考,然而这两组数据存在较大差异,突显了该能量范围内数据的高度不确定性。

    • BNN方法是通过引入贝叶斯理论,并将统计推断与神经网络结合起来的一种方法。在构建神经网络模型时,也采用马尔科夫链蒙特卡罗方法(Markov Chain Monte Carlo, MCMC)和KL散度(Kullback–Leibler divergence, KL,亦称相对熵)作为优化策略来改进损失函数的性能。MCMC通过构建马尔科夫链近似目标分布,进行随机抽样,而KL散度则衡量两个概率分布之间的差异,作为正则项约束损失函数,促使模型保持特定分布特性。最终建立了以入射中子能量作为输入量,裂变截面作为输出量,包含4层隐藏层,每隐藏层200个神经元的前馈神经网络模型。

      基于贝叶斯理论,BNN将先验分布设定为P(w)。如果给定的初始值D(xu, yv),其中yv表示输入数据xu的输出,则根据贝叶斯理论由先验分布获取到对应后验分布为

      $$ P\left(w|D\right)=\frac{P\left(D|w\right)P\left(w\right)}{P\left(D\right)}\text{,} $$ (1)

      其中先验分布P(w)表示基于已有“知识”对参数的概率分布所做的主观猜测[32]P(D|w)是似然函数,表示在给定参数w的情况下观测到数据发生的概率。P(D)为归一化常量,如式(2)所示,它确保后验分布是有效概率密度,并积分为1:

      $$ P\left(D\right)={\displaystyle\int }_{\theta }^{}P\left(D|w\right)P\left(w\right){\mathrm{d}}w。 $$ (2)

      BNN使用高斯分布作为参数的先验分布,将其均值设为0,以确保描述参数分布时无偏见且灵活平滑。逆γ分布则用作高斯分布精度的先验分布,以描述方差或精度的不确定性,并与γ分布相结合于高斯分布中,更准确地描绘参数的真实分布,从而提高模型的预测性能和鲁棒性。这是贝叶斯神经网络中常见的建模选择。在这个过程中似然函数p(D|w)用高斯分布exp(−χ2/2)表示,其中超参数χ2如下:

      $$ {\chi }^{2}=\sum _{n=1}^{N}{\left[\frac{{f}_{u}^{n}-{y}_{v}^{n}}{{\sigma }_{n}}\right]}^{2}\text{,} $$ (3)

      式中:σn是对应的噪声误差[33],BNN比传统确定性神经网络更适合处理数据不足或噪声多的情况。$ {y}_{v}^{n} $是第n层中第v个观测值。其中,多层感知机(MLP)包括输入层、隐藏层和输出层。在贝叶斯神经网络中,权重被视为随机变量,并且使用贝叶斯推断进行建模。在贝叶斯神经网络中,激活函数发挥着重要作用,能够处理非线性问题。变分推断被用于处理具有非线性激活函数的神经网络,引入误差项并将其与激活函数结合形成可微分的目标函数,近似后验分布以逼近真实的后验分布。在本文中,ReLU[34]被用作激活函数,具体表达式如下:

      $$ {f}_{u}^{n}=\mathrm{max}\left(0,\,{{\textit{z}}}_{v}^{n}\right)\text{,} $$ (4)

      其中$ {{\textit{z}}}_{v}^{n} $是输入到神经元的加权和偏置的结果,可以表示为

      $$ {{\textit{z}}}_{v}^{n}=\sum _{u=1}^{{H}^{n-1}}{w}_{uv}^{n}{a}_{u}^{n-1}+{b}_{v}^{n}\text{,} $$ (5)

      其中:Hn−1是第$ \left(n-1\right) $层的神经元数量;$ {w}_{uv}^{n} $是连接第$ \left(n-1\right) $层的第u个神经元到第n层的第v个神经元的权重;$ {a}_{u}^{n-1} $是第$ \left(n-1\right) $层的第u个神经元的输出;$ {b}_{v}^{n} $是第n层的第v个神经元的偏置。这样整个神经网络的数学表达式可以通过递归地应用这些表达式来构建,隐藏层中每一层的输出成为下一层的输入,一直传递到输出层得到最后的输出值,如图2所示。根据测试集后验分布,预测出的输出数据${\left\langle{y}\right\rangle} $:

      图  2  贝叶斯神经网络结构示意图(在线彩图)

      $$ \begin{array}{c}\left\langle{y}\right\rangle=\int f\left(x;\theta \right)P\left(w|D\right)\mathrm{d}w\text{,}\end{array} $$ (6)

      其中xy分布表示测试集的输入和输出,f(x;θ)是由神经网络参数化的预测函数,θ表示模型参数。

      在贝叶斯理论中,面临着估计真实分布P(x)的挑战,为了简化计算,选择引入近似分布 Q(x)。为了衡量这两个分布之间的差异性相似性,可使用KL散度进行优化。KL散度被定义为从分布P(x)到分布Q(x)的期望信息增益[35],其数学表达式为

      $$ \begin{split} & {D}_{KL}\left(P\left|\right|Q\right)=H\left(P,Q\right)-H\left(P\right) =\sum _{i}P\left({x}_{i}\right)\mathrm{log}\frac{1}{Q\left({x}_{i}\right)}-\\ &\qquad \sum _{i}P\left({x}_{i}\right)\mathrm{log}\frac{1}{P\left({x}_{i}\right)} =\sum _{i}P\left({x}_{i}\right)\mathrm{log}\frac{P\left({x}_{i}\right)}{Q\left({x}_{i}\right)}。 \end{split} $$ (7)

      式(7)揭示了使用Q(x)逼近真实分布P(x)时的信息损失。通过最小化KL散度,可以使模型分布Q(x)更接近于真实分布P(x),从而实现更准确的概率分布特征捕获,并提高模型在不同数据分布下的鲁棒性和泛化性。均方差和KL散度是两种不同的函数,用于衡量预测值和实际值、以及概率分布之间的差异。均方差帮助优化预测模型,而KL散度有助于理解预测分布和权重分布之间的关系,特别适用于贝叶斯推断。将它们结合成损失函数,可以实现贝叶斯神经网络的多重优化目标[36]。这种方法的主要目标是在保持预测精度的同时,尽可能减小后验分布与先验分布之间的差异,以提高模型的泛化性和鲁棒性。然而,如果KL散度的权重过高,可能会损失预测的精度,而设置过低则可能导致网络难以解决权重不确定性的问题。因此,确定最佳权衡需要进行调参。优化过程中,首先对先验P(w)和后验P(w|D)进行归一化处理,随后利用Torch库[37]计算KL散度。由于数据量较小,对KL散度的权重取固定值0.001,并将其与均方误差相加形成总损失函数。最终通过反向传播迭代更新模型参数,以达到减小误差、提高性能和泛化能力的目的。

      贝叶斯分析所得的结果是根据数据更新参数的后验分布。为了有效地近似研究函数的期望值,由Neal首次引用MCMC进行后验模拟[38]。该方法通过模型参数进行采样,以样本均值作为目标参数或变量期望值的近似,以寻找最优解。经过MCMC算法重采样后,式(6)的积分近似为

      $$ y=\frac{1}{K}\sum _{k=1}^{K}f\left({x}_{u},\,{w}_{k}\right), $$ (8)

      其中K是迭代次数。由于模型参数使用概率分布来描述,因此理论预言${\left\langle{y}\right\rangle} $的不确定度估计可表示为

      $$ \begin{array}{c}\Delta y=\sqrt{\left\langle{{y}^{2}}\right\rangle-{\left\langle{y}\right\rangle}^{2}}。 \end{array} $$ (9)
    • 本文采用表1中各核素实验数据的80%数据进行BNN模型训练,而保留剩余的20%用于BNN模型测试。对于238U和232Th核素,选取1~200 MeV范围内的裂变截面数据作为训练集,以预测200~1 000 MeV范围的数据。对于239Pu核素,选取1~100 MeV能区的裂变截面数据作为训练集,并预测100~200 MeV范围内的数据。

      图3中显示了BNN对238U裂变截面的预测值(用橙色的实线表示)及其置信区间(用浅蓝色阴影表示),并与实验数据和不同评价数据库进行对比。整体上,238U裂变截面,贝叶斯神经网络的预测值及其置信区间与实验数据相符,与Nolte等人[25]的实验数据相比略低。在高能区方面,200 MeV之后的预测值呈现上升趋势,与Vorobyev等人[28]的最新实验数据相一致,而与Miller等人[27]的实验数据相反。

      图  3  贝叶斯神经网络预测238U的裂变截面与实验和评价库对比(在线彩图)

      图1(b)可知,232Th的实验数据较为集中,本文的研究主要集中于能量高于200 MeV范围的数据分布情况。为了使BNN模型能够很好地再现232Th裂变截面实验数据和评价数据,并取得较好的结果,我们将200 MeV以下的所有实验数据作为训练集,对更高能量进行预测。根据图4的结果显示,BNN对入射中子能量大于200 MeV的预测值与Tarrio等[29]的最新实验数据吻合得非常好。因此,BNN成功地预测了更高能量范围的裂变截面。

      图  4  贝叶斯神经网络预测232Th的裂变截面与实验和评价库对比(在线彩图)

      图5中可知,入射中子能量小于100 MeV时,BNN模型对239Pu裂变截面数据的预测方面表现出色,并与Tovesson等[31]的实验数据和JENDL-5评价库数据进行了有效的验证,展现出良好的一致性。入射能量在大于100 MeV时,BNN模型很好的再现了Shcherbakov等[26]的实验数据,而高于JENDL-5评价数据和Tovesson等[31]的实验数据。尽管Qiu等[30]的实验数据落在BNN模型置信范围,但明显高于BNN模型的预测值,及JENDL-5、Tovesson[31]和Shcherbakov等[26]实验数据。

      图  5  贝叶斯神经网络预测239Pu裂变截面与实验和评价库对比(在线彩图)

      综上,本文所建立的BNN模型在预测238U、232Th和239Pu的裂变截面方面表现非常出色。通过模型自身的预测能力,BNN展示了在更高能量下裂变截面数据可能的分布情况。这证明了BNN 模型在核数据评价研究中的潜力,提供了一种可靠的预测方法,为核数据评价提供参考。

    • 本研究采用BNN方法结合MCMC模拟和KL散度方法建立了一种机器学习预测模型,并对核反应堆关键核素裂变反应截面数据进行了细致的分析。该模型以238U、232Th和239Pu等核素的入射能量和裂变截面作为输入和输出参数,利用1~200 MeV范围内的238U和232Th以及1~100 MeV范围内的239Pu数据进行模型训练。研究结果表明,该模型能有效地复现38U、232Th和239Pu等核素的实验数据,并展现出强大的预测能力。这为解决核数据评价实际工作中遇到的不同数据之间存在的分歧问题提供了重要参考。未来的研究着重于向贝叶斯神经网络模型添加更具有物理意义的参数,以使其更贴近实际物理情境,进一步拓展该模型的应用范围,并在不同核素和能量范围下进行更多实验验证,以进一步完善和优化该模型的性能,提供更可靠、更准确的数据评价,为核物理、核能与核技术应用提供有力支持。

参考文献 (38)

目录

    /

    返回文章
    返回