-
在实际的训练过程中,训练集的数据量相较测试集而言会比较多,因此通常会将训练集数据划分出一部分作为验证集。这样划分目的在于能够充分利用数据的同时,还可以通过训练集和验证集的交叉验证的方式获得稳定可靠的模型。再将训练获得的模型在测试集上进行测试,测试集的准确度作为评价模型的指标之一。为了更符合真实的数据集分布,我们对此次的数据集进行了如下处理:每种状态方程我们模拟了40万次的碰撞获得80万个单事件的质子分布数据。对于单事件数据集,我们从两种状态方程中各自随机抽取20万事件(共40万)组成训练集,在训练集中又随机抽取其中的20%组成验证集进行交叉验证,从剩下的40万事件中各自抽取10万个事件(共20万个事件)组成测试集。对于20个事件叠加后的样本数据集,经过叠加处理以后从80万个单事件样本中获得了4万个样本,因此划分3万个样本组成训练集,随机抽取其中20%组成验证集,剩下的1 万个样本组成测试集。划分好数据集之后,我们将对数据集进行训练。
首先,我们采用单事件结果作为数据集,对碰撞参数为0和5 fm两种情况分别进行训练(见图6)。从图中可以看出,因为交叉验证的存在,使得每一次的训练都会获得对应的训练集和验证集的准确度。训练一定次数以后,训练集上的准确度超过了验证集,这种过拟合现象的出现表明训练可以停止。最后将训练好的模型在测试集进行测试,记录其准确度作为评价模型指标之一(见表1)。与此同时,我们也采用了20个事件叠加得到的样本作为数据集进行了训练。同样也将训练好的模型在测试集上进行测试并且记录(见表1)。
类别 方法 $b=0$fm $b=5$fm 单事件 CNN $\approx80{\%}$ $\approx85{\%}$ LightGBM $\approx83{\%}$ $\approx85{\%}$ 20事件叠加 CNN $>96{\%}$ $>96{\%}$ LightGBM $>96{\%}$ $>96{\%}$ 在表1中,我们分别记录了CNN和LightGBM两种方法的测试结果。不难看出,不论是单事件还是叠加事件的结果,CNN与LightGBM两种方法所给出的测试结果类似。仅相对于碰撞参数为0 fm的测试结果,LightGBM方法有些许的提高。从表中我们还可以观察到碰撞参数为5 fm时,比0 fm有更高的准确度,表明在5 fm时,两种方法对于状态方程软硬的探测更加敏感一些。综上而言,对于本次的训练和测试,两种方法基本可以实现从末态质子分布来区分核物质状态方程的软硬。并且使用多事件叠加后的样本训练,可以得到更高的准确度,这是因为多事件叠加有助于减少涨落信号从而增强状态方程的影响。
此外,近些年,机器学习与深度学习模型的可解释性成为了研究的热点问题。对于可解释性的研究有助于我们更好的理解这些机器学习模型是如何从数据中提取有效的信息,做出决策的。其中深度学习中为了解决CNN可视化与可解释性问题,提出了一种预测差异分析(PDA,Prediction Different Analysis)方法[36]。PDA是通过对输入数据进行局部掩盖形成新的数据样本,用CNN训练保存下来的模型进行预测。根据预测结果的差异给出局部特征重要性,通过逐个替换就可以获得全局的重要特征图。而LightGBM中的重要特征筛选,通过对每一个特征值相关性的分析,对特征值的重要程度进行评估,也能够获得重要特征图。
图7和图8分别是我们利用这两种方法对碰撞参数
$ b = 5 $ fm时末态质子的$ y_{0} $ -$ p_{\rm t} $ 分布进行分析的结果。值得一提的是,PDA通过对不同状态方程的分析,能够给出不同状态方程各自所关注的重要特征区域。而通过LightGBM的重要特征筛选,能够给出不同状态方程共同关注的重要特征区域。从图7和图8中,我们可以看到PDA给出快度的绝对值在0.5到1、横动量在0.05到0.2 GeV/c的区域对区分状态方程最敏感。LightGBM的重要特征筛选给出的敏感区域在快度的绝对值在$ 1\pm0.5 $ 、横动量在0到0.2 GeV/c。我们发现这两者给出的重要特征区域基本一致,主要集中在弹靶快度及低横动量区域。这一点我们在图3和图4中也发现了,在该区域内,质子不仅分布较为集中而且产额也较大。这是由于在碰撞时,该区域内的质子受涨落影响较小,能够提供的初态粒子信息较为稳定。这些高敏感区域可以作为实验上重点关注的窗口,为开展相关更高要求精度的实验提供帮助。
Using Deep Learning to Study the Equation of State of Nuclear Matter
doi: 10.11804/NuclPhysRev.37.2020017
- Received Date: 2020-03-11
- Rev Recd Date: 2020-03-27
- Available Online: 2021-11-22
- Publish Date: 2020-12-20
-
Key words:
- equation of state of nuclear matter /
- heavy ion collisions /
- deep learning /
- convolutional neural network
Abstract: The equation of state (EOS) of nuclear matter is essential for studying the properties of nuclei and the evolution of universe and astro-objects. Heavy-ion collisions at intermediate energies permit creating nuclear matter with high density and temperature, by comparing transport model simulations with the corresponding experimental data offers one of the most important way to study the nuclear EOS. Unfortunately, different models do not always give the same results. In this work, a deep convolutional neural network (CNN) is used to identify the nuclear EOS from the spectra in transverse momentum and rapidity of protons. It is found that the network can be taken as a useful decoder to extract the nuclear EOS from the transverse momentum and rapidity distribution of protons. By using the Prediction Difference Analysis method, the most sensitive region of the transverse momentum and rapidity distribution to the nuclear EOS can be found out, which may offer an alternative strategy for experimental and theoretical studies of heavy-ion collisions. In addition, a gradient boosting framework (LightGBM) that uses tree based learning algorithms is also applied, and it is found that the accuracy obtained with the LightGBM is similar to that with CNN.
Citation: | Fupeng LI, Yongjia WANG, Qingfeng LI. Using Deep Learning to Study the Equation of State of Nuclear Matter[J]. Nuclear Physics Review, 2020, 37(4): 825-832. doi: 10.11804/NuclPhysRev.37.2020017 |