利用机器学习分类含缺陷的单壁碳纳米管轴向应变
Classifying the Axial Strain of Single-Walled Carbon Nanotubes Containing Defects Using Machine Learning
DOI: 10.12677/AAM.2022.1112920, PDF, HTML, XML, 下载: 237  浏览: 1,912 
作者: 曾 澳:绍兴文理学院数理信息学院,浙江 绍兴
关键词: 单壁碳纳米管类别特征机器学习模型Single-Walled Carbon Nanotubes Categories Features Machine Learning Models
摘要: 单壁碳纳米管具有规律、简单、均匀的结构,而且还具有极好的稳定性。因此单壁碳纳米管在多个领域具有潜在应用。在现实生产和制作过程当中,可能不会完美地制备出单壁碳纳米管,发现管壁中存在一些缺陷是不可避免的现象。这些缺陷对单壁碳纳米管的应变造成一定的影响。利用大规模原子分子并行模拟器可以计算含缺陷的单壁碳纳米管的应变值。但是大规模计算时间、资源等成本很高。本文是选取一个较好的特征作为机器学习的输入,然后利用机器学习训练数据并得到学习好的模型,用学习好的模型去分类新的缺陷原子位置不同的单壁碳纳米管的应变类别。结果表明,首先,一个较好的特征作为机器学习的输入至关重要。其次,利用机器学习训练好的模型去预测的方式,对含缺陷的单壁碳纳米管的计算时间、资源等成本极大降低。
Abstract: Single-walled carbon nanotubes have a regular, simple, and homogeneous structure, and they also have excellent stability. Therefore, single-walled carbon nanotubes have potential applications in several fields. In the reality of production and fabrication, single-walled carbon nanotubes may not be perfectly prepared, and it is inevitable that some defects are found in the walls of the tubes. These defects have an impact on the strain of single-walled carbon nanotubes. The strain values of single-walled carbon nanotubes with defects can be calculated using a large-scale atomic-molecular parallel simulator. However, the cost of large-scale computation time and resources is high. In this paper, a better feature is selected as an input for machine learning, and then the machine learning is used to train the data and obtain a learned model, which is used to classify the strain classes of new single-walled carbon nanotubes with different defective atomic positions. The results show that, firstly, a better feature as an input to machine learning is crucial. Second, the cost in terms of computational time and resources for single-walled carbon nanotubes containing defects is greatly reduced by using the machine learning trained model to predict.
文章引用:曾澳. 利用机器学习分类含缺陷的单壁碳纳米管轴向应变[J]. 应用数学进展, 2022, 11(12): 8734-8739. https://doi.org/10.12677/AAM.2022.1112920

1. 引言

单壁碳纳米管(SWCNT或SWNT),是全部由碳原子组成。几何结构可以看作是由单层石墨烯卷曲形成,性质可以是由结构决定,所以单壁碳纳米管具备机械、电子、力学等其它性能。但是在现实生产和制作过程当中,可能不会完美地制备出单壁碳纳米管,发现管壁中存在一些缺陷是不可避免的现象。管壁中的这些缺陷会对单壁碳纳米管的物理特性(应变、应力、稳定性、力学性质等)和化学性质在一定程度上造成影响。本文主要研究了机器学习的输入特征的选取。使这些特征如何很好地去描述随着缺陷原子位置不同的含缺陷的单壁碳纳米管,然后将这些特征作为机器学习的输入,通过学习好的模型分类含缺陷的碳纳米管的应变类别。

2. 训练和测试数据选取

利用大规模原子分子并行模拟器(LAMMPS)进行计算 [1] [2]。首先,一个样本是利用Python软件在2到800这800个数中随机取2个互不相同的数,生成2万5千多个样本且样本不重复。使800个原子在1位置固定缺陷,其它2个缺陷位置就是随机取的2个互不相同的数。计算出含缺陷的单壁碳纳米管原子坐标,可以利用VESTA软件画出含缺陷的单壁碳纳米管结构。具体结构如图1所示。

其次,使用大规模原子分子并行模拟器计算出这些结构的应变值大小。具体做法是将含缺陷的单壁碳纳米管没有缺陷原子位置的坐标带入到Linux系统安装好的LAMMPS软件中进行计算。每个含缺陷的单壁碳纳米管会输出应变值和应力值。具体应变应力关系如图2所示。

最后将每个含缺陷的单壁碳纳米管在应力最大时的应变值作为这个碳管的应变值。再将2万5千多个样本数据按照训练集和测试集为8:2的比例分配。

Figure 1. Defect-bearing carbon nanotube structures

图1. 含缺陷的碳纳米管结构

Figure 2. Strain-stress relationship

图2. 应变应力关系

3. 数据的预处理

3.1. 网络输入特征处理

每一个含缺陷的碳纳米管结构,可以用笛卡尔坐标表示原子的位置。我们认为对一个原子有影响的其它原子,只是这个原子周围附近的少数原子。通过特定的截断函数来描述这种影响关系。具体截断函数 [3] [4] 形式如下:

f c ( R i j ) = { 0.5 [ cos ( π R i j R c ) ] R i j R c 0 R i j > R c (1)

其中 R i j 是原子i跟原子j之间的距离, R c 是原子截断半径。选取合适的截断半径至关重要,它是否能很好的描述原子周围的特征。

提出了一个适合于描述原子i径向环境的径向对称函数。每个对称函数乘以一个或多个截断函数,以确保对称函数在截断半径处的值和斜率衰减为零。具体对称函数 [5] [6] 如下:

G i = j e η ( R i j R s ) f c ( R i j ) (2)

其中 η R s 为参数。通过在距离中心原子的不同距离上的选择合适的参数值,便于控制径向部分。

每个原子都跟它在截断半径内的原子有关系,求出每个原子的对称函数值。

因为考虑碳纳米管的周期性变化,使得每个原子的对称函数值相同。这样作为机器学习的特征输入没有区别,为了更好的描述结构的特征。我们定义了两个数值因子 Q 1 Q 2 ,这两个因子分别表示原子位置缺陷或不缺陷时所对应的具体数值。例如,现假设有i位置原子缺陷,j位置原子不缺陷。将这两个因子作为对称函数的乘积系数。可以计算出i位置原子缺陷的对称函数值,具体方式如下:

G i = Q 1 Q 2 j e η ( R i j R s ) f c ( R i j ) (3)

其中 η R s 为参数。通过在距离中心原子的不同距离上的选择合适的参数值,便于控制径向部分。

使用数值因子后,整个结构缺陷位置原子和其它原子的特征很明显的表现出来。合适的数值因子 Q 1 Q 2 也是作为一个至关重要的输入特征。我们可以通过调整数值因子 Q 1 Q 2 的值来判断输入特征的好坏。

3.2. 应变值分类处理

通过大规模原子分子并行模拟器计算出的含缺陷的单壁碳纳米管的应变值在区间[0.080, 0.164)内。将含缺陷的单壁碳纳米管的应变大小按区间给它划分类别 [7]。如果应变值的大小值属于区间[0.080, 0.085),将应变值的大小标记为0类。如果应变值的大小值属于区间[0.085, 0.095),将应变值的大小标记为1类。如果应变值的大小值属于区间[0.095, 0.104),将应变值的大小标记为2类。如果应变值的大小值属于区间[0.105, 0.114),将应变值的大小标记为3类。如果应变值的大小值属于区间[0.115, 0.124),将应变值的大小标记为4类。如果应变值的大小值属于区间[0.125, 0.134),将应变值的大小标记为5类。如果应变值的大小值属于区间[0.135, 0.144),将应变值的大小标记为6类。如果应变值的大小值属于区间[0.145, 0.154),将应变值的大小标记为7类。如果应变值的大小值属于区间[0.155, 0.164),将应变值的大小标记为8类,具体如表1所示。

Table 1. Strain value intervals correspond to categories

表1. 应变值区间对应类别

这样,每一个碳纳米管结构就一一对应一个类别。每个含缺陷的单壁碳纳米管就有对应的类别,也就是相当于有一个标签 [8]。这里的机器学习就是学习含缺陷的单壁碳纳米管的特征,从而得到与之对应的标签。换言之,就是一个含缺陷的单壁碳纳米管对应一个标签。

4. 训练结果

经过将2万5千多个数据的样本进行预处理后,作为机器学习的输入。数据通过迭代训练200次后,画出训练数据和测试数据的损失值和精度曲线。图3表示了迭代200次训练和测试损失值的变化。

Figure 3. Change in loss value

图3. 损失值变化

图3可知,随着迭代次数的增加,损失值迭代到200步的时候,训练的损失值为0.0992,测试的损失值为0.2294。

图4表示了迭代200次训练和测试精度的变化。

Figure 4. Accuracy variation

图4. 精度变化

根据图2可知,随着迭代步数的增加,精度不断的上升,直到迭代到某个次数后,精度不再变化。迭代到200次的时候。训练精度是96%,测试精度是93%。

通过测试集的精度为93%,可以认为通过机器学习学到的预测模型具有较好的准确性和可靠性。

5. 总结

机器学习的输入特征至关重要。首先,关于截断函数的截断半径选取,并不是选取的截断半径越大越好,也不是选取的截断半径越小越好。根据原子的特性,对原子的影响可能只跟它周围的一些原子有关系,所以选取合适的截断半径很重要。其次,在已有的对称函数的基础上,巧妙地使用缺陷和不缺陷的两个数值因子,更加有效地描述了含缺陷的单壁碳纳米管的结构特征。这样就会有较好的特征作为机器学习的输入。

2万多个含缺陷的单壁碳纳米管的应变值运用大规模原子分子并行模拟器计算大概需要几天时间。但是通过机器学习,学到一个较好的预测类模型,用这个模型去预测新的2万多个含缺陷的单壁碳纳米管的类别,可能就是十几分钟就能算出类别。含缺陷的单壁碳纳米管的应变值可以利用大规模原子分子并行模拟器进行计算得到具体值,再通过分类得到它的一个类别。但是这种大规模计算时间很长,使得消耗资源比较大。如果通过机器学习学到一个很好的预测类模型,可以直接将原子的特征函数值作为预测类模型的输入,很快地就能预测出含缺陷的单壁碳纳米管的类别,这种方式可以将时间、资源等成本降低。

参考文献

[1] 陶永兰, 赵冬, 刘广武, 郑楷. 基于LAMMPS系统的集群运算系统架构[J]. 吉林大学学报, 2010(4): 414-418.
[2] 辜萍, 王宇, 李广海. 碳纳米管的力学性能及碳纳米管复合材料研究[J]. 力学进展, 2002, 32(4): 563-578.
[3] Behler, J. (2014) Representing Potential Energy Surfaces by High-Dimensional Neural Network Poten-tials. Journal of Physics: Condensed Matter, 26, Article ID: 183001.
https://doi.org/10.1088/0953-8984/26/18/183001
[4] Li, J., Jiang, B. and Guo, H. (2013) Permutation Invariant Polynomial Neural Network Approach to Fitting Potential Energy Surfaces. II. Four-Atom Systems. The Journal of Chemical Physics, 139, Article ID: 204103.
https://doi.org/10.1063/1.4832697
[5] Behler, J. (2016) Perspective: Machine Learning Potentials for Atomistic Simulations. The Journal of Chemical Physics, 145, Article ID: 170901.
https://doi.org/10.1063/1.4966192
[6] Behler, J. (2011) Atom-Centered Symmetry Functions for Constructing High-Dimensional Neural Network Potentials. The Journal of Chemical Physics, 134, Article ID: 074106.
https://doi.org/10.1063/1.3553717
[7] 周杰, 林琛, 李弼程. 基于机器学习的网络新闻评论情感分类研究[J]. 计算机应用, 2010, 30(4): 1011-1014.
[8] 王涛, 余顺争. 基于机器学习的网络流量分类研究进展[J]. 小型微型计算机系统, 2012, 33(5): 1034-1040.