应用随机森林模型识别南宁地铁线路地层结构特征
Research on Recognition of Stratum Structure Using Random Forest Model
DOI: 10.12677/AG.2020.1012125, PDF,    国家科技经费支持
作者: 李浩楠, 周念清*:同济大学,土木工程学院,上海;郑茂辉:同济大学,上海防灾救灾研究所,上海;李晓峰:南宁轨道交通集团有限责任公司,广西 南宁
关键词: 随机森林地层识别支持向量机三维建模超参稳定性Random Forest Lithology Identification Support Vector Machine 3D Geological Modeling Hyperparameter Stability
摘要: 利用传统空间插值方法对钻孔数据进行三维地层建模易受主观因素的影响,为了克服地层建模过程中产生的误差,本文基于随机森林模型提出了一种新型的地层识别方法。选取南宁地铁1号线部分工程勘察资料进行研究,利用网格搜索确定模型参数后,构建随机森林模型,并与支持向量机进行对比分析。通过研究表明,随机森林模型的预测精度达到81.7%,其超参稳定性明显高于支持向量机,且预测精度受其主要参数(树的数量和最小叶子节点数)变化的影响较小;交叉验证评估结果也证实了随机森林的泛化性能更好。当样本数量较少时,随机森林模型不论是在分类精度还是稳定性方面均较好。该方法在三维地质建模中具有良好的应用价值。
Abstract: Using traditional spatial interpolation method based on borehole data for 3D stratum modeling is easily affected by subjective factors. In order to overcome the errors in the stratum modeling process, this paper proposes a new stratum recognition method based on the Random Forest model. Part of the engineering investigation data of Nanning Metro Line 1 is selected to carry out the research. After the classifier parameters are determined by the grid parameter search, the Random Forest model is constructed and compared with the Support Vector Machine. Research shows that the prediction accuracy of the random forest model reaches 81.7%, and its hyperpa-rameter stability is significantly higher than that of the support vector machine, and the predic-tion accuracy is less affected by changes in its main parameters (the number of trees and the minimum number of leaf nodes). The cross-validation results also confirm that the generalization performance of random forest is better. When the number of samples is small, the random forest classifier still has a good performance in terms of classification accuracy and stability. This method has a good application prospect in 3D geological modeling.
文章引用:李浩楠, 周念清, 郑茂辉, 李晓峰. 应用随机森林模型识别南宁地铁线路地层结构特征[J]. 地球科学前沿, 2020, 10(12): 1285-1294. https://doi.org/10.12677/AG.2020.1012125

参考文献

[1] 周翠英, 张国豪, 杜子纯, 等. 基于机器学习的地层序列模拟[J]. 工程地质学报, 2019, 27(4): 873-879.
[2] 贺怀建, 白世伟, 赵新华, 等. 三维地层模型中地层划分的探讨[J]. 岩土力学, 2002, 23(5): 637-639.
[3] 刘晓明, 罗周全, 杨彪, 等. 复杂矿区三维地质可视化及数值模型构建[J]. 岩土力学, 2010, 31(12): 4006-4010+4015.
[4] 刘智勇. 曲面插值算法在三维地质建模中的研究[D]: [硕士学位论文]. 成都: 成都理工大学, 2016.
[5] 陈爱侠, 关卫省, 陈宽民. 轨道交通建设对城市生态环境影响分析——以西安市城市轨道交通2号线为例[J]. 安全与环境学报, 2007(3): 70-73.
[6] 周念清, 邹朴, 黄钟晖, 等. 多物性参数耦合建模探测地铁站岩溶空间概率分布及风险[J]. 地球科学前沿, 2019, 9(10): 13.
[7] Breiman, L. (2001) Random Forests. Machine Learning, 45, 5-32. [Google Scholar] [CrossRef
[8] 陈玉林, 李戈理, 杨智新, 等. 基于KNN算法识别合水地区长7储层岩性岩相[J]. 测井技术, 2020, 44(2): 182-185.
[9] 郭甲腾, 刘寅贺, 韩英夫, 等. 基于机器学习的钻孔数据隐式三维地质建模方法[J]. 东北大学学报(自然科学版), 2019, 40(9): 1337-1342.
[10] Cracknell, M.J. and Reading, A.M. (2014) Geological Mapping Using Remote Sensing Data: A Comparison of Five Machine Learning Algorithms, Their Response to Variations in the Spatial Distribution of Training Data and the Use of Explicit Spatial Information. Computers and Geos-ciences, 63, 22-33. [Google Scholar] [CrossRef
[11] 马梓程, 帅爽, 安志宏, 等. 基于RF模型的火成岩提取与分类研究——以吉布提阿里萨比耶地区为例[M]//国家安全地球物理丛书(十五)——丝路环境与地球物理. 西安: 西安地图出版社, 2019: 94-103.
[12] 徐剑波, 陈军林. 利用区域化探数据推断地质体空间分布[J]. 地质与勘探, 2019(5): 1214-1222.
[13] Breiman, L. (2001) Statistical Modeling: The Two Cultures (with Comments and a Rejoinder by the Author). Statistical Science, 16, 199-215. [Google Scholar] [CrossRef
[14] Breiman, L., Friedman, J.H., Olshen, R.A., et al. (1984) Classification and Regression Trees (CART). Biometrics, 40, 358. [Google Scholar] [CrossRef
[15] 冯少荣. 决策树算法的研究与改进[J]. 厦门大学学报(自然科学版), 2007, 46(4): 496-500.
[16] 曹正凤. 随机森林算法优化研究[D]: [硕士学位论文]. 北京: 首都经济贸易大学, 2014.
[17] 马骊. 随机森林算法的优化改进研究[D]: [硕士学位论文]. 广州: 暨南大学, 2016.
[18] 姚登举, 杨静, 詹晓娟. 基于随机森林的特征选择算法[J]. 吉林大学学报(工学版), 2014(1): 142-146.
[19] Sun, A. and Lim, E.P. (2001) Hierarchial Text Classification and Evaluation. IEEE International Conference on Data Mining, San Jose, 29 November-2 December 2001, 521-528.
[20] 杨根云, 周伟, 方教勇. 基于信息量模型和数据标准化的滑坡易发性评价[J]. 地球信息科学学报, 2018, 20(5): 674-683.
[21] 范昕炜. 支持向量机算法的研究及其应用[D]: [博士学位论文]. 杭州: 浙江大学, 2003.
[22] 郑茂辉, 刘少非, 柳娅楠, 等. 基于粒子群优化极限学习机的排水管结构状况评价[J]. 同济大学学报(自然科学版), 2020, 48(4): 513-516, 551.
[23] Pedregosa, F., Varoquaux, G., Gramfort, A., et al. (2011) Scikit-Iearn: Machine Learning in Python. Journal of Machine Learning Research, 12, 2825-2830.
[24] 张雪蕾, 汪明, 曹寅雪, 等. 3种典型机器学习方法在灾害敏感性评估中的对比[J]. 中国安全生产科学技术, 2018, 14(7): 80-85.