基于机器学习算法对稀土元素数据集的铀矿床分类研究摘要
铀是核电站和核武器的重要原材料,不仅是实现“碳达峰,碳中和”的重要能源支撑,也对国家安全,全球战略力量平衡具有重大影响,是世界各国非常重视的战略性矿产资源。不同类型铀矿床的中晶质铀矿/沥青铀矿具有不同的稀土元素特征,是识别不同铀矿床类型的有效手段之一,不仅对铀矿床理论研究工作部署具有重要意义,也是国际核材料管制、监管的重要技术手段。传统上,常用稀土元素图解法进行铀矿床分类,本文采用机器学习的方法,实现利用稀土元素数据对铀矿床进行智能分类。以全球收集到的8种不同类型的216组铀矿床晶质铀矿/沥青铀矿稀土元素含量样本为训练集,通过对原始数据的预处理、重要特征对数据升维降维处理、特征重要性判断,混淆矩阵和交叉验证来构建最优训练模型,采用决策树、随机森林、Ada Boosting、支持向量机、朴素贝叶斯与K均值算法对山西中条山胡家峪铜矿伴生铀矿的24组同变质型晶质铀矿进行分类研究,探索适合于稀土元素铀矿床类型智能识别的最优机器学习算法。研究结果表明,对比6种机器学习算法的总体分类准确率,决策树算法的准确率高达87.5%,Ada Boosting与朴素贝叶斯多项式算法的准确率也达到83.33%。其次为随机森林算法(79.17%)与支持向量机算法(75%),以上几种算法均达到了较优的分类效果。研究中采用的稀土总量、稀土轻重比、铕异常等特征对数据进行处理后,随机森林算法分类准确率较之前提升了12.5%。对树结构算法进行特征重要性分析处理后,决策树算法分类准确率提升了8.33%,随机森林、Ada Boosting算法准确率也分别提升了12.5%与4.16%,训练模型拟合较好,泛化能力都有所增强,而通过传统的稀土元素配分曲线与稀土总量-标准化轻重稀土比图解无法有效地判断出胡家峪铜矿伴生晶质铀矿的类型。通过以上分类研究表明,对数据进行特征处理后,决策树、随机森林、Ada Boosting与朴素贝叶斯多项式算法模型的泛化能力与分类准确率均有提高。综合分类的结果与算法效率等因素,6种机器学习算法呈现出决策>Ada Boosting>朴素贝叶斯多项式模型>随机森林>支持向量机>K均值>朴素贝叶斯高斯模型的趋势,并且整体分类效果明显比传统的稀土元素配分曲线与稀土总量-标准化轻重稀土比图解更具优势。
|
@ 2023 版权所有 中国地质图书馆 (中国地质调查局地学文献中心)
京ICP备 05064591号 京公网安备11010802017129号
建议浏览器: 火狐、谷歌、微软 Edge、不支持 IE