基于KNN的多元地球化学异常识别集成模型研究摘要
矿产资源作为国家战略资源与工业基石,对国防安全、能源转型及高新技术产业发展等方面具有不可替代的重要作用。当前矿产勘查方向向深部、隐伏、复杂矿床转变,而传统找矿技术效率低下,亟需高效新颖的理论、方法和技术支撑进一步找矿工作。机器学习技术可以高效、准确地处理大规模、多元的地球化学数据,在众多地质分支领域中的应用越来越广泛,同时也面临着众多挑战,例如,基于大量已知矿点信息训练的监督学习方法受地化数据不均匀性影响较大,无监督学习方法易受背景噪声干扰,结果可解释性和鲁棒性较低。因此如何提高机器学习异常检测模型的适用性和稳定性,是多元地球化学异常识别中需要妥善解决的关键科学问题之一。 本文以甘肃寨上-马坞整装勘查区为研究区,以1:5万水系沉积物地球化学数据为研究对象,开展基于KNN的集成学习算法多元地球化学异常识别研究。在K-最近邻算法(K-Nearest Neighbor,KNN)建立的一系列无监督KNN异常检测模型基础上,应用四种组合算法(平均值法、最大值法、最大平均值法、平均最大值法)构建基于KNN的异常检测集成模型。论文对比分析了单个异常检测模型和四个集成模型的多元地球化学异常识别效果,论文取得了如下研究成果: (1)为消除原始化探数据的定和效应,对Au、Hg、Ag等10种主要成矿元素进行等距对数比变换(ILR)和标准正交基变换、归一化和网格化处理。综合接收者操作特征曲线(ROC)、曲线下面积(AUC)和传统统计分析结果选取Au、Ag、As为区域化探指示元素。 (2)据ROC曲线和AUC值确定模型最优K值,建立无监督KNN异常检测模型。以20个不同K值对应的KNN模型作为基学习器,通过四种组合算法构建集成异常检测模型。研究区异常识别结果表明,单个KNN模型(AUC值为0.90983)与集成模型(AUC值为0.90368~0.90514)均具有较高的地化异常识别性能。通过多次运行评价其鲁棒性,集成模型(MAE、RMSE值分别不超过0.0001和0.00012)多次运行结果较单个KNN模型(MAE、RMSE值分别为0.00063和0.00076)更加稳定,在保证预测性能的前提下显著提高了鲁棒性。 (3)根据约登指数确定圈定地球化学异常的最佳阈值,圈定地球化学最佳异常区域,集成模型圈定的化探异常区占研究区面积比(20.3%~23.5%)高于单个KNN模型(19.9%),全部已知金矿(化)点均分布于异常区内,显示出显著的空间关联性。 (4)化探异常区与印支期-早燕山期酸性火山岩及深大断裂区域高度吻合,侵入岩体(中川岩体群)及伴生构造(漳县-武山I断裂及次生断裂)是区内金矿的主要成矿控制因素,深大断裂为成矿物质运移和深部花岗质岩浆活动提供了通道。因此,根据异常检测模型圈定的尚未发现金矿床或矿化的异常区为进一步找矿工作部署的金矿床成矿远景区,对区域矿产勘查具有指导意义。
|
@ 2023 版权所有 中国地质图书馆 (中国地质调查局地学文献中心)
京ICP备 05064591号 京公网安备11010802017129号
建议浏览器: 火狐、谷歌、微软 Edge、不支持 IE