基于深度学习的通用矿产资源预测方法研究

矿产资源作为国家战略资源,对我国经济和社会发展起着举足轻重的作用。目前,矿产勘查工作不断向深部隐伏矿和复杂矿体进行转变,使得勘查的挑战性日益增大,地质学者急需新的理论、方法和技术。近年来,深度学习技术的兴起为矿产勘查提供了强有力的支持。该技术能够高效处理大规模、多样化的地质数据,擅长深度分析和挖掘成矿异常信息,为智能矿产资源预测和评价提供技术支持。深度学习在矿产勘查中的应用不仅能够提高找矿的效率和准确性,还将推动矿业领域的可持续发展,助力国家在矿产资源管理和经济建设方面进一步提升。自21世纪以来,基于人工智能的矿产预测模型层出不穷,但大多数模型仅针对特定区域的矿产类型,主要依赖局部数据训练形成,难以适应多样的地质条件和数据环境。目前缺乏一种具有广泛适用性的智能矿产预测模型。对此,本文提出了通用矿产预测模型(GMPM)的概念,并以东昆仑-西秦岭成矿带为研究区域,进行初步的探索与研究,旨在突破现有研究的局限,探索以成矿带为尺度的通用矿产预测模型及方法,为未来构建矿产资源预测大模型提供有效的基础方法和路径。本次研究主要取得以下成果和认识: (1)提出了通用矿产预测模型的概念,建立了通用矿产预测方法体系通用矿产预测模型通过预训练学习大量地质、地球物理、地球化学、矿床等数据及地质专业知识,使模型参数不断优化,从而构建一种能够适用于多种矿产类型及不同成矿条件的智能矿产预测模型。该模型可以用本地数据(预测区域或预测研究区)进行微调,提高模型在新地区的预测精度。为实现通用矿产预测,本文建立了一套通用智能矿产预测方法体系。该体系涵盖了模型构建、模型应用、模型维护与升级三个部分,可以通过不断引入和更新数据集以及改进算法、模型架构等,提高通用矿产预测模型的预测性能及适用性,实现更大范围的矿产预测。 (2)实现了对多源、异构、海量地学数据的标准化表示本文提出了一种针对多区域的地学数据标准化处理方法。该方法能够将各个研究区的地质、地球物理和地球化学数据进行清洗与标准化处理,使不同地区的数据值大小在地质意义上是一致的,即让它们可以在统一的数据量级上进行比较。对于地质数据,本文提出基于大语言模型的地质图信息语义表示方法。在大语言模型基础上,用收集的大量地质文本数据对大语言模型进行微调,生成地质领域的专有大语言模型。通过专有大语言模型对地质图中所包含的复杂地质信息进行嵌入向量,将地质图信息转变为计算机可以识别的多维空间数据,这里的每一维数据代表了研究区地质图信息的不同方面(包含位置、时代、岩性等)。最终实现了地质数据在语义层面上的统一表示。这种统一表示不仅是在形式上得到统一,还是在语义上具有了可比性和可处理性。对于地球化学数据,通过分幅标准化法,将不同地区、不同图幅的地球化学数据转换到相同的量级上,让数值没有量纲,实现地球化学数据的一致化、标准化表示,使不同背景的地球化学数据具有可比性。对于磁测数据,本文选用磁测△T数据,其在消除了不同背景值影响的同时也保留了磁异常的细节,使不同地区的磁测数据之间具有一致的地质意义。再对磁测数据进行标准化处理,消除由于环境造成的数据误差,进一步提高数据之间的可比性。通过将上述一致化、标准化表示后的多源地学数据有效地整合在一起,为实现大范围通用矿产预测奠定了数据基础。 (3)提出了基于空间聚类的成矿地质分析方法在进行成矿地质分析时,往往需要考虑地质要素相对空间位置、距离等因素。对此,本文提出了一种基于相对属性的地质图信息网格化方法。该方法通过计算每个要素相对于每一个网格单元的空间位置信息,将地质图内所包含的地质信息转换成数值,实现对地质图网格化、向量化表示。并在此基础上,融合地球物理、地球化学网格化数据,通过高斯混合模型(GMM)进行空间聚类,实现将具有相同地质条件的地区表示为同一类别区。最后,基于“地质空间特征类型相似找矿原理”,结合已知矿床(点)的分布情况,分析具有成矿潜力的类别区。本文对东昆仑-西秦岭成矿带内沟里、五龙沟、寨上-马坞、崖湾-大桥四个典型区分别进行空间聚类成矿地质分析,有效识别了东昆仑-西秦岭成矿带四个典型研究区的成矿区域。研究发现,融合多源地学数据的空间特征分类结果中具有成矿潜力的类别区的地质条件与该区成矿要素具有良好的一致性,并且这些成矿区域与已知金矿床(点)及通用矿产预测结果具有很好的对应性关系,表明空间聚类成矿地质分析方法可以揭示成矿规律,能够为靶区的圈定提供指导意义。 (4)提出了基于Transformer的有监督通用矿产资源预测模型和方法本文为实现通用矿产预测模型进行了初步的探索研究,最终构建了一种基于Transformer的有监督通用矿产资源预测模型(Trans GMP),并在东昆仑-西秦岭成矿带进行实验。通过对东昆仑-西秦岭成矿带内的大量地学数据进行预学习,有效提取并识别矿床与成矿地质要素及地球物理、地球化学异常在垂向上的空间叠加关系(地质要素、物、化异常综合约束,即局部地质特征)和横向上的长距离空间相关关系(即全局地质特征)以及多尺度变化特征,最终训练形成东昆仑-西秦岭成矿带通用矿产预测模型。该模型可以适应多种地质情况,能够进行成矿带规模的找矿预测。研究结果表明,用预测研究区数据对模型进行微调可以提高预测精度。此外,本文还构建了基于卷积神经网络(CNN)的通用矿产预测模型,并在东昆仑-西秦岭成矿带进行预测。对比分析二者的预测结果,发现Trans GMP的预测效果更好,模型性能AUC更高,预测区面积占比更小,且可以预测到所有已知矿,说明Trans GMP不仅为该成矿带的矿产资源勘查提供了科学依据,也为以后建立更大区域范围甚至全国范围的通用矿产预测的研究提供理论支持和方法指导,促进矿产资源勘查技术的进步。 (5)采用东昆仑-西秦岭成矿带通用矿产预测模型进行金矿找矿预测利用东昆仑-西秦岭成矿带的四个典型金矿矿集区数据对Trans GMP进行预训练,形成东昆仑-西秦岭成矿带的通用金矿预测模型,并对成矿带内的沟里、五龙沟、寨上-马坞、崖湾-大桥四个研究区进行了金矿找矿预测。通过对比ROC、AUC、预测区面积占比(TAR)、已知金矿预测情况(TPR)等多种评价指标及随机验证、邻区验证等评价方法,验证了模型的适用性和有效性。最终,实验发现Trans GMP在各个研究区的预测结果与研究区的地质情况和成矿特征高度一致,且与前人人工圈定的靶区位置总体具有较好的套合性。在保证预测区面积较小的前提下,Trans GMP在每个研究区都可以完全预测到所有已知金矿床(点),并在此基础上发现一些新的预测区,且ROC较好,AUC值均可以达到0.9及以上。最终,在沟里地区圈定了11个找矿靶区,在五龙沟地区、寨上-马坞地区和崖湾-大桥地区分别圈定了10个找矿靶区,其中各个研究区的A类与B类找矿靶区与空间聚类成矿地质分析结果相符合。

同主题文献

京ICP备 05064591号京公网安备11010802017129号

建议浏览器: 火狐、谷歌、微软 Edge、不支持 IE