基于Adaboost算法的成矿预测模型研究——以加拿大Nova Scotia省金矿为例摘要
多元信息集成技术在多种控矿因素的共同耦合控矿成矿预测工作中起到至关重要的作用。本文以加拿大北部的Nova Scotia省西南部地区金矿为例,在对前人在此地区运用的各种多元信息集成技术综合分析的基础上,选择并改进Adaboost算法,利用ARCGIS、MATLAB等软件平台实现算法,对该地区多元信息进行集成并指导预测。Adaboost是一种有很高精度的多元信息集成分类算法,其优点是:在Adaboost算法提供的是框架下,可以较为灵活的使用各种方法构建子分类器;不用做特征筛选;不会出现过拟合的问题。主要内容及成果如下:(1)系统收集了研究区的基础地质资料、水系沉积物地球化学资料,在前人总结的成矿规律基础上,分析研究区成矿特征,针对Adaboost算法特点,对各个维度信息进行提取,以便于之后的多元信息集成。(2)针对正反例错误率不同,而不能用全局错误率替代的问题,将boostWofE(增强型证据权法)中的弱分类器权重计算方法移植到Adaboost分类算法里,在实验中取得更好的分类效果。(3)针对地质数据中正反例(矿点与非矿点)数量往往不对称的问题,对训练集的数量占弱势的子集(如矿点集)在Adaboost算法中进行初始化时加更大的权重,来解决训练集正反例数量不对称的问题而导致的分类界线向弱势子集偏移的问题,在实验中取得更好的分类效果。(4)在训练集样本数量较少(尤其是正例(矿点)较少),无法分出有效数量的测试集的情况下,引入交叉验证的方法来评价分类的性能,并使用ROC曲线和PR曲线对分类性能进行评价。(5)将Adaboost算法与证据权法及证据权法的改进方法进行比较,对这两种方法的差异和相似进行分析。结果表明,经过初始化加权修正和权重计算方法修正的Adaboost算法对于研究区内的点的预测具有更高的正确率,优于传统Adaboost算法,也优于SVM算法在此数据集上的预测效果。
|
@ 2023 版权所有 中国地质图书馆 (中国地质调查局地学文献中心)
京ICP备 05064591号 京公网安备11010802017129号
建议浏览器: 火狐、谷歌、微软 Edge、不支持 IE