基于平衡化增强与异构模型集成的测井岩性识别方法研究摘要
随着非常规油藏勘探工作的不断深入,岩性识别的重要性日益凸显。测井曲线蕴含丰富的地质信息,结合具备特征挖掘能力的机器学习方法,已成为提高岩性识别效率与准确性的关键技术。然而,当前方法在实际应用中仍面临两方面挑战:一是岩性样本分布不均,导致模型易偏向多数类,影响分类均衡性;二是测井数据特征维度高、非线性强,包含多源异构信息,单一模型在识别精度与泛化能力方面存在局限。面向测井数据中类别不均与单一模型局限性的问题,本文基于数据分析、模式识别和机器学习等技术,开展了基于平衡化增强与异构模型集成的岩性识别方法研究。 针对岩性识别中的类不平衡问题,提出一种基于SMOTE平衡数据的极端随机树岩性识别方法。SMOTE方法通过合成少数岩性类别样本实现数据平衡,强化模型对各类岩性特征的学习能力,缓解类别不均带来的识别偏差;极端随机树则通过在特征选择与划分中引入随机性,丰富模型多样性,增强泛化与抗过拟合能力。通过在大庆油田的实际测井数据集进行实验,结果表明,该方法在测试集中准确率达到86.62%,G-mean为86.78%,优于对比模型,分类结果更加准确和均衡;少数类岩性识别精度显著提高,最高召回率提升了16.67%。 针对单一模型在处理复杂测井特征时的建模局限,提出一种基于异构模型集成的岩性识别方法。首先,选取XGBoost、RF与KNN三种结构差异与机制互补的模型作为基分类器,XGBoost通过减少偏差提升拟合能力,RF通过降低方差增强鲁棒性,二者结合可实现低偏差和低方差的平衡,KNN则能捕捉到被XGBoost和RF忽视的局部特征,丰富模型对不同数据特征的处理能力;其次,采用Stacking集成策略融合各基模型的预测结果,实现模型间的协同优化,提高对多源异构测井数据的建模能力;最后,在数据平衡的基础上,进一步优化模型的整体性能。通过在大庆油田三口实际测井数据上的对比实验表明,SMOTE平衡数据前后,Stacking模型的准确率、G-mean、精确率、召回率和F1值整体均优于单一模型,且在不同数据集上均表现出较高的稳定性和泛化能力。
|
@ 2023 版权所有 中国地质图书馆 (中国地质调查局地学文献中心)
京ICP备 05064591号 京公网安备11010802017129号
建议浏览器: 火狐、谷歌、微软 Edge、不支持 IE