基于数据挖掘的TD-LTE基站负载研究

移动通信行业飞速发展,产生的数据量呈爆发式增长,宣告大数据时代到来。一方面,大量的数据是一座金矿,蕴含极大的潜在价值;另一方面,用户数激增,基站负载升高,用户体验亟待改善对运营商来说是巨大的挑战。近年来,数据挖掘和大数据技术被应用到各行各业中,不断取得成就,引起学术界和互联网行业的重视。本文基于最新的分时长期演进(Time Division Long Term Evolution,TD-LTE)移动通信网络数据对基站负载进行了深入研究,旨在研究TD-LTE网络负载规律和特性,提出相应的费用设计策略、负载均衡方案及资源配置建议。具体研究内容包括以下四个方面。基站负载的时间和空间域分布规律研究。对原始数据进行预处理并按不同的时间尺度和基站维度对数据进行聚合,得到了时域和空间域的统计分布规律;针对时间域,研究了整个区域网络的周期性时间自相关性的特点,上下行及不同时刻负载的差异;针对空间域,使用基站空间分布维诺图研究了整个区域网络不同时间段基站负载差异;还根据高斯核函数对原始的莫兰指数进行了优化;最后,提出了一种负载均衡量化指标,并统计了该指标在实际数据中的分布。基站负载时序特征提取及区域类型识别的研究。针对基站负载特征数据,研究了负载特征的相关性并对相关度最高的特征使用主成分分析进行降维,压缩了特征维度节省计算时间;基于提取的特征进行聚类分析,得到了五类不同的行为模式并对这五类模式的数据按工作日和周末进行切分,研究了各类型的基站在工作日和双休日的负载情况;为运营商提出了一种更合理的专属计费策略,即通过基站负载的时域变化数据预测基站区域类型并根据不同类型负载的时间分布制定策略。高危基站特征提取及分类的研究。针对第二章提出的负载均衡指数对基站样本进行标记并引入了多元高斯分布随机扰动对原始基站样本重采样,减小了由样本不足导致的误差和过拟合风险;对负载数据进行特征工程,基于新的衍生特征对比了逻辑回归(Logistic Regression)、随机森林(Random Forest)、梯度提升树(Gradient Boosting Decision Tree)算法的效果和泛化能力;借鉴工程上的模型融合思路提出了一种优化的分类方案,提升了模型的准确率并保持较好的泛化能力。基站负载预测算法的研究中。从单个基站的角度出发,只使用基站本身的时间序列负载数据进行预测。对比分析了传统的时间序列分析把序列分成趋势性、季节性、残差三个分量的分解方法以及小波分解把序列分解成高低频部分的分解方法,使用均方根误差对比了效果,提出的方案能够在保证性能的前提下减少预测误差,有助于运营商参考并制定基站节能方案。

同主题文献

京ICP备 05064591号京公网安备11010802017129号

建议浏览器: 火狐、谷歌、微软 Edge、不支持 IE