Page 13 - 网络电信2019年6月刊上
P. 13

运 营 商 专 栏

                其中,mnx 表示第 m 个频点的第 n 个参数。如 F1D1D2FDD             的算法模型与评估结果对算法模型进行现网部署与测试验证。
            900MHz 的组网结构包含 4 个频点,每个频点如果有 12 个参数配                     1.现网数据采集与预处理
            置数据,则 X 矩阵大小为 (4,12)。                                    采集现网中的数据,主要包括:MR、影响负荷的配置数据、
                性能指标参数 Y 为小区组负载均衡的判定指标数据,                        与负荷相关的 KPI 与 PM 数据等。测量报告数据主要来自 UE 和
            可 包 括: 小 区 组 所 包 含 每 个 频 点 的  RRC(radio  resource    eNode  B 的物理层、RLC 层以及在无线资源管理过程。影响负荷
            control,无线资源控制)最大连接用户数、上行 PRB(physical               的配置数据指主要用于系统中无线资源控制子层完成诸如小区
            resource block,物理资源块)利用率和下行 PRB 利用率等参数,              选择 / 重选及切换等事件触发的参数。与负荷相关的 KPI 与 PM
            包括 m 个频点,每个频点有 k 个参数,矩阵大小为 (m, k) ,可                 数据主要包括网络考核负荷所用的关键指标:如 RRC 最大连接
            表示为:                                                 用户数、上行 PUSCH 利用率、下行 PDSCH 利用率等。
                                                                     为了满足机器学习算法的多维数据需求,需从不同设备厂
                                                                 商以及不同网元采集数据,这样采集的数据格式差异大、数据
                                                                 相关性复杂,关联去重之后实际可用格式化数据减少。本文所
                                                                 选取的小区场景为 F1D1D2FDD  900  MHz,采集南宁市中存在负
                                                                 荷不均衡的 5 个网格共 700 多个小区连续一个月的数据,以 15
                其 中,y mk 表 示 第 m 个 频 点 的 第 k 个 负 载 指 标 数 据。 如    min 为粒度采集测量报告数据,配置参数以天为粒度进行采集,
            F1D1D2FDD 900MHz 的组网结构包含 4 个频点,每个频点有 3 个             性能数据以 15  min 粒度进行采集,对处理后的格式化数据进行
            指标数据,则 Y 矩阵大小为 (4, 3)。                               随机划分,按照 8: 2 的比例划分训练集和测试集,现网采集数
                研究性能指标与配置参数的关系,将此问题建模为多变量                        据预处理结果见表 1。
            回归问题。使用全连接神经网络算法模型学习回归问题的内在
                                                                  表 1 现网采集数据的预处理结果
            关系,使用训练数据训练神经网络模型。输入为 X,读入 X 中的
            数据,转换为列矩阵,作为神经网络的输入,同理转换 Y 矩阵
            为列矩阵,作为神经网络的输出。  回归问题的输出 Y 含有多个
            变量,因此依据此问题设计代价函数为:





                其中,y i 是样本数据,而 y' i 是神经网络计算的预测值。
                将各个变量的 MSE(mean  squared  error,均方误差)的
            平均值作为损失函数,通过训练模型、调整权重和偏置使得网                              2.模型训练与结果分析
            络的代价函数达到最小,由此得到训练稳定的神经网络模型。                              根据上文提出的小区场景划分方法,使用 MR 数据对小区场
                (4) 配置参数寻优                                       景进行划分,场景自动划分采用 K-means 聚类算法,算法的时
                使用优化搜索算法在得出的训练模型中搜索使网络性能参                        间复杂度为:O(t×k×m×n),空间复杂度为:O(m×(n+k)),
            数达到最优的参数配置,采用爬山算法进行局部最优解的搜索,                         其中,t 为迭代次数,k 为簇的数目,m 为特征数,n 为样本数。
            将得出的参数配置部署到现网中并测试其性能。优化配置输出                          一般 t、k、m 均可认为是常量,所以时间和空间复杂度可以简
            过程如图 4 所示,具体算法实现为:从当前的节点开始,和周                        化为:O(n),即线性的。对每个类别的 MR 统计数据求均值,各
            围的邻居节点的值进行比较。如果当前节点是最大的,那么返                          场景类别 MR 统计数据均值分布如图 5 所示。
            回当前节点,作为最大值(即山峰最高点);反之用最高的邻
                                                                   图 5 各场景类别 MR 统计数据均值分布
            居节点替换当前节点,从而实现向山峰的高处攀爬的目的。如
            此循环直到达到迭代次数。在迭代次数内,得到的可能只是局
            部最优解,并非全局最优解。
              图 4 优化配置输出过程

                                                                     对所划分的 4 类小区场景分别进行配置参数与性能参数的
                                                                 关系模型训练,利用深度学习算法模型学习配置参数与性能指
                                                                 标参数的内在关系,采用均方误差(MSE)、平均绝对误差(mean
                                                                 absolute  error,MAE)以及  R-Squared  对深度学习算法训练
                                                                 得到的模型进行评价。DNN  算法的复杂度主要由隐藏层、隐藏
                三、现网测试验证                                         单元以及样本的数量决定。DNN 模型评价指标见表 2,评价结果
                为验证算法的有效性与可实施性,需采集现网的数据集对                        显示,深度学习算法对数据具有较好的拟合度,预测数据与真
            本文提出的方案进行模型训练与结果评估,然后依据训练生成                          实数据的误差较小。

            14                                         网络电信 二零二零年六月
   8   9   10   11   12   13   14   15   16   17   18