过去十年,电信网络经历了All IP、ALL Cloud变革,用户体验提升同时也带来更多问题。OPEX是CAPEX的3倍以上,网络复杂度使网络管理难度超过人的能力,70%重大故障都是人为因素。运营商网络面临结构性问题,依靠压缩费用或提升人员技能已不能解决,需要“用构架性创新解决结构性问题”。
华为SoftCOM AI在全云化网络构架上,引入以机器学习为核心的AI技术。整个构架有两个核心,一是AI训练平台,训练数据,输出模型或算法;另一个是推理平台,收集数据,根据模型或算法推理网络动作指令并执行。网络将从自动化业务部署和动作执行,走向智能化的故障自愈,自我优化,自我管理。最终实现“自动,自优,自愈,自治”永不故障的自动驾驶网络。
自动:网络自动发放运行业务,包括业务自动部署、弹性伸缩、流量调整等。自优:网络系统自动优化,如话务模型变化、流量不均衡的时自动调优。自愈:故障自动隔离,自动修复,实现网络永不故障。自治:系统实现自动、自优、自愈后,就达到了自治水平,是网络的最终状态。
提升用户体验,实现三个倍增
SoftCOM AI解决方案对运营商价值为“三个倍增”,即运维效率、能源效率、资源效率倍增。
运维效率倍增
人工智能用于设备和网络全生命周期,可消除无效故障,缩短故障处理时间,提升运维效率。例如某移动运营商将运维承包给第三方,通过工单数量与合作方结算费用。无线领域一个月工单6.3万张,设备硬件类故障不到10%,超过70%故障源自无源设备,如光纤弯曲老化、接口松动。“设备收编站点,有源管理无源”实现线缆、连接器、动力环境问题大幅下降,“智能故障预测,网络负荷分担”变抢修为基于状态计划性维护,“人工开环转为设备闭环”实现非物理故障恢复自动化,工单数量降到原来的10%。
能源效率倍增
运营商能耗分布:站点能耗占65%,数据中心占20%。网络流量分布在时间和空间不均衡,10%的站点产生50%的流量,50%的站点产生5%的流量。机房/站点,AI训练生成散热与环境及业务负荷模型,使日照、温度与油机、太阳能和电池等达到最佳能效;设备层,根据业务负载进行动态能量投放,无流量时隙关断、RF深度休眠、载频关断等减少耗电量;网络系统,构建准确的业务负荷预测模型,使整网流量最优达到能效最佳。实现“比特决定瓦特”,即网络流量大小决定能耗多少。
资源效率倍增
网络资源包括骨干网、核心网、有线无线网络资源等。现在资源管理是网络建设好,流量随之流动,资源利用可能不合理。引入AI,基于流量走向调度网络,实现管线、机房等设施最佳利用;根据用户、终端、业务分布,实现空口频谱最大程度利用;对弹性流量削峰填谷,提升骨干网利用率。如骨干网,热点DC间的IP骨干网络利用率接近70%,非热点DC间的网络利用率不到30%。传统基于专家规则确定调优策略,不能获得持续负载均衡。通过AI,如流量趋势预测、路径性能预测,不牺牲 QoS 或 SLA,流量路径几乎实时变动, 达到最优。测试证明,AI优化的骨干网线路忙时利用率从平均30%提升50%以上。
华为先针对运营商效率提升明显的应用入手,不断扩充应用、改进算法、探索部署模式,逐步将AI应用到运营商全网,实现自动化网络向自治网络迈进。