大规模电力企业数据网运维管理模式研究

2018-03-21 14:43:35 电力信息与通信技术  点击量: 评论 (0)
随着近年来电力企业信息技术手段的不断提升以及管理精细化水平的不断提高,数据网在网架结构、网络带宽、技术体制、承载要求方面已经发生很大变化,有必要对网络运维模式进行研究。通过深入分析大规模电力企业数据网的变化,研究了中国电信和某能源央企的典型网络模式,通过对多种

0 引言

电力企业数据网[1]已覆盖企业各级单位及生产营业节点,其上承载了大量管理信息业务。近年来,通过开展优化整合工作,实现了数据通信骨干网向省级及以下数据网络的技术标准延伸和网络架构延伸,全网技术体制标准统一、网络结构清晰[2]。电力企业数据网改造之前主要存在以下3种运维模式:省、地市、县公司一体化模式;地市、县公司一体化模式;省、地市、县公司独立运维模式。随着网络的逐步改造,这3种运维管理模式已经不能适应新的网络管理需求。

在企业数据网边界延伸至地市公司后,本文主要从网络架构、网络规模和覆盖范围、路由控制[3]3个方面说明网络变化,进而分析运维管理所面临的新挑战、新风险。

1)在网络架构方面,省内网络扁平化,省级机构不再作为本省业务的汇聚点,省级机构本部作为一个地市级节点,与其他地市节点一起直接通过骨干网与总部对接。网络结构的变化,使得原有的“总部—省公司”两级网络运维体系出现了不适应问题。

2)在网络规模和覆盖范围方面,网络规模和覆盖范围的变化使得总部很难全面、高效地对网络运行进行深入管理。由于骨干域[4]边界扩大至地市公司,骨干域设备数量增加了数倍,运行管理的深度很难保持原有的运维质量。

3)在路由控制方面,由于总部至省级机构的边界已经不存在,因此无法沿用原有在省、地市公司边界部署路由控制手段以限制故障影响范围的模式,必须采用通过两级路由反射器(Route Reflector,RR)进行集中路由控制的手段,即路由控制模式从分布式走向集中式[5]

 1 典型数据网络运维模式

1.1 中国电信

中国电信采用总部、省公司、地市公司三级运维管理体系[6]。按照管理与操作分离的原则,进一步划分为专业管理条线和运维操作条线[7]

在全网运维专业管理条线,包括职能管理与业务管理两个方面,其中职能管理部门的3个级别机构包括集团公司、省公司及地市公司(本地网),职能管理部门掌握人、财、物的资源管理权限;业务管理部门的3个级别机构包括集团公司运维部、省公司运维部及地市公司网络部,3个级别的运维部门属于相应层级机构的管理部门,负责本层级运维工作的统筹协调与考核管理,以及面向下级运维部门的标准规范制定、指导意见下发、运维资源配置以及考核评价的管理职能[8]。中国电信网络运维体系如图1所示。

图1 中国电信网络运维体系Fig.1 Network operation and maintenance system of China Telecom

在全网运维运维操作条线,总体上采用两级监控集中、属地维护操作的模式。其中,集团公司运维部下设集团网络操作中心(Network Operations Center,NOC),负责全国骨干网传输、交换、数据、移动等通信专业的集中监控、配置、调度、资源管理等;省公司运维部下设省NOC中心,负责本省各通信专业的集中监控、配置、调度、资源管理等;地市公司网络部下设网络监控维护中心/团队,主要负责属地通信网络的维护工作,除保留部分末梢线路的监测与测试外,其余网络监控职责全部上收。中国电信面向各级NOC/监控维护中心采用矩阵式模式:上级NOC中心对下级NOC中心开展业务层面的纵向调度并提供专业支持,并对下级NOC具备考核打分权,通过网管工单系统记录各环节执行情况作为重要的考核依据;同时,各级NOC接受本级网络部的职能管理,包括中心领导任免、成本费用预算管理、中心考核管理等。NOC运维体系如图2
所示。

图2 NOC运维体系Fig.2 Operation and maintenance system of the NOC

1.2 某能源央企

某能源企业的数据网络基于MPLS VPN网络架构[9],所有机构的服务商边缘路由器(Provider Edge,PE)均统一在一个自治系统(Autonomous System,AS)域内,且根据机构的地理区域集中情况及传输资源配套情况,进行了片区网络的划分;AS VPN划分逻辑为根据组织机构进行划分,建有一级纵向VPN、一级共享VPN和二级纵向VPN。该企业的MPLS VPN网络在企业所有层级机构的IP地址段、RD/RT、路由协议、VPN划分、接入链路类型及带宽均设置了标准化要求。

1.2.1 运维体系结构

该企业MPLS VPN[10]网络的运维体系划分为网络管理及网络操作两个条线。网络管理条线涉及的机构为总公司ITC;网络操作条线涉及的机构包括集团网管中心、各片区网管中心以及各业务单位的网管专岗。网络运维层次划分如图3所示。

图3 网络运维层次划分Fig.3 The hierarchy division of network operation and maintenance

1.2.2 网络运维流程

该企业集团的MPLS VPN网络运维体系的组建以总公司、二级单位等行政管理归属为基本单元,采用运维管理集中、运维操作分散的模式:总公司ITC负责统一的运维管理;集团网管中心、片区网管中心和业务单位网管专岗分别按照所属层级进行具体的维护工作。

集团网管中心、片区网管中心和业务单位维护专岗分工协作、相互配合,共同做好MPLS VPN网络的运行与保障工作。MPLS VPN网络运行维护界面划分如图4所示。

图4 MPLS VPN网络运行维护界面划分Fig.4 Interface division of MPLS VPN network operation and maintenance

1.3 运维需求和趋势分析

该企业已经开始关注对电力通信系统运维体系的集中化管理探索,并在部分省公司开展了“省地一体化运维”试点工作,以期进一步提升网络运维管理水平与运维资源的配置效率。在该企业数据通信网开展运维体系的优化探索,除上述驱动因素外,也符合公司电力通信系统运维体系改造的整体方向和业界发展的一般趋势。

基于上述2个典型案例的分析,各单位在数据通信网运维管理体系模式的选择上,并不存在标准模型,一般都会以集中化、标准化为前提,根据自身的能力条件、业务需求,在企业整体管理框架内选择合适的路径。对于电力企业而言,在运维管理体系建设上,需要与电力通信体系框架相适配,与企业发展战略相衔接,同时还要考虑当前企业数据网运维体系的整体特征和资源限制。

 2 运维管理模式研究

数据网的延伸将网络的边界扩展至地市公司,在运维管理上[11],相比之前的数据网骨干网、省内数据网等,从维护范围、维护难度、维护风险等方面都提出了更高的要求。为实现全网的正常运转和运维成效的整体发挥,需要基于数据网全网运维管理的特征和业务承载的总体要求,对现有运维模式进行审视梳理,结合业界在网络运维管理方面的成熟经验和理念,实现运维调度指挥有力、网络资源管理清晰、运维操作专业规范、运维协同有序可控。

传统的网络运维模式[12]从网络架构、网络规模和覆盖范围、路由控制3个方面都无法满足新的网络管理需求。网络结构的变化使得原有的“总部—省公司”两级网络运维体系出现了不适应,骨干域设备数量增加了数倍,运行管理的深度很难保持原有质量。由于总部至省级机构的边界已经不存在,已无法沿用原有的在省、地市边界部署路由控制手段以限制故障影响范围的模式。

2.1 模式一

数据通信骨干网(核心层、汇聚层、骨干层)所有设备由总部统一进行监控、配置并组织应急处置,各省级机构承担属地维护职责。

管理模式为:数据通信骨干网设备及网络的路由策略制定、规范制定以及涉及全网范围的项目投资和网络优化权限全部上收至总部层面,网络设
[13]运行监视、配置管理、调度协调、资源分配、故障处理均由总部负责,省级机构负责本地接入网设备的维护,并配合总部开展设备基础环境维护等现场工作。

具体分工为:总部直接负责数据通信骨干网所有设备的运行维护,各省级机构负责数据网接入网(地市、县级网络)设备的运行维护。数据通信网运维管理职责(模式一)如图5所示。

2.2 模式二

在所有骨干域内,以原有的省级机构部署的总部PE设备为界,总部PE及以上设备由总部负责进行监控、配置并组织应急处置,各省级机构承担属地维护职责;省公司与总部对接PE设备及省内PE设备由省级机构负责运维。

图5 数据通信网运维管理职责(模式一)Fig.5 Operation and maintenance responsibilities of data communication network (mode 1)

管理模式为:保留原有数据网骨干网与省级及以下数据网的运维界面不变。业务VPN的配置管理、调度协调、资源分配、故障处理则根据业务等级分别由总部和省级机构负责。

具体分工为:总部负责公司数据网骨干网的核心层所有设备的运行维护[14],各省级机构负责辖区内数据网骨干网(除省级机构核心机房及汇聚点的骨干网汇聚层PE设备)及数据网接入网(地市、县级网络)所有设备的运行维护。数据通信网运维管理职责(模式二)如图6所示。

图6 数据通信网运维管理职责(模式二)Fig.6 Operation and maintenance responsibilities of data communication network (mode 2)

2.3 模式三

数据通信骨干网所有设备(除总部办公区PE设备)均按照属地进行拆分,本地省级机构负责网络监控、运行维护和应急处置,总部负责省际业务的监控和协调处置。

管理模式为:数据通信骨干网设备及网络的路由策略、规范制定以及涉及全网范围的项目投资和网络优化权限全部上收至总部层面,网络设备运行监视、配置管理、调度协调、资源分配、故障处理则由属地省级机构负责。

具体分工为:总部直接负责数据通信骨干网的总部核心节点设备的运行维护,各省级机构直接负责辖区内数据通信骨干网所辖范围内及数据网接入网(地市、县级网络)设备的运行维护。数据通信网运维管理职责(模式三)如图7所示。

图7 数据通信网运维管理职责(模式三)Fig.7 Operation and maintenance responsibilities of data communication network (mode 3)

2.4 对比分析

1)模式一。模式一强调总部在骨干域的全网监控和集中管理,以及省级机构在地市接入网络的集中监控和集中管理,可以实现由总部一家运维单位实现总部到地市层面的一级业务端到端部署维护能力。总部运维单位可全面掌握骨干区域的网络资源情况和运行状态信息,因此在业务的资源配置效率、方案制定准确度和业务部署排障过程中,均具备高度的方案统一性和操作准
确性[15]

2)模式二。在业务需求环境方面,模式二适合全网一级业务系统总量不大,省内二级业务占比大、复杂性高或调整量大的情况;在维护能力方面,由于在整体体系架构和各层级运维定位基本不变,对各级维护能力的需求变化不大,比较适合各省维护体制和管理模式差异较大的情况;在网络管理系统环境方面,总部具备统一网管系统对骨干域内的所有设备进行网元监控、告警分析的能力,省级机构需具备统一网管系统对省内地市域的所有设备进行网元监控、告警分析的能力。

3)模式三。在业务需求方面,对于一级业务与二级业务的操作配置区别不大;在维护能力方面,对各级维护能力的需求变化不大;在网络管理系统方面,总部需具备统一网管系统对骨干域内的所有设备进行网元监控、告警分析;省级机构需具备统一网管系统对省内地市域的所有设备进行网元监控、告警分析的能力。

2.5 运维管理模式推荐方案

综合上述分析,在各省二级业务应用比重大、省内业务需求复杂、各省运维管理逻辑存在差异、网管工具尚待完善、人员配置和能力存在瓶颈的情况下,模式二对现有体制冲击小,业务影响风险低,同时又兼顾了数据通信网的适度集中的运维管理特点,具有较高的现实可行性。

模式二虽然能够部分保留原有的运维界面,但对于延伸后的骨干区域很难实现运维界面的界定及运维流程管理,延伸后在骨干域内需同时考虑地市之间跨域访问,也要考虑跨省之间的访问情况,在同一个域内的设备将会出现总部与省级机构同时管理的情况,对于权限与责任的划分很难通过技术手段实现,对于这种多业务承载,网络规模超大型的网络存在一定的风险。

因此,本文研究建议以模式二作为临时过渡模式,最终以模式一指导开展数据网的运维工作,后续着重关注人员能力的培养、网管工具的完善、制度规范的健全以及运维经验的积累,最终实现数据网的运维模式。

 3 结语

本文针对电力企业数据网广域网骨干域延伸到地市的情况,结合当前运维存在的问题和风险点,借鉴典型企业运维管理模式,提出了3种不同的运维模式。短期建议以模式二为主,后续随着网管系统的建设完成、人员能力的具备,应逐步向模式一的集中式管理过渡。

 
大云网官方微信售电那点事儿

责任编辑:售电衡衡

免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
我要收藏
个赞