摘要:基于AOC打造新一代网络设备运管平台,并在生产测试区上线,实现了网络运维开放可编程技术在金融行业的首应用。
Bank4.0时代,智能金融服务融入生活中的各个场景,随时随地、永不掉线的金融服务需要平稳的网络支撑。随着金融互联网业务的飞速发展,一方面金融机构对数据中心基础网络的平稳性和快速性的要求越来越高,而另一方面不断扩大的网络规模和愈发复杂的网络架构又给网络运维工作带来巨大的挑战。网络运维工作量和难度的日益增加,催生了数据中心网络运维自动化转型的需求,且已成为趋势。
金融行业在自动化转型过程中,凸显出两大痛点问题:一是在数据中心内部网络设备数量巨大,品牌、型号众多,不同设备间管控方式和管控命令差异巨大,难以构建统一管理的能力;二是随着网络架构和上层应用的变化,网络运维业务也在不断更新,而传统的编码方式在构建新业务能力的时候开发周期长,无法进行敏捷响应。
针对上述问题,银联-华为金融网络实验室基于AOC打造新一代网络设备运管平台,并在生产测试区上线,实现了网络运维开放可编程技术在金融行业的首应用。 新平台重点构筑和验证了以下关键能力:
一、设备与业务双层YANG模型驱动,基于业务视角实现不同厂商设备统一管控
当前的数据中心网络运维操作仍较大程度上依赖命令行脚本。但命令行缺少标准和规范,不同厂商的命令行风格差异大,出错返回的信息也各有不同;并且同一厂商的命令行也会随着设备软件版本的不同出现差异。这就要求运维人员必须熟悉掌握各厂商命令行,且要针对每厂商、每设备款型、每软件版本维护对应的命令行脚本,效率低下且容易出错。针对该问题,新一代网络设备运管平台基于AOC的YANG模型驱动和可编程引擎,实现了设备层和业务层的解耦,做到了基于业务视角对不同厂商设备统一管控的效果,具体能力如下:
- 网业分离:运管平台的网络业务功能层和网络设备管理层解耦,业务模型与设备模型无关、与厂商无关,业务模型可跨设备、跨厂商支撑业务自动化部署。使能网络DevOps、屏蔽厂商设备技术细节,运维人员可聚焦业务本身、自主定义业务模型
- 模型驱动:运管平台的网络业务功能和设备管理功能均支持YANG模型驱动。使得设备驱动包、UI界面、北向接口均具备自动生成能力,大幅提升效率
- Netconf和CLI并存:网元层南向增加标准的Netconf/YANG交互通道,进一步屏蔽厂商命令行的差异,简化运维
二、开放可编程,快速适配多厂商设备和构建新业务
当前的金融数据中心网络,存在着较强的厂商依赖。设备的适配,新业务功能、新特性的诉求,均需提需求给厂商,由厂商版本排期并开发实现。典型的周期为6~9个月,难以支撑新业务快速上线的诉求。
新一代网络设备运管平台,率先在金融数据中心网络中实现了网元层和网络业务层的开放可编程,并结合具体的网络运维场景进行了验证:
- 网元层开放可编程,快速适配设备:基于运管平台的开放可编程能力,快速开发和构建设备驱动,实现了华为CE6850、USG9520,以及华三S6800的快速适配。单款设备的驱动包开发周期约为1周
- 网络业务可编程,快速上线:针对金融数据中心的防火墙实际业务开通场景,快速开发网络业务功能包,并实现了业务的自动化部署。开发周期约为1周。
开放可编程避免了厂商的锁定和依赖,网络新业务和设备的适配可以在自主开发、集成商开发、厂商开发等多个选项中灵活选择,可更好地满足业务快速上线的诉求。
三、事务回滚机制,支撑网络可靠运维
传统的命令行配置方式,缺少事务、一致性比较、回滚等关键能力,在配置出错情况下,需要人工查看配置日志、手动恢复业务。面对这一难题,新一代网络设备运管平台从配置前的审核,配置失败的回滚,配置后的审计,提供全面的保障。
- 配置前:系统提供DryRun能力,支撑配置审核工程师对配置脚本进行审核
- 配置中:实时监测配置下发的过程,如出现异常,系统自动进行业务配置回滚,实现网络的恢复,系统影响降至最低
- 配置后:提供配置历史记录,提供一致性比较能力,运维工程师可按需检查、配置审计、以及业务回滚
基于AOC的新一代网络设备运管平台,使得网络运维从命令行转向YANG模型动和开放可编程。构建了多厂商设备的统一管理、快速适配能力;构建了网业分离,屏蔽厂商及设备差异的能力,从而更聚焦业务本身;构建了业务配置的事前审核、故障快速回退能力。为智慧金融业务提供更开放、更灵活、更可靠的网络。
面向未来,银联-华为金融网络实验室将进一步深化和推进金融网络运维的开放可编程,携手更多的伙伴,共建和繁荣金融网络开放可编程生态。
本文分享自华为云社区《基于网络开放可编程技术构建新一代网络设备运管平台》,原文作者:长期飘在公有云上 。