概括:主机监控、信息统计、硬件维护、系统维护、网络维护。
分层运维
计算机的广泛应用,是在于它的模块化设计,以及分层体系,PC的硬件是由CPU、内存、硬盘、主板、输入输出设备等组成。正是这些模块化的构造让人们对计算机的维护更加的方便,快捷。
云计算时代,是必然的趋势,因为人们对信息自由的渴望,对资源合理利用的需要。云计算的发展也少不了用模块化,分层次的进行设计和优化。
云计算的分类 云计算可以认为包括以下几个层次的服务:基础设施即服务(IaaS),平台即服务(PaaS)和软件即服务(SaaS)。
现在的系统分层多且繁杂,无法体现在IDC机房的运维,IDC机房的运维应该根据服务提供的角度去对IDC机房进行维护,从终端角度来看,所有提供网络服务的资源都是一朵朵的网云。在IDC机房中的运维都是为了面向终端进行服务。所以说我们应该根据服务来对IDC机房进行运维。
云计算服务的分类认为在运维分层的问题上应该和云服务的分类相呼应来进行维护,所以,IDC机房的运维应该分成:基础设施维护,耦合层维护,应用服务维护三个层面。
基础设施维护
顾名思义,指的是对设施设备的维护,包括设备的环境维护,设备的统计等等。
耦合层维护
在这个层面,对设备有了统一的管理,有系统性的架构统一的管理系统,指令系统,和监控系统,在这个层面可以发现底层的问题,并交由底层处理,并在这个层面保证应用服务的正常运行。在这个层面将会涉及负载均衡和备份等技术。
应用服务维护
在这个层面主要是客户对自己应用的维护,在这个层面里客户对自己运行的运营软件进行维护。
IDC机房运维就是要保障最底层的运维维护安全。如何高效的维护好底层的设备是每一个IDC运维工程师应当具备的职责。我们可以做好以下几个方面。
一、统计记录好机房机器运行的信息。如上下架记录,故障处理记录,监控记录等等,做到高效快速的统计好所有机房信息。
二、 监控。熟悉和掌握监控软件的使用,做到可以根据监控工具的组合应用定位故障点,初步反应故障原因等。
三、运维知识的积累与沉淀、文档的完备性。好的经验与陷阱都需积累下来,避免重复性范错。并且可以在相似问题发生的情况下快速反应。
四、有计划的做事。机房运维工作很多事情是需要定期去做的,比如统计、评估、优化等等。
机房场景
机房组件
UPS
Uninterrupted Power System简称UPS:利用电池化学能作为后备能量,在市电断电等电网故障时,不间断地为用户设备提供(交流)电能的一种能量转换装置。
功能:1、不停电功能,解决电网停电问题;2、交流稳压功能,解决网压剧烈波动问题;3、净化功能,解决电网与电源污染问题;4、管理功能,解决交流动力维护问题;
主要功能:实现电网与用电器之间的隔离;实现两路电源的不间断切换;提供高质量电源;电压变换和频率变换功能;停电后提供后备时间。
环控系统
机房环境监控系统。
主要包含有以下分系统:空调监控系统、UPS后备电源监控系统、配电监控系统、漏水监测系统、温湿度监测系统、消防监视系统、门禁管理系统、闭路视频监视系统等。
全面展示机房的环境温度、湿度,机房内的烟感、门禁系统的运行情况,UPS电流、电压等工作状态的信息。一旦机房发生状况,可以在第一时间通过声光、微信、邮件、短信、电话等告警方式告知管理员,及时排除故障隐患。支持声光、微信、邮件、短信、语音拨号等等多种报警方式,确保管理员可以随时随地掌握系统的运行情况。
1.温湿度监控:通过采集温湿度传感器所监测到的温度和湿度数据,机房环控系统以直观的画面实时记录和显示机房各区域的温湿度数据及变化曲线,以及超限报警信息处理。
2.漏水监测系统:对机房空调或者窗户等处可能漏水的地方进行监测,通过采集漏水控制器和漏水检测感应绳的信号,一旦发生报警,可以定位检测具体的漏水系统,将报警信息发送到相关管理人员。
3.消防系统监控:通过采集消防控制器或烟感探测器、温感探测器的报警信号实时监测火灾警状态,当有火警发生,以直观的画面显示报警信息并作报警通知,采取控制措施如开门开通风设备,启停其他相关设备。
4.机房专用精密空调:根据精密空调厂家提供的通讯协议和通讯接口,实时监测精密空调的工作状态和运行参数,并对各种报警状态进行实时的记录和报警处理。
5.普通空调:通过安装外接型的空调远程红外控制器,根据温度变化控制空调启停,远程开关机等操作。