略微懂点云计算的人都知道三个概念:IaaS「Infrastructure as a Service」、PaaS「Platform-as-a-Service」和SaaS「Software-as-a-service」,当中 IaaS 就是我们常说的基础设施服务。
简单而言,IaaS 提供了云计算基础架构。包含server、存储、网络和操作系统。它作为一种按需服务,使得客户无需购买server、软件、数据库空间或网络设备,而仅仅要按需购买这些资源的外包服务就行了。可是购买了这些资源,并不意味着一劳永逸,这些资源能不能稳定、高效的工作?这事实上是一个新的挑战!
为什么须要监控基础设施?
众所周知,差点儿全部的应用程序通常都是执行在一个大型动态的环境上,它们依赖于成百上千台主机。
当然。这种方式非常有利于扩展。可以保证良好的用户体验。
可是,对运维和业务人员来说,这简直就是「噩梦」,那些传统的监控方式已经跟不上云时代的要求了。
首先,人类已经非常难从大规模海量的数据中识别出那些有问题的节点。其次,server本身也在不断的变化——依据企业的需求进行动态的拓展或者缩减,单个主机常常会出现响应问题;所以,区分出哪些server是否处于一个正常的状态并非一件非常easy的事情。那么。我们就须要一个现代化的监控平台:
第一,必须可以毫不费力地跟踪我们全部的server,并且可以在数据量激情的情况下保持稳定。
第二,必须可以分辨出那些可执行程序。尽可能少出现误报问题,还要避免「兴师动众」。反而忽略更重要的问题;
第三,必须可以收集足够多的信息,使我们可以高速诊断出问题发生的根本原因,当然。这也意味着我们的监控平台应该与关键技术相互配合;
第四,应该还能收集详尽的数据以供我们进行分析,并能保留长期的数据用于对未来趋势的预測;
第五,必须可以让我们监控到全部的主机状态,同一时候也能监測到特定属性的主机。
最后一点,这个作为我们「操作神经中枢」的监控平台,必须可以帮助我们的团队高效地发现潜在问题的信息,假设有一个可视化的仪表板那就更好了,这样就行有助于我们进行高速、明白的团队沟通。
现有的免费解决方式都有哪些?
当然。如今有非常多server端的监控软件。并且针对server的性能监控也是一个比較新的网络管理方向。
如今市面上有不少免费的工具,包含不少开源的产品如 Nagios 。Zabbix 等等,当然。另一些比較有技术底蕴的公司,像国内 APM 行业的领军企业 OneAPM 也推出了免费的server监控产品 OneAPM Servers。
Zabbix
Zabbix 是一个基于 WEB 界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方式。
能监视各种网络參数。保证server系统的安全运营;并提供灵活的通知机制以让系统管理员高速定位,解决存在的各种问题。
Zabbix 由两部分构成,Zabbix server 与可选组件 Zabbix agent,Zabbix server 可以通过 SNMP,Zabbix agent,ping,port监视等方法提供对远程server/网络状态的监视,数据收集等功能,它可以执行在 Linux、Solaris、HP-UX、AIX,Free BSD、Open BSD以及OS X 等平台上。
Zabbix 主要功能包含: CPU 负荷,内存使用,磁盘使用,网络状况,port监视,日志监视等等。
Nagios
Nagios 是一款开源的免费网络监视工具。能有效监控 Windows、Linux 和 Unix 的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知站点运维人员,在状态恢复后发出正常的邮件或短信通知。
Nagios 可以监控的功能包含:监控网络服务;监控主机资源;简单地插件设计使得用户可以方便地扩展自己服务的检測方法。并行服务检查机制;具备定义网络分层结构的能力。报警「通过 EMail、短信、用户定义方式」。定义一些处理程序。使之可以在服务或者主机发生问题时起到预防作用;自己主动的日志滚动功能;支持并实现对主机的冗余监控;可选的 WEB 界面用于查看当前的网络状态、通知和故障历史、日志文件等。
OneAPM Servers:全然免费的专业级server监控产品
OneAPM Servers 是一款商业级的server监控产品。对照开源产品来讲。在部署安装和学习成本上都占领压倒性的优势。更重要的是,该产品是面向全部用户的性能监控,承诺永久免费。所以刚推出不久就受到非常多的关注。
简易部署
假设,你想要使用server监控。仅仅须要完毕下面四个步骤:
特色功能
OneAPM Servers 通过观察、分析关键的系统參数,包含 CPU 利用率、物理内存、网络活动、进程、磁盘利用率及容量。展现当前server的健康状况。
OneAPM Servers 眼下包含四大功能:
- 总览:显示server的大体健康情况。
- 磁盘:展示每个磁盘的负载及空暇空间;
- 网络:查看一段时间内宽带「 Kb/s 」。每秒钟传输的包的数量。每秒钟错误率相关细节信息;
- 进程:展示被监測的server上各个系统和用户进程的执行情况。
如今。OneAPM 刚刚推出不久的 OneAPM Servers 产品可以对企业 IDC 和云计算中心内的基础组件进行实时的可视化管理。该套件为用户提供基础组件的集中监控、展现、预警、分析、管控的总体解决方式。
通过单一探针,实现对网络设备、主机、操作系统、中间件、数据库、存储等126 种产品的 5 万多项性能指标的集中监控和管理。